Python create_samples_squad示例

编程语言: Python

命名空间/包名称: farm.data_handler.samples

方法/功能: create_samples_squad

hotexamples.com的示例: 3

Python create_samples_squad - 已找到3个示例。这些是从开源项目中提取的最受好评的farm.data_handler.samples.create_samples_squad现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： processor.py 项目： svmihar/FARM

 def _dict_to_samples(self, dictionary: dict, **kwargs) -> [Sample]:
     n_special_tokens = self.tokenizer.num_added_tokens(pair=True)
     samples = create_samples_squad(dictionary=dictionary,
                                    max_query_len=self.max_query_length,
                                    max_seq_len=self.max_seq_len,
                                    doc_stride=self.doc_stride,
                                    n_special_tokens=n_special_tokens)
     return samples

示例#2

显示文件

文件： processor.py 项目： jinnerbichler/FARM

    def _dict_to_samples(self, dictionary: dict, **kwargs) -> [Sample]:
        if "paragraphs" not in dictionary:  # TODO change this inference mode hack
            dictionary = self._convert_rest_api_dict(infer_dict=dictionary)
        samples = create_samples_squad(entry=dictionary)
        for sample in samples:
            tokenized = tokenize_with_metadata(text=" ".join(
                sample.clear_text["doc_tokens"]),
                                               tokenizer=self.tokenizer)
            sample.tokenized = tokenized

        return samples

示例#3

显示文件

    def _dict_to_samples(cls, dict: dict, **kwargs) -> [Sample]:
        # TODO split samples that are too long in this function, related to todo in self._sample_to_features
        if "paragraphs" not in dict:  # TODO change this inference mode hack
            dict = cls._convert_inference(infer_dict=dict)
        samples = create_samples_squad(entry=dict)
        for sample in samples:
            tokenized = tokenize_with_metadata(
                text=" ".join(sample.clear_text["doc_tokens"]),
                tokenizer=cls.tokenizer,
                max_seq_len=cls.max_seq_len,
            )
            sample.tokenized = tokenized

        return samples