Python convert_to_unicode 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: improv.tokenization

메소드/함수: convert_to_unicode

hotexamples.com에서의 예제들: 6

Python convert_to_unicode - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 improv.tokenization.convert_to_unicode에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def _create_example(self, lines, set_type):
     examples = []
     for i, line in enumerate(lines):
         guid = "%s-%s" % (set_type, i)
         text = tokenization.convert_to_unicode(line[1])
         label = tokenization.convert_to_unicode(line[0])
         examples.append(InputExample(guid=guid, text=text, label=label))
     return examples

예제 #2

파일 보기

파일: my_estimator.py 프로젝트: akshayjh/improv

def get_examples(filename: Path, set_type: SetType) -> List:
    if set_type == SetType.train:
        messages = get_filtered_messages(filename, training=True)
    else:
        tf.logging.warning(
            'There currently is no difference between dev and test set.')
        messages = get_filtered_messages(filename, training=False)
    examples = []
    for (i, message) in enumerate(messages):
        guid = "%s-%s" % (str(set_type.name), i)
        text_a = convert_to_unicode(message.text)
        label = convert_to_unicode(message.data['intent'])
        examples.append(
            InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
    return examples

예제 #3

파일 보기

파일: run_classifier.py 프로젝트: akshayjh/improv

 def _create_examples(self, lines, set_type):
     """Creates examples for the training and dev sets."""
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "%s-%s" % (set_type, i)
         text_a = tokenization.convert_to_unicode(line[3])
         text_b = tokenization.convert_to_unicode(line[4])
         if set_type == "test":
             label = "0"
         else:
             label = tokenization.convert_to_unicode(line[0])
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
     return examples

예제 #4

파일 보기

파일: run_classifier.py 프로젝트: akshayjh/improv

 def get_dev_examples(self, data_dir):
     """See base class."""
     lines = self._read_tsv(os.path.join(data_dir, "xnli.dev.tsv"))
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "dev-%d" % (i)
         language = tokenization.convert_to_unicode(line[0])
         if language != tokenization.convert_to_unicode(self.language):
             continue
         text_a = tokenization.convert_to_unicode(line[6])
         text_b = tokenization.convert_to_unicode(line[7])
         label = tokenization.convert_to_unicode(line[1])
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
     return examples

예제 #5

파일 보기

파일: run_classifier.py 프로젝트: akshayjh/improv

 def get_train_examples(self, data_dir):
     """See base class."""
     lines = self._read_tsv(
         os.path.join(data_dir, "multinli",
                      "multinli.train.%s.tsv" % self.language))
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "train-%d" % (i)
         text_a = tokenization.convert_to_unicode(line[0])
         text_b = tokenization.convert_to_unicode(line[1])
         label = tokenization.convert_to_unicode(line[2])
         if label == tokenization.convert_to_unicode("contradictory"):
             label = tokenization.convert_to_unicode("contradiction")
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
     return examples

예제 #6

파일 보기

파일: run_classifier.py 프로젝트: akshayjh/improv

    def _create_examples(self, lines, set_type):
        """Creates examples for the training and dev sets."""
        examples = []
        for (i, line) in enumerate(lines):
            # Skip header in test set
            if set_type == "test" and i == 0:
                continue

            guid = "%s-%s" % (set_type, i)  # example: test-1
            if set_type == "test":
                text_a = tokenization.convert_to_unicode(line[1])
                label = "0"
            else:
                text_a = tokenization.convert_to_unicode(line[3])
                label = tokenization.convert_to_unicode(line[1])
            examples.append(
                InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
        return examples