Python convert_to_unicode 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: retrograph.models.tokenization

메소드/함수: convert_to_unicode

hotexamples.com에서의 예제들: 7

Python convert_to_unicode - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 retrograph.models.tokenization.convert_to_unicode에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def _create_examples(self, dicts, set_type):
   """Creates examples for the training and dev sets."""
   examples = []
   for (i, dict) in enumerate(dicts):
     guid = "%s-%s" % (set_type, str(i))
     text_a = tokenization.convert_to_unicode(dict['X'])
     label = tokenization.convert_to_unicode(dict['y'])
     examples.append(
         InputExample(guid=guid, text_a=text_a, label=label))
   return examples

예제 #2

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def _create_examples(self, lines, set_type):
   """Creates examples for the training and dev sets."""
   examples = []
   for (i, line) in enumerate(lines):
     if i == 0:
       continue
     guid = "%s-%s" % (set_type, tokenization.convert_to_unicode(line[0]))
     text_a = tokenization.convert_to_unicode(line[1])
     text_b = tokenization.convert_to_unicode(line[2])
     if set_type == "test":
       label = "entailment"
     else:
       label = tokenization.convert_to_unicode(line[3])
     examples.append(
         InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
   return examples

예제 #3

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def _create_examples(self, lines, set_type):
   """Creates examples for the training and dev sets."""
   examples = []
   for (i, line) in enumerate(lines):
     if i == 0:
       continue
     guid = "%s-%s" % (set_type, tokenization.convert_to_unicode(line[0]))
     if set_type == 'test':
       text_a = tokenization.convert_to_unicode(line[-2])
       text_b = tokenization.convert_to_unicode(line[-1])
       label = 0.0
     else:
       text_a = tokenization.convert_to_unicode(line[-3])
       text_b = tokenization.convert_to_unicode(line[-2])
       label = float(line[-1])
     examples.append(InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
   return examples

예제 #4

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def _create_examples(self, lines, set_type):
   """Creates examples for the training and dev sets."""
   examples = []
   for (i, line) in enumerate(lines):
     # Only the test set has a header
     if set_type == "test" and i == 0:
       continue
     guid = "%s-%s" % (set_type, i)
     if set_type == "test":
       text_a = tokenization.convert_to_unicode(line[1])
       label = "0"
     else:
       text_a = tokenization.convert_to_unicode(line[3])
       label = tokenization.convert_to_unicode(line[1])
     examples.append(
         InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
   return examples

예제 #5

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def get_dev_examples(self, data_dir):
   """See base class."""
   lines = self._read_tsv(os.path.join(data_dir, "xnli.dev.tsv"))
   examples = []
   for (i, line) in enumerate(lines):
     if i == 0:
       continue
     guid = "dev-%d" % (i)
     language = tokenization.convert_to_unicode(line[0])
     if language != tokenization.convert_to_unicode(self.language):
       continue
     text_a = tokenization.convert_to_unicode(line[6])
     text_b = tokenization.convert_to_unicode(line[7])
     label = tokenization.convert_to_unicode(line[1])
     examples.append(
         InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
   return examples

예제 #6

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def get_train_examples(self, data_dir):
   """See base class."""
   lines = self._read_tsv(
       os.path.join(data_dir, "multinli",
                    "multinli.train.%s.tsv" % self.language))
   examples = []
   for (i, line) in enumerate(lines):
     if i == 0:
       continue
     guid = "train-%d" % (i)
     text_a = tokenization.convert_to_unicode(line[0])
     text_b = tokenization.convert_to_unicode(line[1])
     label = tokenization.convert_to_unicode(line[2])
     if label == tokenization.convert_to_unicode("contradictory"):
       label = tokenization.convert_to_unicode("contradiction")
     examples.append(
         InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
   return examples

예제 #7

0

파일 보기

파일: preprocessors.py 프로젝트: umanlp/Retrograph

 def _create_examples(self, lines, set_type):
   """Creates examples for the training and dev sets."""
   examples = []
   for (i, line) in enumerate(lines):
     if i == 0:
       continue
     guid = "%s-%s" % (set_type, tokenization.convert_to_unicode(line[0]))
     if set_type == "test":
       text_a = tokenization.convert_to_unicode(line[1])
       text_b = tokenization.convert_to_unicode(line[2])
       label = "0"
     else:
       if len(line) != 6:
         # there is a problematic line
         print(line)
         continue
       text_a = tokenization.convert_to_unicode(line[3])
       text_b = tokenization.convert_to_unicode(line[4])
       label = tokenization.convert_to_unicode(line[5])
     examples.append(
         InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
   return examples