Python convert_to_unicodeの例

プログラミング言語: Python

名前空間/パッケージ名: tokenization_word

メソッド/関数: convert_to_unicode

hotexamples.comのコード掲載数: 9

Python convert_to_unicode - 9件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのtokenization_word.convert_to_unicodeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: zhouleidcc/bert-Chinese-classification-task

 def _create_examples(self, lines, set_type):
     """Creates examples for the training and dev sets."""
     examples = []
     for (i, line) in enumerate(lines):
         guid = "%s-%s" % (set_type, i)
         text_a = tokenization.convert_to_unicode(line[3])
         label = tokenization.convert_to_unicode(line[1])
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
     return examples

コード例 #2

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: jztddlq/CodeShare

 def _create_examples(self, lines, set_type):
     """Creates examples for the training and dev sets."""
     examples = []
     for (i, line) in enumerate(lines):
         guid = "%s-%s" % (set_type, i)
         text_a = tokenization.convert_to_unicode(line[3])
         label = tokenization.convert_to_unicode(line[1])
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=None, label=label))
     return examples

コード例 #3

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: jztddlq/CodeShare

 def _create_examples(self, lines, set_type):
     """Creates examples for the training and dev sets."""
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "%s-%s" % (set_type, tokenization.convert_to_unicode(line[0]))
         text_a = tokenization.convert_to_unicode(line[8])
         text_b = tokenization.convert_to_unicode(line[9])
         label = tokenization.convert_to_unicode(line[-1])
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
     return examples

コード例 #4

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: zhouleidcc/bert-Chinese-classification-task

 def _create_examples(self, lines, set_type):
     """Creates examples for the training and dev sets."""
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "%s-%s" % (set_type, tokenization.convert_to_unicode(line[0]))
         text_a = tokenization.convert_to_unicode(line[8])
         text_b = tokenization.convert_to_unicode(line[9])
         label = tokenization.convert_to_unicode(line[-1])
         examples.append(
             InputExample(guid=guid, text_a=text_a, text_b=text_b, label=label))
     return examples

コード例 #5

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: cnethanchang/NLP_DeepLearning

    def _create_examples(self, lines, set_type):
        """Creates examples for the training and dev sets."""
        examples = []
        # one line meaning one line for original file
        for (i, line) in enumerate(lines):
            # line:        <class 'list'>: ['game', '5000万,投资游戏该有多好!【游戏智库每周游报】 休息两相关部门人士求..........']
            guid = "%s-%s" % (set_type, i)  # train-0
            text_a = tokenization.convert_to_unicode(line[1])  # train-05000万,投资游戏该有多好!【游戏智库每周游报】 休息两天-------->unicode
            label = tokenization.convert_to_unicode(line[0])  # game
            self.labels.add(label)
            examples.append(InputExample(guid=guid, text_a=text_a, text_b=None, label=label))

        return examples

コード例 #6

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: maxliaops/review_analysis

 def _create_examples(self, lines, set_type):
     """Creates examples for the training and dev sets."""
     examples = []
     for (i, line) in enumerate(lines):
         # Only the test set has a header
         if i == 0:
             continue
         guid = "%s-%s" % (set_type, i)
         if set_type == "test":
             text_a = tokenization.convert_to_unicode(line[1])
             label = "0"
         else:
             text_a = tokenization.convert_to_unicode(line[3])
             label = tokenization.convert_to_unicode(line[1])
         examples.append(
             InputExample(guid=guid,
                          text_a=text_a,
                          text_b=None,
                          label=label))
     return examples

コード例 #7

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: maxliaops/review_analysis

 def get_dev_examples(self, data_dir):
     """See base class."""
     lines = self._read_tsv(os.path.join(data_dir, "xnli.dev.tsv"))
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "dev-%d" % (i)
         language = tokenization.convert_to_unicode(line[0])
         if language != tokenization.convert_to_unicode(self.language):
             continue
         text_a = tokenization.convert_to_unicode(line[6])
         text_b = tokenization.convert_to_unicode(line[7])
         label = tokenization.convert_to_unicode(line[1])
         examples.append(
             InputExample(guid=guid,
                          text_a=text_a,
                          text_b=text_b,
                          label=label))
     return examples

コード例 #8

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: maxliaops/review_analysis

 def get_train_examples(self, data_dir):
     """See base class."""
     lines = self._read_tsv(
         os.path.join(data_dir, "multinli",
                      "multinli.train.%s.tsv" % self.language))
     examples = []
     for (i, line) in enumerate(lines):
         if i == 0:
             continue
         guid = "train-%d" % (i)
         text_a = tokenization.convert_to_unicode(line[0])
         text_b = tokenization.convert_to_unicode(line[1])
         label = tokenization.convert_to_unicode(line[2])
         if label == tokenization.convert_to_unicode("contradictory"):
             label = tokenization.convert_to_unicode("contradiction")
         examples.append(
             InputExample(guid=guid,
                          text_a=text_a,
                          text_b=text_b,
                          label=label))
     return examples

コード例 #9

ファイルを表示

ファイル: run_classifier_word.py プロジェクト: ckyken/Bert-Pytorch-Chinese-TextClassification

    def _create_examples(self, df: pd.DataFrame, set_type: str):
        """Creates examples for the training and dev sets."""
        examples = []
        for i, row in df.iterrows():
            if set_type == 'test':
                guid = row['id']
            else:
                guid = row['ID']

            text_a = tokenization.convert_to_unicode(row['title'])
            if pd.isna(row['keyword']):
                text_b = ''
            else:
                text_b = tokenization.convert_to_unicode(row['keyword'])
            if set_type == 'test':
                label = None
            else:
                label = tokenization.convert_to_unicode(str(row['label']))
            examples.append(
                InputExample(guid=guid,
                             text_a=text_a,
                             text_b=text_b,
                             label=label))
        return examples