Python text2text_txt_tab_iteratorの例

プログラミング言語: Python

名前空間/パッケージ名: tensor2tensor.data_generators.text_problems

メソッド/関数: text2text_txt_tab_iterator

hotexamples.comのコード掲載数: 6

Python text2text_txt_tab_iterator - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのtensor2tensor.data_generators.text_problems.text2text_txt_tab_iteratorの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

def tabbed_parsing_character_generator(tmp_dir, train):
  """Generate source and target data from a single file."""
  character_vocab = text_encoder.ByteTextEncoder()
  filename = "parsing_{0}.pairs".format("train" if train else "dev")
  pair_filepath = os.path.join(tmp_dir, filename)
  return text_problems.text2text_generate_encoded(
      text_problems.text2text_txt_tab_iterator(pair_filepath), character_vocab)

コード例 #2

ファイルを表示

ファイル: ice_parsing.py プロジェクト: chqiwang/tensor2tensor

def tabbed_parsing_character_generator(tmp_dir, train):
  """Generate source and target data from a single file."""
  character_vocab = text_encoder.ByteTextEncoder()
  filename = "parsing_{0}.pairs".format("train" if train else "dev")
  pair_filepath = os.path.join(tmp_dir, filename)
  return text_problems.text2text_generate_encoded(
      text_problems.text2text_txt_tab_iterator(pair_filepath), character_vocab)

コード例 #3

ファイルを表示

 def testText2TextTxtTabIterator(self):
   inputs = []
   targets = []
   for entry in text_problems.text2text_txt_tab_iterator(self.tabbed_file):
     inputs.append(entry["inputs"])
     targets.append(entry["targets"])
   self.assertEqual(inputs, self.inputs)
   self.assertEqual(targets, self.targets)

コード例 #4

ファイルを表示

def tabbed_parsing_token_generator(data_dir, tmp_dir, train, prefix,
                                   source_vocab_size, target_vocab_size):
  """Generate source and target data from a single file."""
  filename = "parsing_{0}.pairs".format("train" if train else "dev")
  source_vocab = generator_utils.get_or_generate_tabbed_vocab(
      data_dir, tmp_dir, filename, 0,
      prefix + "_source.tokens.vocab.%d" % source_vocab_size, source_vocab_size)
  target_vocab = generator_utils.get_or_generate_tabbed_vocab(
      data_dir, tmp_dir, filename, 1,
      prefix + "_target.tokens.vocab.%d" % target_vocab_size, target_vocab_size)
  pair_filepath = os.path.join(tmp_dir, filename)
  return text_problems.text2text_generate_encoded(
      text_problems.text2text_txt_tab_iterator(pair_filepath), source_vocab,
      target_vocab)

コード例 #5

ファイルを表示

ファイル: ice_parsing.py プロジェクト: chqiwang/tensor2tensor

def tabbed_parsing_token_generator(data_dir, tmp_dir, train, prefix,
                                   source_vocab_size, target_vocab_size):
  """Generate source and target data from a single file."""
  filename = "parsing_{0}.pairs".format("train" if train else "dev")
  source_vocab = generator_utils.get_or_generate_tabbed_vocab(
      data_dir, tmp_dir, filename, 0,
      prefix + "_source.tokens.vocab.%d" % source_vocab_size, source_vocab_size)
  target_vocab = generator_utils.get_or_generate_tabbed_vocab(
      data_dir, tmp_dir, filename, 1,
      prefix + "_target.tokens.vocab.%d" % target_vocab_size, target_vocab_size)
  pair_filepath = os.path.join(tmp_dir, filename)
  return text_problems.text2text_generate_encoded(
      text_problems.text2text_txt_tab_iterator(pair_filepath), source_vocab,
      target_vocab)

コード例 #6

ファイルを表示

ファイル: translate.py プロジェクト: taylr/tensor2tensor

 def generate_samples(self, data_dir, tmp_dir, dataset_split):
   data_path = self.source_data_files(dataset_split)[0]
   return text_problems.text2text_txt_tab_iterator(data_path)