Python ScriptBERTTensorizer.ScriptBERTTensorizer示例

编程语言: Python

命名空间/包名称: pytext.torchscript.tensorizer

方法/功能: ScriptBERTTensorizer

hotexamples.com的示例: 3

Python ScriptBERTTensorizer.ScriptBERTTensorizer - 已找到3个示例。这些是从开源项目中提取的最受好评的pytext.torchscript.tensorizer.ScriptBERTTensorizer.ScriptBERTTensorizer现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ScriptBERTTensorizer(3)

numberize(2)

示例#1

显示文件

文件： test_tensorizer.py 项目： nadileaf/pytext

    def test_bert_tensorizer(self):
        tokenizer, rand_tokens = self._mock_tokenizer()
        vocab = self._mock_vocab()

        bert = ScriptBERTTensorizer(tokenizer, vocab, max_seq_len=100)
        token_ids, _, _, _ = bert.numberize(["mock test"], None)
        self.assertEqual(token_ids[0], 201)
        self.assertEqual(token_ids[-1], 202)
        for token_id, token in zip(token_ids[1:-1], rand_tokens):
            self.assertEqual(token_id, int(token[0]) - 100)

示例#2

显示文件

 def torchscriptify(self):
     return ScriptBERTTensorizer(
         tokenizer=self.tokenizer.torchscriptify(),
         vocab=ScriptVocabulary(
             list(self.vocab),
             pad_idx=self.vocab.get_pad_index(),
             bos_idx=self.vocab.get_bos_index(),
             eos_idx=self.vocab.get_eos_index(),
         ),
         max_seq_len=self.max_seq_len,
     )

示例#3

显示文件

文件： test_tensorizer.py 项目： shadowkun/pytext

    def test_bert_tensorizer(self):
        tokenizer, rand_tokens = self._mock_tokenizer()
        vocab = self._mock_vocab()

        bert = ScriptBERTTensorizer(
            tokenizer,
            vocab,
            max_seq_len=100,
            add_bos_token=False,
            use_eos_token_for_bos=False,
        )
        token_ids, _, _ = bert.numberize("mock test")
        self.assertEqual(token_ids[-1], 202)
        for token_id, token in zip(token_ids[0:-1], rand_tokens):
            self.assertEqual(token_id, int(token[0]) - 100)