Exemplos de SentencePieceTokenizer.ids_to_tokens em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: nemo.collections.common.tokenizers.sentencepiece_tokenizer

Método / Função: ids_to_tokens

Exemplos em hotexamples.com: 2

SentencePieceTokenizer.ids_to_tokens em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de nemo.collections.common.tokenizers.sentencepiece_tokenizer.SentencePieceTokenizer.ids_to_tokens em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

SentencePieceTokenizer(12)

text_to_tokens(7)

add_special_tokens(4)

text_to_ids(4)

token_to_id(3)

ids_to_text(2)

ids_to_tokens(2)

Métodos Frequentes

SentencePieceTokenizer (12)

text_to_tokens (7)

add_special_tokens (4)

text_to_ids (4)

token_to_id (3)

ids_to_text (2)

ids_to_tokens (2)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: test_spc_tokenizer.py Projeto: titu1994/NeMo

def test_ids_to_tokens(self, test_data_dir): tokenizer = SentencePieceTokenizer(test_data_dir + self.model_name) special_tokens = MODEL_SPECIAL_TOKENS tokenizer.add_special_tokens(special_tokens) text = "[CLS] a b c [MASK] e f [SEP] g h i [SEP]" tokens = tokenizer.text_to_tokens(text) ids = tokenizer.tokens_to_ids(tokens) result = tokenizer.ids_to_tokens(ids) assert len(result) == len(tokens) for i in range(len(result)): assert result[i] == tokens[i]

Exemplo n.º 2

0

Exibir arquivo

def test_ids_to_tokens(self, test_data_dir): tokenizer = SentencePieceTokenizer(test_data_dir + self.model_name) tokens = [ "<cls>", "a", "b", "c", "<sep>", "e", "f", "<sep>", "g", "h", "i", "</s>" ] ids = tokenizer.tokens_to_ids(tokens) result = tokenizer.ids_to_tokens(ids) assert len(result) == len(tokens) for i in range(len(result)): assert result[i] == tokens[i]