Esempi in Python per SentencePieceTokenizer.ids_to_tokens

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: nemo.collections.nlp.data

Classe/tipologia: SentencePieceTokenizer

Metodo/funzione: ids_to_tokens

Esempi su hotexamples.com: 2

SentencePieceTokenizer.ids_to_tokens in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per nemo.collections.nlp.data.SentencePieceTokenizer.ids_to_tokens, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

SentencePieceTokenizer(11)

add_special_tokens(8)

text_to_tokens(5)

text_to_ids(4)

tokens_to_ids(4)

ids_to_text(2)

ids_to_tokens(2)

token_to_id(1)

tokens_to_text(1)

Esempio n. 1

Mostra file

File: test_spc_tokenizer.py Progetto: joehoeller/NVIDIA-Rapids-NeMo-PyTorch-Tensorboard

    def test_ids_to_tokens(self):
        tokenizer = SentencePieceTokenizer("./tests/data/m_common.model")
        special_tokens = nemo_nlp.data.tokenizers.MODEL_SPECIAL_TOKENS['bert']
        tokenizer.add_special_tokens(special_tokens)

        text = "[CLS] a b c [MASK] e f [SEP] g h i [SEP]"
        tokens = tokenizer.text_to_tokens(text)
        ids = tokenizer.tokens_to_ids(tokens)
        result = tokenizer.ids_to_tokens(ids)

        self.assertTrue(len(result) == len(tokens))

        for i in range(len(result)):
            self.assertTrue(result[i] == tokens[i])

Esempio n. 2

Mostra file

File: test_spc_tokenizer.py Progetto: phymucs/NeMo

    def test_ids_to_tokens(self):
        tokenizer = SentencePieceTokenizer("./tests/data/m_common.model")

        special_tokens = ["[CLS]", "[MASK]", "[SEP]"]
        tokenizer.add_special_tokens(special_tokens)

        text = "[CLS] a b c [MASK] e f [SEP] g h i [SEP]"
        tokens = tokenizer.text_to_tokens(text)
        ids = tokenizer.tokens_to_ids(tokens)
        result = tokenizer.ids_to_tokens(ids)

        self.assertTrue(len(result) == len(tokens))

        for i in range(len(result)):
            self.assertTrue(result[i] == tokens[i])