Esempi in Python per LanguageModelTokenizer.train

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: rasa.nlu.tokenizers.lm_tokenizer

Classe/tipologia: LanguageModelTokenizer

Metodo/funzione: train

Esempi su hotexamples.com: 2

LanguageModelTokenizer.train in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per rasa.nlu.tokenizers.lm_tokenizer.LanguageModelTokenizer.train, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

LanguageModelTokenizer(7)

process(2)

tokenize(2)

train(2)

Esempio n. 1

Mostra file

File: test_lm_tokenizer.py Progetto: zylhub/rasa

def test_lm_tokenizer_number_of_sub_tokens(text, expected_number_of_sub_tokens):
    transformers_config = {"model_name": "bert"}  # Test for one should be enough

    transformers_nlp = HFTransformersNLP(transformers_config)
    lm_tokenizer = LanguageModelTokenizer()

    message = Message(text)

    td = TrainingData([message])

    transformers_nlp.train(td)
    lm_tokenizer.train(td)

    assert [
        t.get(NUMBER_OF_SUB_TOKENS) for t in message.get(TOKENS_NAMES[TEXT])[:-1]
    ] == expected_number_of_sub_tokens

Esempio n. 2

Mostra file

File: test_lm_tokenizer.py Progetto: zylhub/rasa

def test_lm_tokenizer_custom_intent_symbol(text, expected_tokens):
    component_config = {"intent_tokenization_flag": True, "intent_split_symbol": "+"}

    transformers_config = {"model_name": "bert"}  # Test for one should be enough

    transformers_nlp = HFTransformersNLP(transformers_config)
    lm_tokenizer = LanguageModelTokenizer(component_config)

    message = Message(text)
    message.set(INTENT, text)

    td = TrainingData([message])

    transformers_nlp.train(td)
    lm_tokenizer.train(td)

    assert [t.text for t in message.get(TOKENS_NAMES[INTENT])] == expected_tokens