Python LanguageModelTokenizer.process Exemples

Langage de programmation: Python

Espace de nommage/Pack: rasa.nlu.tokenizers.lm_tokenizer

Méthode/Fonction: process

Exemples au hotexamples.com: 2

Python LanguageModelTokenizer.process - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de rasa.nlu.tokenizers.lm_tokenizer.LanguageModelTokenizer.process extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

LanguageModelTokenizer(7)

process(2)

tokenize(2)

train(2)

Méthodes fréquemment utilisées

LanguageModelTokenizer (7)

process (2)

tokenize (2)

train (2)

Exemple #1

0

Afficher le fichier

Fichier : test_lm_featurizer.py Projet : sorumehta/rasa-server

def test_preserve_sentence_and_sequence_features_old_config(): attribute = "text" message = Message.build("hi there") transformers_nlp = HFTransformersNLP({ "model_name": "bert", "model_weights": "bert-base-uncased" }) transformers_nlp.process(message) lm_tokenizer = LanguageModelTokenizer() lm_tokenizer.process(message) lm_featurizer = LanguageModelFeaturizer({"model_name": "gpt2"}) lm_featurizer.process(message) message.set(LANGUAGE_MODEL_DOCS[attribute], None) lm_docs = lm_featurizer._get_docs_for_batch([message], attribute=attribute, inference_mode=True)[0] hf_docs = transformers_nlp._get_docs_for_batch([message], attribute=attribute, inference_mode=True)[0] assert not (message.features[0].features == lm_docs[SEQUENCE_FEATURES]).any() assert not (message.features[1].features == lm_docs[SENTENCE_FEATURES]).any() assert (message.features[0].features == hf_docs[SEQUENCE_FEATURES]).all() assert (message.features[1].features == hf_docs[SENTENCE_FEATURES]).all()

Exemple #2

0

Afficher le fichier

Fichier : test_lm_featurizer.py Projet : suryatmodulus/rasa

def test_log_deprecation_warning_with_old_config(caplog: LogCaptureFixture): message = Message.build("hi there") transformers_nlp = HFTransformersNLP( {"model_name": "bert", "model_weights": "bert-base-uncased"} ) transformers_nlp.process(message) caplog.set_level(logging.DEBUG) lm_tokenizer = LanguageModelTokenizer() lm_tokenizer.process(message) lm_featurizer = LanguageModelFeaturizer(skip_model_load=True) caplog.clear() with caplog.at_level(logging.DEBUG): lm_featurizer.process(message) assert "deprecated component HFTransformersNLP" in caplog.text