Python RegexFeaturizer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rasa.nlu.featurizers.regex_featurizer

클래스/타입: RegexFeaturizer

hotexamples.com에서의 예제들: 3

Python RegexFeaturizer - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rasa.nlu.featurizers.regex_featurizer.RegexFeaturizer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

RegexFeaturizer(3)

features_for_patterns(2)

자주 사용되는 메소드들

RegexFeaturizer (3)

features_for_patterns (2)

예제 #1

파일 보기

파일: test_featurizers.py 프로젝트: zijiannc/RASA_NLU

def test_lookup_tables(sentence, expected, labeled_tokens, spacy_nlp):
    from rasa.nlu.featurizers.regex_featurizer import RegexFeaturizer

    lookups = [
        {
            "name":
            "drinks",
            "elements":
            ["mojito", "lemonade", "sweet berry wine", "tea", "club?mate"],
        },
        {
            "name": "plates",
            "elements": "data/test/lookup_tables/plates.txt"
        },
    ]
    ftr = RegexFeaturizer(lookup_tables=lookups)

    # adds tokens to the message
    tokenizer = SpacyTokenizer()
    message = Message(sentence)
    message.set("spacy_doc", spacy_nlp(sentence))
    tokenizer.process(message)

    result = ftr.features_for_patterns(message)
    assert np.allclose(result, expected, atol=1e-10)

    # the tokenizer should have added tokens
    assert len(message.get("tokens", [])) > 0
    # the number of regex matches on each token should match
    for i, token in enumerate(message.get("tokens")):
        token_matches = token.get("pattern").values()
        num_matches = sum(token_matches)
        assert num_matches == labeled_tokens.count(i)

예제 #2

파일 보기

파일: test_featurizers.py 프로젝트: wegamekinglc/rasa

def test_regex_featurizer(sentence, expected, labeled_tokens, spacy_nlp):
    from rasa.nlu.featurizers.regex_featurizer import RegexFeaturizer

    patterns = [
        {"pattern": "[0-9]+", "name": "number", "usage": "intent"},
        {"pattern": "\\bhey*", "name": "hello", "usage": "intent"},
        {"pattern": "[0-1]+", "name": "binary", "usage": "intent"},
    ]
    ftr = RegexFeaturizer(known_patterns=patterns)

    # adds tokens to the message
    tokenizer = SpacyTokenizer()
    message = Message(sentence)
    message.set("spacy_doc", spacy_nlp(sentence))
    tokenizer.process(message)

    result = ftr.features_for_patterns(message)
    assert np.allclose(result, expected, atol=1e-10)

    # the tokenizer should have added tokens
    assert len(message.get("tokens", [])) > 0
    # the number of regex matches on each token should match
    for i, token in enumerate(message.get("tokens")):
        token_matches = token.get("pattern").values()
        num_matches = sum(token_matches)
        assert num_matches == labeled_tokens.count(i)

예제 #3

파일 보기

파일: test_featurizers.py 프로젝트: suhaibmujahid/rasa

def test_lookup_table_deprecation():
    from rasa.nlu.featurizers.regex_featurizer import RegexFeaturizer

    lookups = [{
        "name":
        "drinks",
        "elements":
        ["mojito", "lemonade", "sweet berry wine", "tea", "club?mate"],
    }]

    with pytest.warns(FutureWarning):
        RegexFeaturizer(lookup_tables=lookups)