Python Tokenizer.eval_tokenizerの例

プログラミング言語: Python

クラス/型: Tokenizer

メソッド/関数: eval_tokenizer

hotexamples.comのコード掲載数: 1

Python Tokenizer.eval_tokenizer - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのTokenizer.eval_tokenizer パッケージから fastaiの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Tokenizer(30)

PeakToken(7)

Consume(5)

SimpleTokenizer(5)

peepahead(4)

BetterTokenizer(3)

ComplexTokenizer(3)

Tokenize(3)

HuTokenizer(2)

getNextToken(2)

queueData(2)

PasTokenizer(1)

LemmaTokenizer(1)

TokenCategorizer(1)

JanomeTokenizer(1)

Initialize(1)

advanceToken(1)

eval_tokenizer(1)

has_next(1)

lemmatizer(1)

stemmer(1)

tokenizeAdvanced(1)

コード例 #1

ファイルを表示

ファイル: midas_old.py プロジェクト: mikekestemont/Midas

def tag(test_items=[],
        WS="",
        tokenize=False,
        tokenizer_context=0,
        left_context=1,
        right_context=1,
        gazetteer=None,
        min_tok_freq=25,
        min_lem_freq=25,
        mode=""):
    """
    Tags a list of (potentially annotated) test tokens.
    """
    tokenized_tokens = []
    token_acc, token_f1 = None, None
    if tokenize:
        # load and apply a tokenizer:
        tokenizer = Tokenizer(context=tokenizer_context, WS=WS)
        if mode == "tag":
            tokenized_tokens = tokenizer.tokenize(test_items=test_items, gazetteer=gazetteer)    
        elif mode in ("test", "crossval"):
            items = []
            for item in test_items:
                if item == "<utt>":
                    items.append(item)
                else:
                    items.append(item[0].lower())
            token_acc, token_f1 = tokenizer.eval_tokenizer(test_items=items, gazetteer=gazetteer)
            # return the original tokens since we only tokenize for evaluation purposes:
            tokenized_tokens = items
    else:
        # assume the input has been properly tokenized already:
        if mode == "tag":
          tokenized_tokens = test_items
        elif mode == "test":
          tokenized_tokens = tuple(item[0].lower() for item in test_items)
    sequential_tagger = MaxentTagger(WS=WS, 
                                     left_context=left_context,
                                     right_context=right_context,
                                     min_tok_freq=min_tok_freq,
                                     min_lem_freq=min_lem_freq)
    sequential_tagger.load_models()
    tagged_items = sequential_tagger.tag(tokenized=tokenized_tokens, gazetteer=gazetteer)
    if mode in ("crossval", "test"):
        results = sequential_tagger.evaluate_tags_and_lemmas(gold_items=test_items,\
                                                             silver_items=tagged_items)
        if tokenize:
            results.extend((token_acc, token_f1))
        return results
    else:
        return tagged_items