Python Vocabの例

プログラミング言語: Python

名前空間/パッケージ名: feiertag.data.vocab

クラス/型: Vocab

hotexamples.comのコード掲載数: 14

Python Vocab - 14件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfeiertag.data.vocab.Vocabの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Vocab(14)

よく使われるメソッド

Vocab (14)

コード例 #1

ファイルを表示

 def __read_conllu_vocabs(file: Path, *args, **kwargs) -> Tuple[Vocab, Vocab]:
     word_vocab, tag_vocab = Vocab(), Vocab()
     with open(file, **kwargs) as f:
         for line in f:
             if not line.strip() or line.strip().startswith("#"):
                 continue
             tok = CoNLLUToken(*line.strip().split("\t"))
             word_vocab += tok.form
             tag_vocab += tok.upos
     return word_vocab, tag_vocab

コード例 #2

ファイルを表示

ファイル: test_conll2003_dataset.py プロジェクト: erip/feiertag

def test_unknown_token_in_example_yields_unk_udposdataset():
    word_vocab = Vocab()
    tag_vocab = Vocab()
    form = "Pierre"
    entity_tag = "B-PER"
    assert form not in word_vocab
    tag_vocab += entity_tag
    examples = [CoNLL2003Example([CoNLL2003Token(form, "", "", entity_tag)])]
    ds = CoNLL2003NERDataset(examples, word_vocab, tag_vocab)
    (token_vector, tag_vector) = ds[0]
    assert word_vocab.unk_index in token_vector
    assert tag_vocab.unk_index not in tag_vector

コード例 #3

ファイルを表示

ファイル: test_conll2003_dataset.py プロジェクト: erip/feiertag

def test_unknown_token_and_tag_in_example_yields_unk():
    word_vocab = Vocab()
    tag_vocab = Vocab()
    form = "Pierre"
    entity_tag = "B-PER"
    assert form not in word_vocab
    assert entity_tag not in tag_vocab
    examples = [CoNLL2003Example([CoNLL2003Token(form, "", "", entity_tag)])]
    ds = CoNLL2003Dataset(examples, word_vocab, tag_vocab, lambda t: t.entity_tag)
    (token_vector, tag_vector) = ds[0]
    assert word_vocab.unk_index in token_vector
    assert tag_vocab.unk_index in tag_vector

コード例 #4

ファイルを表示

def test_uddataset_from_file(tmp_path, example_dataset, cls, func):
    file = tmp_path / "tmp.txt"
    word_vocab, tag_vocab = Vocab(), Vocab()

    with open(file, "w", encoding="utf-8") as f:
        f.write(example_dataset)

    if func:
        ds = cls.from_file(file, word_vocab, tag_vocab, func, encoding="utf-8")
    else:
        ds = cls.from_file(file, word_vocab, tag_vocab, encoding="utf-8")

    assert len(ds) == 2

コード例 #5

ファイルを表示

def test_unknown_token_and_tag_in_example_yields_unk():
    word_vocab = Vocab()
    tag_vocab = Vocab()
    form = "Pierre"
    pos = "NNP"
    assert form not in word_vocab
    assert pos not in tag_vocab
    examples = [
        CoNLLUExample([CoNLLUToken(1, form, "", pos, "", "", 0, "", "", "")])
    ]
    ds = UDDataset(examples, word_vocab, tag_vocab, lambda t: t.upos)
    (token_vector, tag_vector) = ds[0]
    assert word_vocab.unk_index in token_vector
    assert tag_vocab.unk_index in tag_vector

コード例 #6

ファイルを表示

def test_unknown_token_in_example_yields_unk_udposdataset():
    word_vocab = Vocab()
    tag_vocab = Vocab()
    form = "Pierre"
    pos = "NNP"
    assert form not in word_vocab
    tag_vocab += pos
    examples = [
        CoNLLUExample([CoNLLUToken(1, form, "", pos, "", "", 0, "", "", "")])
    ]
    ds = UDUPOSDataset(examples, word_vocab, tag_vocab)
    (token_vector, tag_vector) = ds[0]
    assert word_vocab.unk_index in token_vector
    assert tag_vocab.unk_index not in tag_vector

コード例 #7

ファイルを表示

def tag_vocab():
    vocab = Vocab()
    vocab += "ODD"
    vocab += "EVEN"
    return vocab

コード例 #8

ファイルを表示

def word_vocab():
    vocab = Vocab()
    for i in range(11):
        vocab += str(i)
    return vocab

コード例 #9

ファイルを表示

def test_uddataset_len_is_len_examples(examples):
    word_vocab = Vocab()
    tag_vocab = Vocab()
    ds = UDDataset(examples, word_vocab, tag_vocab, lambda t: t.upos)
    assert len(ds) == len(ds)

コード例 #10

ファイルを表示

ファイル: test_feiertag_model.py プロジェクト: erip/feiertag

def tag_vocab():
    tag_vocab_ = Vocab()
    tag_vocab_ += "EVEN"
    tag_vocab_ += "ODD"
    return tag_vocab_

コード例 #11

ファイルを表示

ファイル: test_feiertag_model.py プロジェクト: erip/feiertag

def word_vocab():
    word_vocab_ = Vocab()
    for i in range(11):
        word_vocab_ += str(i)
    return word_vocab_

コード例 #12

ファイルを表示

ファイル: test_conll2003_dataset.py プロジェクト: erip/feiertag

def test_uddataset_len_is_len_examples(examples):
    word_vocab = Vocab()
    tag_vocab = Vocab()
    ds = CoNLL2003NERDataset(examples, word_vocab, tag_vocab, lambda t: t.entity_tag)
    assert len(ds) == len(ds)

コード例 #13

ファイルを表示

ファイル: test_embeddings.py プロジェクト: erip/feiertag

def nonempty_vocab(example_embedding):
    vocab = Vocab()
    vocab += example_embedding[0].split()[0]
    return vocab

コード例 #14

ファイルを表示

ファイル: test_embeddings.py プロジェクト: erip/feiertag

def empty_vocab(example_embedding):
    return Vocab()