Python TaggedCorpus._get_tag_to_count 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: flair.data

클래스/타입: TaggedCorpus

메소드/함수: _get_tag_to_count

hotexamples.com에서의 예제들: 2

Python TaggedCorpus._get_tag_to_count - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 flair.data.TaggedCorpus._get_tag_to_count에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

TaggedCorpus(26)

make_label_dictionary(4)

_get_tokens_per_sentence(3)

_get_class_to_count(2)

_get_tag_to_count(2)

get_all_sentences(2)

_get_classes_to_count(1)

downsample(1)

make_tag_dictionary(1)

make_vocab_dictionary(1)

예제 #1

파일 보기

파일: test_data.py 프로젝트: rkwojdan/flair35

def test_tagged_corpus_get_tag_statistic():
    train_sentence = Sentence(u'Zalando Research is located in Berlin .')
    train_sentence[0].add_tag(u'ner', u'B-ORG')
    train_sentence[1].add_tag(u'ner', u'E-ORG')
    train_sentence[5].add_tag(u'ner', u'S-LOC')
    dev_sentence = Sentence(
        u'Facebook, Inc. is a company, and Google is one as well.', use_tokenizer=True)
    dev_sentence[0].add_tag(u'ner', u'B-ORG')
    dev_sentence[1].add_tag(u'ner', u'I-ORG')
    dev_sentence[2].add_tag(u'ner', u'E-ORG')
    dev_sentence[8].add_tag(u'ner', u'S-ORG')
    test_sentence = Sentence(u'Nothing to do with companies.')
    tag_to_count_dict = TaggedCorpus._get_tag_to_count(
        [train_sentence, dev_sentence, test_sentence], u'ner')
    assert (1 == tag_to_count_dict[u'S-ORG'])
    assert (1 == tag_to_count_dict[u'S-LOC'])
    assert (2 == tag_to_count_dict[u'B-ORG'])
    assert (2 == tag_to_count_dict[u'E-ORG'])
    assert (1 == tag_to_count_dict[u'I-ORG'])

예제 #2

파일 보기

파일: test_data.py 프로젝트: bluesea0/ditk

def test_tagged_corpus_get_tag_statistic():
    train_sentence = Sentence("Zalando Research is located in Berlin .")
    train_sentence[0].add_tag("ner", "B-ORG")
    train_sentence[1].add_tag("ner", "E-ORG")
    train_sentence[5].add_tag("ner", "S-LOC")

    dev_sentence = Sentence(
        "Facebook, Inc. is a company, and Google is one as well.",
        use_tokenizer=True)
    dev_sentence[0].add_tag("ner", "B-ORG")
    dev_sentence[1].add_tag("ner", "I-ORG")
    dev_sentence[2].add_tag("ner", "E-ORG")
    dev_sentence[8].add_tag("ner", "S-ORG")

    test_sentence = Sentence("Nothing to do with companies.")

    tag_to_count_dict = TaggedCorpus._get_tag_to_count(
        [train_sentence, dev_sentence, test_sentence], "ner")

    assert 1 == tag_to_count_dict["S-ORG"]
    assert 1 == tag_to_count_dict["S-LOC"]
    assert 2 == tag_to_count_dict["B-ORG"]
    assert 2 == tag_to_count_dict["E-ORG"]
    assert 1 == tag_to_count_dict["I-ORG"]