Python Corpus._get_class_to_count 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: flair.data

클래스/타입: Corpus

메소드/함수: _get_class_to_count

hotexamples.com에서의 예제들: 3

Python Corpus._get_class_to_count - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 flair.data.Corpus._get_class_to_count에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Corpus(30)

make_label_dictionary(9)

make_tag_dictionary(7)

get_all_sentences(4)

_get_class_to_count(3)

_get_tokens_per_sentence(3)

_get_tag_to_count(2)

_count_sentence_labels(1)

_count_token_labels(1)

_obtain_statistics_for(1)

downsample(1)

make_vocab_dictionary(1)

예제 #1

파일 보기

def test_tagged_corpus_statistics_multi_label():
    train_sentence = Sentence("I love Berlin.",
                              labels=["class_1"],
                              use_tokenizer=segtok_tokenizer)
    dev_sentence = Sentence("The sun is shining.",
                            labels=["class_2"],
                            use_tokenizer=segtok_tokenizer)
    test_sentence = Sentence(
        "Berlin is sunny.",
        labels=["class_1", "class_2"],
        use_tokenizer=segtok_tokenizer,
    )

    class_to_count_dict = Corpus._get_class_to_count(
        [train_sentence, dev_sentence, test_sentence])

    assert "class_1" in class_to_count_dict
    assert "class_2" in class_to_count_dict
    assert 2 == class_to_count_dict["class_1"]
    assert 2 == class_to_count_dict["class_2"]

    tokens_in_sentences = Corpus._get_tokens_per_sentence(
        [train_sentence, dev_sentence, test_sentence])

    assert 3 == len(tokens_in_sentences)
    assert 4 == tokens_in_sentences[0]
    assert 5 == tokens_in_sentences[1]
    assert 4 == tokens_in_sentences[2]

예제 #2

파일 보기

파일: corpus_analysis.py 프로젝트: ajpar94/flair-extra

    def class_distribution(self,
                           multiclass: bool = False,
                           nr_classes: int = 10,
                           savefig_file=None,
                           **kwargs):
        class_count = Corpus._get_class_to_count(self.sentences)
        class_count = pd.DataFrame.from_dict(class_count,
                                             orient='index',
                                             columns=['count']).sort_values(
                                                 'count', ascending=False)
        html_table = class_count.to_html()

        # plot distribution
        class_count_top = class_count[:nr_classes].copy()
        if not multiclass:
            if nr_classes < len(class_count):
                class_count_top.loc['others'] = class_count[nr_classes:].sum()
            # pie plot class_count
            class_count_top.plot.pie(y='count', **kwargs)
            plt.legend(labels=class_count_top.index,
                       bbox_to_anchor=(1, 0, 0.1, 1),
                       loc='center right')
        else:
            class_count_top.plot.bar(y='count', **kwargs)
            plt.gca().yaxis.grid(True, linestyle='--')

        plt.tight_layout()
        if savefig_file:
            plt.savefig(self.path / savefig_file, dpi=600)
        plt.show()

예제 #3

파일 보기

파일: test_data.py 프로젝트: azawalich/flair

def test_tagged_corpus_statistics_multi_label():
    train_sentence = Sentence('I love Berlin.',
                              labels=['class_1'],
                              use_tokenizer=True)
    dev_sentence = Sentence('The sun is shining.',
                            labels=['class_2'],
                            use_tokenizer=True)
    test_sentence = Sentence('Berlin is sunny.',
                             labels=['class_1', 'class_2'],
                             use_tokenizer=True)
    class_to_count_dict = Corpus._get_class_to_count(
        [train_sentence, dev_sentence, test_sentence])
    assert ('class_1' in class_to_count_dict)
    assert ('class_2' in class_to_count_dict)
    assert (2 == class_to_count_dict['class_1'])
    assert (2 == class_to_count_dict['class_2'])
    tokens_in_sentences = Corpus._get_tokens_per_sentence(
        [train_sentence, dev_sentence, test_sentence])
    assert (3 == len(tokens_in_sentences))
    assert (4 == tokens_in_sentences[0])
    assert (5 == tokens_in_sentences[1])
    assert (4 == tokens_in_sentences[2])