Ejemplos de TaggedCorpus._get_tokens_per_sentence en Python

Lenguaje de programación: Python

Namespace/Package Name: flair.data

Clase / Tipo: TaggedCorpus

Método / Función: _get_tokens_per_sentence

Ejemplos en hotexamples.com: 3

Python TaggedCorpus._get_tokens_per_sentence - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de flair.data.TaggedCorpus._get_tokens_per_sentence extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

TaggedCorpus(26)

make_label_dictionary(4)

_get_tokens_per_sentence(3)

_get_class_to_count(2)

_get_tag_to_count(2)

get_all_sentences(2)

_get_classes_to_count(1)

downsample(1)

make_tag_dictionary(1)

make_vocab_dictionary(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_data.py Proyecto: bluesea0/ditk

def test_tagged_corpus_statistics_multi_label():
    train_sentence = Sentence("I love Berlin.",
                              labels=["class_1"],
                              use_tokenizer=True)
    dev_sentence = Sentence("The sun is shining.",
                            labels=["class_2"],
                            use_tokenizer=True)
    test_sentence = Sentence("Berlin is sunny.",
                             labels=["class_1", "class_2"],
                             use_tokenizer=True)

    class_to_count_dict = TaggedCorpus._get_class_to_count(
        [train_sentence, dev_sentence, test_sentence])

    assert "class_1" in class_to_count_dict
    assert "class_2" in class_to_count_dict
    assert 2 == class_to_count_dict["class_1"]
    assert 2 == class_to_count_dict["class_2"]

    tokens_in_sentences = TaggedCorpus._get_tokens_per_sentence(
        [train_sentence, dev_sentence, test_sentence])

    assert 3 == len(tokens_in_sentences)
    assert 4 == tokens_in_sentences[0]
    assert 5 == tokens_in_sentences[1]
    assert 4 == tokens_in_sentences[2]

Ejemplo n.º 2

Mostrar archivo

def test_tagged_corpus_statistics_multi_label():
    train_sentence = Sentence('I love Berlin.',
                              labels=['class_1'],
                              use_tokenizer='segtok')
    dev_sentence = Sentence('The sun is shining.',
                            labels=['class_2'],
                            use_tokenizer='segtok')
    test_sentence = Sentence('Berlin is sunny.',
                             labels=['class_1', 'class_2'],
                             use_tokenizer='segtok')

    class_to_count_dict = TaggedCorpus._get_classes_to_count(
        [train_sentence, dev_sentence, test_sentence])

    assert ('class_1' in class_to_count_dict)
    assert ('class_2' in class_to_count_dict)
    assert (2 == class_to_count_dict['class_1'])
    assert (2 == class_to_count_dict['class_2'])

    tokens_in_sentences = TaggedCorpus._get_tokens_per_sentence(
        [train_sentence, dev_sentence, test_sentence])

    assert (3 == len(tokens_in_sentences))
    assert (4 == tokens_in_sentences[0])
    assert (5 == tokens_in_sentences[1])
    assert (4 == tokens_in_sentences[2])

Ejemplo n.º 3

Mostrar archivo

Archivo: test_data.py Proyecto: rkwojdan/flair35

def test_tagged_corpus_statistics():
    train_sentence = Sentence(u'I love Berlin.', labels=[
                              Label(u'class_1')], use_tokenizer=True)
    dev_sentence = Sentence(u'The sun is shining.', labels=[
                            Label(u'class_2')], use_tokenizer=True)
    test_sentence = Sentence(u'Berlin is sunny.', labels=[
                             Label(u'class_1')], use_tokenizer=True)
    class_to_count_dict = TaggedCorpus._get_class_to_count(
        [train_sentence, dev_sentence, test_sentence])
    assert (u'class_1' in class_to_count_dict)
    assert (u'class_2' in class_to_count_dict)
    assert (2 == class_to_count_dict[u'class_1'])
    assert (1 == class_to_count_dict[u'class_2'])
    tokens_in_sentences = TaggedCorpus._get_tokens_per_sentence(
        [train_sentence, dev_sentence, test_sentence])
    assert (3 == len(tokens_in_sentences))
    assert (4 == tokens_in_sentences[0])
    assert (5 == tokens_in_sentences[1])
    assert (4 == tokens_in_sentences[2])