Esempi in Python per Dataset.documents

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: nalaf.structures.data

Classe/tipologia: Dataset

Metodo/funzione: documents

Esempi su hotexamples.com: 2

Dataset.documents in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per nalaf.structures.data.Dataset.documents, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Dataset(30)

extend_dataset(4)

tokens(3)

documents(2)

__repr__(1)

_cv_kfold_splits_doc_keys_sets(1)

Esempio n. 1

Mostra file

def find_number_of_documents():
    data = read_data(39, read_base=False)
    train, test = data.stratified_split()
    del data
    del train

    pipeline = get_prepare_pipeline_for_best_model()
    pipeline.execute(test)
    BIEOLabeler().label(test)
    PyCRFSuite().tag(test, 'idp4_model')
    PostProcessing().process(test)
    ExclusiveNLDefiner().define(test)

    keys = test.documents.keys()
    for test_size in range(30, 101, 10):
        sample = Dataset()
        random_keys = random.sample(keys, test_size)
        sample.documents = {key: test.documents[key] for key in random_keys}

        print('============== {} =============='.format(test_size))
        calculate_standard_error(sample)

Esempio n. 2

Mostra file

def calculate_standard_error(data):
    evaluator = MentionLevelEvaluator('overlapping', subclass_analysis=True)
    keys = data.documents.keys()
    subclasses = set(ann.subclass for ann in chain(data.annotations(), data.predicted_annotations()))

    sample_precision = {subclass: [] for subclass in subclasses}
    sample_recall = {subclass: [] for subclass in subclasses}
    sample_f_score = {subclass: [] for subclass in subclasses}

    for i in range(1000):
        sample = Dataset()
        random_keys = random.sample(keys, round(len(keys) * 0.15))
        sample.documents = {key: data.documents[key] for key in random_keys}

        subclass_measures, measures = evaluator.evaluate(sample)

        for subclass in subclass_measures.keys():
            subclass_results = subclass_measures[subclass]
            sample_precision[subclass].append(subclass_results[-3])
            sample_recall[subclass].append(subclass_results[-2])
            sample_f_score[subclass].append(subclass_results[-1])

    subclass_measures, measures = evaluator.evaluate(data)
    for subclass in subclass_measures.keys():
        subclass_results = subclass_measures[subclass]
        mean_precision = subclass_results[-3]
        mean_recall = subclass_results[-2]
        mean_f_score = subclass_results[-1]

        p = calc_std(mean_precision, sample_precision[subclass])
        r = calc_std(mean_recall, sample_recall[subclass])
        f = calc_std(mean_f_score, sample_f_score[subclass])

        print('subclass:{} {:.4f}+-{:.4f} {:.4f}+-{:.4f} {:.4f}+-{:.4f}'.format(
            subclass, mean_precision, p, mean_recall, r, mean_f_score, f
        ))