Python Bunch.entities Examples

Programming Language: Python

Namespace/Package Name: sklearn.datasets.base

Class/Type: Bunch

Method/Function: entities

Examples at hotexamples.com: 2

Python Bunch.entities - 2 examples found. These are the top rated real world Python examples of sklearn.datasets.base.Bunch.entities extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Bunch(30)

data(22)

label(6)

remaining(5)

predicted(5)

sentence(3)

oracle(3)

contents(3)

fixk(3)

labels(3)

X(2)

entities(2)

keys(2)

kwords(2)

filenames(2)

text(2)

meta(2)

lable(1)

masker(1)

hyperparams(1)

offset(1)

groups(1)

mask(1)

fig(1)

func(1)

condition_mask(1)

accu(1)

ax(1)

bow(1)

category_labels(1)

clfreg(1)

cmap(1)

content(1)

feature_names(1)

contents_seq(1)

contents_seq_pad(1)

coordinate_names(1)

coordinates(1)

data_fn(1)

data_test(1)

description(1)

zmaps(1)

Example #1

Show file

File: adr_classification.py Project: pdsujnow/adr_classification

def classifier_for_twitter_corpus():
    svc = LogisticRegression(class_weight='auto', penalty='l2')
    f_measure = []
    entities = []
    predicted = []
    right = []
    train_data = Bunch()
    test_data = Bunch()
    try:
        for i in range(1, 6):
            f_train = open("input/twitter_corpus/" + str(i) + "/train.txt")
            f_test = open("input/twitter_corpus/" + str(i) + "/test.txt")
            train_data.reviews = load_data(f_train)
            test_data.reviews = load_data(f_test)
            train_data.labels = extract_labels(train_data.reviews)
            test_data.labels = extract_labels(test_data.reviews)
            train_data.entities = extract_entities(train_data.reviews)
            features_train = extract_features_for_twitter_corpus(
                train_data.reviews, True)
            svc.fit(numpy.array(features_train),
                    numpy.array(train_data.labels))
            features_test = extract_features_for_twitter_corpus(
                test_data.reviews, False)
            predicted_block = svc.predict(numpy.array(features_test))
            predicted.extend(predicted_block)
            right.extend(test_data.labels)

            print metrics.f1_score(test_data.labels,
                                   predicted_block,
                                   average='macro')
            f_measure.append(
                metrics.f1_score(test_data.labels,
                                 predicted_block,
                                 average='macro'))

            entities.extend(test_data.reviews)

        print str(f_measure)
        print classification_report(right, predicted, digits=3)
        print metrics.precision_score(right, predicted, average='macro')
        print metrics.recall_score(right, predicted, average='macro')
        print metrics.f1_score(right, predicted, average='macro')
    except FileNotFoundError:
        print "Please download Twitter corpus and put it into input/twitter_corpus folder"

Example #2

Show file

File: adr_classification.py Project: pdsujnow/adr_classification

def classifier_for_cadec_corpus():
    svc = LinearSVC(class_weight='auto', penalty='l2')
    f_measure = []
    entities = []
    predicted = []
    right = []
    train_data = Bunch()
    test_data = Bunch()
    for i in range(1, 6):
        print i
        f_train = open("input/cadec_corpus/" + str(i) + "/train.txt")
        f_test = open("input/cadec_corpus/" + str(i) + "/test.txt")
        train_data.reviews = load_data(f_train)
        test_data.reviews = load_data(f_test)
        train_data.labels = extract_labels(train_data.reviews)
        test_data.labels = extract_labels(test_data.reviews)
        train_data.entities = extract_entities(train_data.reviews)
        features_train = extract_features_for_cadec_corpus(
            train_data.reviews, True)
        svc.fit(numpy.array(features_train), numpy.array(train_data.labels))
        features_test = extract_features_for_cadec_corpus(
            test_data.reviews, False)
        predicted_block = svc.predict(numpy.array(features_test))
        predicted.extend(predicted_block)
        right.extend(test_data.labels)

        print metrics.f1_score(test_data.labels,
                               predicted_block,
                               average='macro')
        f_measure.append(
            metrics.f1_score(test_data.labels,
                             predicted_block,
                             average='macro'))

        entities.extend(test_data.reviews)

    print str(f_measure)
    print classification_report(right, predicted, digits=3)
    print metrics.precision_score(right, predicted, average='macro')
    print metrics.recall_score(right, predicted, average='macro')
    print metrics.f1_score(right, predicted, average='macro')