Python Bunch.entities 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sklearn.datasets.base

클래스/타입: Bunch

메소드/함수: entities

hotexamples.com에서의 예제들: 2

Python Bunch.entities - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sklearn.datasets.base.Bunch.entities에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Bunch(30)

data(22)

label(6)

remaining(5)

predicted(5)

sentence(3)

oracle(3)

contents(3)

fixk(3)

labels(3)

X(2)

entities(2)

keys(2)

kwords(2)

filenames(2)

text(2)

meta(2)

lable(1)

masker(1)

hyperparams(1)

offset(1)

groups(1)

mask(1)

fig(1)

func(1)

condition_mask(1)

accu(1)

ax(1)

bow(1)

category_labels(1)

clfreg(1)

cmap(1)

content(1)

feature_names(1)

contents_seq(1)

contents_seq_pad(1)

coordinate_names(1)

coordinates(1)

data_fn(1)

data_test(1)

description(1)

zmaps(1)

예제 #1

파일 보기

파일: adr_classification.py 프로젝트: pdsujnow/adr_classification

def classifier_for_twitter_corpus():
    svc = LogisticRegression(class_weight='auto', penalty='l2')
    f_measure = []
    entities = []
    predicted = []
    right = []
    train_data = Bunch()
    test_data = Bunch()
    try:
        for i in range(1, 6):
            f_train = open("input/twitter_corpus/" + str(i) + "/train.txt")
            f_test = open("input/twitter_corpus/" + str(i) + "/test.txt")
            train_data.reviews = load_data(f_train)
            test_data.reviews = load_data(f_test)
            train_data.labels = extract_labels(train_data.reviews)
            test_data.labels = extract_labels(test_data.reviews)
            train_data.entities = extract_entities(train_data.reviews)
            features_train = extract_features_for_twitter_corpus(
                train_data.reviews, True)
            svc.fit(numpy.array(features_train),
                    numpy.array(train_data.labels))
            features_test = extract_features_for_twitter_corpus(
                test_data.reviews, False)
            predicted_block = svc.predict(numpy.array(features_test))
            predicted.extend(predicted_block)
            right.extend(test_data.labels)

            print metrics.f1_score(test_data.labels,
                                   predicted_block,
                                   average='macro')
            f_measure.append(
                metrics.f1_score(test_data.labels,
                                 predicted_block,
                                 average='macro'))

            entities.extend(test_data.reviews)

        print str(f_measure)
        print classification_report(right, predicted, digits=3)
        print metrics.precision_score(right, predicted, average='macro')
        print metrics.recall_score(right, predicted, average='macro')
        print metrics.f1_score(right, predicted, average='macro')
    except FileNotFoundError:
        print "Please download Twitter corpus and put it into input/twitter_corpus folder"

예제 #2

파일 보기

파일: adr_classification.py 프로젝트: pdsujnow/adr_classification

def classifier_for_cadec_corpus():
    svc = LinearSVC(class_weight='auto', penalty='l2')
    f_measure = []
    entities = []
    predicted = []
    right = []
    train_data = Bunch()
    test_data = Bunch()
    for i in range(1, 6):
        print i
        f_train = open("input/cadec_corpus/" + str(i) + "/train.txt")
        f_test = open("input/cadec_corpus/" + str(i) + "/test.txt")
        train_data.reviews = load_data(f_train)
        test_data.reviews = load_data(f_test)
        train_data.labels = extract_labels(train_data.reviews)
        test_data.labels = extract_labels(test_data.reviews)
        train_data.entities = extract_entities(train_data.reviews)
        features_train = extract_features_for_cadec_corpus(
            train_data.reviews, True)
        svc.fit(numpy.array(features_train), numpy.array(train_data.labels))
        features_test = extract_features_for_cadec_corpus(
            test_data.reviews, False)
        predicted_block = svc.predict(numpy.array(features_test))
        predicted.extend(predicted_block)
        right.extend(test_data.labels)

        print metrics.f1_score(test_data.labels,
                               predicted_block,
                               average='macro')
        f_measure.append(
            metrics.f1_score(test_data.labels,
                             predicted_block,
                             average='macro'))

        entities.extend(test_data.reviews)

    print str(f_measure)
    print classification_report(right, predicted, digits=3)
    print metrics.precision_score(right, predicted, average='macro')
    print metrics.recall_score(right, predicted, average='macro')
    print metrics.f1_score(right, predicted, average='macro')