Python create_word_scores 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: extractFeatures

메소드/함수: create_word_scores

hotexamples.com에서의 예제들: 3

Python create_word_scores - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 extractFeatures.create_word_scores에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def get_best_words():
    import extractFeatures as ef
    import pickle
    pos_review = pickle.load(open('/Users/genghaiyang/ghy_works/projects/weibo_crawler/textmining/sentiML/pos_neg_review/pos_review.pkl','r'))
    neg_review = pickle.load(open('/Users/genghaiyang/ghy_works/projects/weibo_crawler/textmining/sentiML/pos_neg_review/neg_review.pkl','r'))
    neg_review = neg_review*3
    pos = pos_review[:50]
    neg = neg_review[:50]
    word_scores = ef.create_word_scores(pos,neg,'pos','neg')
    best_words = ef.find_best_words(word_scores, 10000)
    return best_words

예제 #2

파일 보기

파일: SVM_main.py 프로젝트: coolspiderghy/sina_weibo_crawler

import evalueClassier as ec
import extractFeatures as ef
import pickle
import itertools 
import evalueClassier as ec
from sklearn.svm import SVC, LinearSVC, NuSVC
from sklearn.naive_bayes import MultinomialNB, BernoulliNB
from sklearn.linear_model import LogisticRegression
# select positive and negative features.
pos_review = pickle.load(open('/Users/genghaiyang/ghy_works/projects/weibo_crawler/textmining/sentiML/pos_neg_review/pos_review.pkl','r'))
neg_review = pickle.load(open('/Users/genghaiyang/ghy_works/projects/weibo_crawler/textmining/sentiML/pos_neg_review/neg_review.pkl','r'))
neg_review = neg_review*3
pos = pos_review[:50]
neg = neg_review[:50]

word_scores = ef.create_word_scores(pos,neg,'pos','neg')
best_words = ef.find_best_words(word_scores, 1000)
posFeatures = []
for p in pos:
    pos_selected = ef.best_word_features(p,best_words)
    posFeatures.append(ef.tagFeatures(pos_selected,'pos'))
negFeatures = []
for n in neg:
    neg_selected = ef.best_word_features(n,best_words)
    negFeatures.append(ef.tagFeatures(neg_selected,'neg'))

# divide Features into train devtest and test sets.
trainSet = posFeatures[:50]+negFeatures[:50]
devtestSet = posFeatures[40:50]+negFeatures[40:50]
testSet = posFeatures[40:50]+negFeatures[40:50]
print testSet

예제 #3

파일 보기

파일: saveClassifer.py 프로젝트: coolspiderghy/sina_weibo_crawler

import extractFeatures as ef
import evalueClassier as ec
#把分类器存储下来
pos_review = pickle.load(
    open(
        '/Users/genghaiyang/ghy_works/projects/weibo_crawler/textmining/sentiML/pos_neg_review/pos_review.pkl',
        'r'))
neg_review = pickle.load(
    open(
        '/Users/genghaiyang/ghy_works/projects/weibo_crawler/textmining/sentiML/pos_neg_review/neg_review.pkl',
        'r'))
neg_review = neg_review * 3
pos = pos_review[:50]
neg = neg_review[:50]

word_scores = ef.create_word_scores(pos, neg, 'pos', 'neg')
best_words = ef.find_best_words(word_scores, 1000)
posFeatures = []
for p in pos:
    pos_selected = ef.best_word_features(p, best_words)
    posFeatures.append(ef.tagFeatures(pos_selected, 'pos'))
negFeatures = []
for n in neg:
    neg_selected = ef.best_word_features(n, best_words)
    negFeatures.append(ef.tagFeatures(neg_selected, 'neg'))
# divide Features into train devtest and test sets.
trainSet = posFeatures[:50] + negFeatures[:50]
devtestSet = posFeatures[40:50] + negFeatures[40:50]
testSet = posFeatures[40:50] + negFeatures[40:50]
#Train and save classifier
NuSVC_classifier = SklearnClassifier(NuSVC(probability=True))