Python Bayes.creatVocabList 예제들

프로그래밍 언어: Python

클래스/타입: Bayes

메소드/함수: creatVocabList

hotexamples.com에서의 예제들: 1

Python Bayes.creatVocabList - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 Bayes.creatVocabList 패키지로부터 moodstyle에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

createVocabList(11)

classifyNB(9)

Bayes(8)

_load_dataset(4)

build_word_array(3)

bagOfWords2Vec(3)

build_key_word(2)

getTopWords(1)

generatePatterns(1)

creatVocabList(1)

compare_sentiments(1)

classify(1)

call_me(1)

calMean(1)

calGauss(1)

calCov(1)

bayes(1)

Conditionals(1)

bagOfWord2VecMN(1)

_bayes(1)

TrainingNB1(1)

Sampling(1)

Naive_Bayes(1)

NaiveBayes(1)

NBayes(1)

Model_Greedy(1)

Mix_NB(1)

GBC(1)

testingNM(1)

예제 #1

파일 보기

파일: feedParser.py 프로젝트: LordGoodman/machine_learnint_simple

def localWord(feed0,feed1):
   
    minLen = min(len(feed1['entries']),len(feed0['entries']))
    listOfPost = [];classVec = [];fullText = []
    for i in range(minLen):
        wordList = Bayes.textParse(feed1['entries'][i]['summary'])#数组从feed1开始
        listOfPost.append(wordList)
        fullText.extend(wordList)
        classVec.append(1)
        
        wordList = Bayes.textParse(feed0['entries'][i]['summary'])
        listOfPost.append(wordList)
        fullText.extend(wordList)
        classVec.append(0)
        
    vocabList = Bayes.creatVocabList(listOfPost)
    
    top30Words = calMostFreq(vocabList,fullText)
    
    for pairW in top30Words:
        if pairW in vocabList:vocabList.remove(pairW)
        
    trainingSet = range(2*minLen) ; dataSet = []
    
    for i in range(20):
        randIndex = int(np.random.uniform(len(trainingSet)))
        dataSet.append(randIndex)
        del(trainingSet[randIndex])
    
    trainMat = [];trainClass = []
    for docIndex in trainingSet:
        trainMat.append(Bayes.bagOfWords2Vec(vocabList,listOfPost[docIndex]))
        trainClass.append(classVec[docIndex])
                    
    p0V,p1V,pSpam = Bayes.trainNB0(np.array(trainMat),trainClass)
    
    errorCount = 0.0
    
    for docIndex in dataSet:
        dataMat = Bayes.bagOfWords2Vec(vocabList,listOfPost[docIndex])
        
        if Bayes.classifyNB(np.array(dataMat),p0V,p1V,pSpam) != classVec[docIndex]:
            errorCount += 1
   # print "the error rate is :",errorCount/float(len(dataSet))
    
    return vocabList,p0V,p1V