Python ReadData.ReadAllCatalogs 예제들

프로그래밍 언어: Python

클래스/타입: ReadData

메소드/함수: ReadAllCatalogs

hotexamples.com에서의 예제들: 2

Python ReadData.ReadAllCatalogs - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ReadData.ReadAllCatalogs 패키지로부터 python-ant-downloader에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ReadData(27)

combine(13)

Label2OneHot(8)

ReadRaw2HierData(4)

normalize(4)

ReadAll(4)

filter(3)

experiments(3)

Read_BLO_Matrix(3)

ReadReturn(2)

GetCoef(2)

Read_Two_Seq(2)

ReadAllCatalogs(2)

ReadTickers(1)

ReadTest(1)

Actionreader(1)

ReadWineData(1)

read_modify_pre_jsons(1)

readdata1(1)

Run(1)

ReadCoef(1)

ReadMushroomData(1)

ReadCsv(1)

CSVFileToMatrix(1)

ReadCancerData(1)

ReadBeta(1)

ReadAllFileData(1)

PandaReader(1)

OneHot2Label(1)

LoadSchedule(1)

LoadOriData(1)

LoadCSV(1)

LabelTo2(1)

GetTickers(1)

GetSP500Return(1)

Data(1)

readdata2(1)

예제 #1

파일 보기

# coding: GBK
import configuration
import ReadData
import math
from operator import itemgetter

fileToWords = ReadData.ReadAllCatalogs(configuration.training_data_directory)

wordFrequency = {}
wordDocFrequency = {}
wordidf = {}
doc_word_frequency = {}

# the number of documents
docCount = 0

#the default number of features is 2000
featureNum = configuration.feature_number


#get word list and sort them by their idf value, return the [(word, idf value), ...]
def wordStatistic():
    global wordFrequency
    global wordDocFrequency
    global wordidf
    global docCount
    global doc_word_frequency

    for catalog in fileToWords:
        catalog = fileToWords[catalog]
        docCount += len(catalog)

예제 #2

파일 보기

파일: KNNPredict.py 프로젝트: y0908105023/TextClassification

# coding: GBK

import configuration
import Training
import ReadData
import math

print 'began to get training_doc_vector'
training_doc_vector = Training.getDocVector()
print 'finished getting training_doc_vector'

print 'began to get test_files_to_words'
test_files_to_words = ReadData.ReadAllCatalogs(
    configuration.test_data_directory, False)
print 'finished getting test_files_to_words'


def getDocVector(content, featureVector):
    fileVector = {}
    for catalog in content:
        catalog = content[catalog]
        for doc in catalog:
            wordlist = catalog[doc]
            vector = []
            for feature in featureVector:
                vector.append(wordlist.count(feature[0]) * feature[1])
            fileVector[doc] = vector
    return fileVector


def similarity(vectora, vectorb):