Python ArnetMinerDataset.overwriteModel 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: exp.influence2.ArnetMinerDataset

클래스/타입: ArnetMinerDataset

메소드/함수: overwriteModel

hotexamples.com에서의 예제들: 3

Python ArnetMinerDataset.overwriteModel - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 exp.influence2.ArnetMinerDataset.ArnetMinerDataset.overwriteModel에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

dataFilename(5)

vectoriseDocuments(4)

overwriteVectoriser(3)

overwriteModel(3)

minDf(2)

findSimilarDocumentsLDA(2)

findSimilarDocumentsLSI(2)

overwrite(2)

readAuthorsAndDocuments(1)

overwriteGraph(1)

modelSelectionLSI(1)

coauthorsGraph(1)

maxRelevantAuthors(1)

coauthorsGraphFromAuthors(1)

loadVectoriser(1)

k(1)

getDataFieldDir(1)

expertsFromDocSimilarities(1)

matchExperts(1)

예제 #1

파일 보기

파일: ArnetMinerDatasetProfile.py 프로젝트: pierrebo/wallhack

 def profileModelSelection(self): 
     dataset = ArnetMinerDataset(runLSI=False)   
     dataset.overwrite = True
     dataset.overwriteVectoriser = True
     dataset.overwriteModel = True
     
     dataset.dataFilename = dataset.dataDir + "DBLP-citation-100000.txt"
     
     ProfileUtils.profile('dataset.modelSelection()', globals(), locals())

예제 #2

파일 보기

파일: ArnetMinerDatasetProfile.py 프로젝트: pierrebo/wallhack

 def profileComputeLDA(self): 
     field = "Boosting"
     dataset = ArnetMinerDataset(field)
     dataset.overwrite = True
     dataset.overwriteVectoriser = True
     dataset.overwriteModel = True
     dataset.maxRelevantAuthors = 100
     dataset.k = 200
     dataset.dataFilename = dataset.dataDir + "DBLP-citation-100000.txt"
     
     ProfileUtils.profile('dataset.computeLDA()', globals(), locals())

예제 #3

파일 보기

파일: ReputationExp2.py 프로젝트: pierrebo/wallhack

args = parser.parse_args()

averagePrecisionN = 50 
similarityCutoff = 0.30
ns = numpy.arange(5, 105, 5)
runLSI = not args.runLDA

dataset = ArnetMinerDataset(runLSI=runLSI) 
#dataset.dataFilename = dataset.dataDir + "DBLP-citation-100000.txt"

#dataset.dataFilename = dataset.dataDir + "DBLP-citation-1000000.txt"
dataset.dataFilename = dataset.dataDir + "DBLP-citation-1000000.txt"
#dataset.dataFilename = dataset.dataDir + "DBLP-citation-7000000.txt"
#dataset.dataFilename = dataset.dataDir + "DBLP-citation-Feb21.txt" 
dataset.overwriteGraph = True
dataset.overwriteModel = True

dataset.overwriteVectoriser = True 
dataset.vectoriseDocuments()
dataset.loadVectoriser()


X = scipy.io.mmread(dataset.docTermMatrixFilename + ".mtx")
X = X.tocsc()
X.data[:] = 1

print(numpy.max(X.data), numpy.min(X.data))

rowSums = numpy.array(X.sum(0), numpy.int).flatten()
colSums = numpy.array(X.sum(1), numpy.int).flatten()