예제 #1
0
def main():
	#Ouverture des données de comptage des mots
	dCompte = utils.load_jsonfile("donnees/compte.json")

	dTfIdf = tfidf_dict(dCompte)
	
	#Stockage des données de TfIdf
	utils.save_jsonfile("donnees/tfidf.json", dTfIdf)
예제 #2
0
def main():	
	
	articles = {}
	fichiers = glob.glob("corpus/*")
	n = 0

	#Parcours des fichiers crawlés
	for i in fichiers:
		
		#Ouverture fichier	
		contenu = utils.read_file(i, 'r').lower()
		
		#Découpe et compte des mots de chaque fichier
		articles[i] = compteOccurrences(decoupe(contenu, mot))
		
		#Progression
		n += 1
		print n, len(fichiers)

	#Stockage des données de comptage de mots
	utils.save_jsonfile("donnees/compte.json", articles)