def main(): #Ouverture des données de comptage des mots dCompte = utils.load_jsonfile("donnees/compte.json") dTfIdf = tfidf_dict(dCompte) #Stockage des données de TfIdf utils.save_jsonfile("donnees/tfidf.json", dTfIdf)
def main(): articles = {} fichiers = glob.glob("corpus/*") n = 0 #Parcours des fichiers crawlés for i in fichiers: #Ouverture fichier contenu = utils.read_file(i, 'r').lower() #Découpe et compte des mots de chaque fichier articles[i] = compteOccurrences(decoupe(contenu, mot)) #Progression n += 1 print n, len(fichiers) #Stockage des données de comptage de mots utils.save_jsonfile("donnees/compte.json", articles)