Esempio n. 1
0
#Chemin pour l'accès aux fichiers constituants le corpus
path = 'docs/'

#On regarde tous les documents dans le dossier indiqué
corpus = os.listdir(path)

#On met les chemins complets (au lieu des noms des documents)
for i in range(0, len(corpus)):
	corpus[i] = path+corpus[i]

#On créé le corpus
corpus = Corpus(corpus, 'stopwords.txt', 'dico/')

cheminRequete = "requete"
requeteFile = open(cheminRequete, 'w', -1, 'utf-8')
for i in range(1, len(sys.argv)):
	requeteFile.write(sys.argv[i]+" ")
requeteFile.close()

corpus.lemmatiserCorpus(cheminRequete)
corpus.vectoriserDocCorpus()

#On prépare une variable pour le calcul de similarité
finale = {}
finale = corpus.calculSimilarite()

for i in range(0, len(finale)):
	print(finale[i])