for word in entry: if word in classVector.keys(): proba += math.log10(((classVector[word]+1)/(iWords+len(classVector)))**entry[word]) return proba import time if __name__ == "__main__": startTime = time.time() print("Classification de mots utilisant Bayes") print("-----------------------------------------------------\n") fileManager = File() # Switch to handle raw input or filtered input wordList = fileManager.from_folder() #wordList = fileManager.from_tagged_folder() fileList = fileManager.fileContentList lightdisplay = True print("Split positif\tSplit négatif\tErreur positifs\tErreur négatif\tErreur moyenne\tTemps") for pi in range(10,95 , 5): pourcentagePos = pi/100.0 #meilleur 0.5 / 0.8 pourcentageNeg = pi/100.0 startTime = time.time()
# Arguments m = 1 # Nombre de colonne cachées n = 15 # Nombre de neurones par colonne alpha = 0.1 # Alpha iterCount = 3 # Nombre d'itération percentageGenerate = 0.2 # Pourcentage de corpus d'entrainement threshold = 0.05 start_time = time.time() print("\n-----------------------------------------------------") print("Classification de mots utilisant un réseau de neurone") print("-----------------------------------------------------\n") fileManager = File() uniqueWordList = fileManager.from_folder() wordNeurons = {} intermediateNeurons = [] print("Arguments :") print("\tNombre de réitérations sur les fichiers d'analyse : " + str(iterCount)) print("\tRéseau interne composé de " + str(m) + " colonnes cachées et " + str(n) + " neuronnes par colonne") print("\tAlpha %.2f\n" % alpha) print("Lecture des fichiers : %f seconds" % (time.time() - start_time)) #Creation du système de Neurones finalNeuron = Neurone() for x in range(0, m): listCol = [] for y in range(0, n):