Python Lemmatisation Exemples

Langage de programmation: Python

Espace de nommage/Pack: Lemmatisation

Class/Type: Lemmatisation

Exemples au hotexamples.com: 2

Python Lemmatisation - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de Lemmatisation.Lemmatisation extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

lemmatisation(2)

Méthodes fréquemment utilisées

lemmatisation (2)

Associées

IAliasInformation

clip

combine_data

AptConfirmDialog

predict

follow_window

tim_algorithm_with_ordered_search_and_birthdays

return_false

parse_docstring

shared_isotropic_adp_proxy

Related in langs

SimpleChoiceCollection (PHP)

tidypics_can_add_new_photos (PHP)

Thrift.ColumnChunk (C#)

CallParseNode (C#)

NX_CLKGEN_SetBaseAddress (C++)

original_pthread_create (C++)

Open (Go)

StringValue (Go)

SettingsForm (Java)

MinimapConfig (Java)

Exemple #1

0

Afficher le fichier

Fichier : Traitement.py Projet : JenniferL/MoteurRecherche

import sys, os #------------------------------------------------------------------------------------------- #récupération du corpus IG={} indexGlobal = open("Lemmatisation/corpus.txt", "r") for line in indexGlobal: line = line.split("\t") if line[0]!="": IG[line[0]] = int(line[1]) indexGlobal.close() #récupération de la requete requete = [] requete.append(sys.argv[1]) indexRequete = Lemmatisation("", requete) indexRequete = indexRequete.lemmatisation() #si besoin ajout des mots de la requete dans la variable du corpus (méthode du pauvre) for line in indexRequete: if line not in IG: IG[line] = 1 #initialisation du dictionnaire de résultats resultats = {} #parcours des pages wikipédia crawlés et lemmatisés for file in os.listdir("Lemmatisation/index"): #initialisation du dictionnaire index qui contiendra l'index du fichier index = {} #copie du corpus contenant la requête localIG = IG #lecture du fichier index fichier = open("Lemmatisation/index/"+file, "r")

Exemple #2

0

Afficher le fichier

Fichier : PreTraitement.py Projet : JenniferL/MoteurRecherche

#parcours des pages crawlées for file in os.listdir("Scrapy/links"): if file not in os.listdir("Lemmatisation/index"): startTime = time.time() print(startTime) #ouverture du fichier fileobj=open("Scrapy/links/"+file,"r") #parser parser = ET.HTMLParser(recover=True) doc = ET.parse(fileobj, parser) fileobj.close() root = doc.getroot() #selection type xpath des textes des paragraphes texte = doc.xpath('//p//text()') #lemmatisation des textes lem =Lemmatisation("Scrapy/links/"+file, texte) lem.lemmatisation() #génération/amélioration du corpus IG = lem.IndexGlobal(IG) #selection xpath des textes de tout le body (navigation incluse) texte = doc.xpath('//body//text()') #lemmatisation lem =Lemmatisation("Scrapy/links/"+file, texte) index = lem.lemmatisation() #enregistrement de l'index généré fichierIndex = open("Lemmatisation/index/"+file, "w+") for line in index: fichierIndex.write(line+" "+str(index[line])+"\n") fichierIndex.close() #affichage du temps d'exécution print(file, round(time.time()-startTime, 5), "secondes")