Python iterTokenizedSentences Exemples

Langage de programmation: Python

Espace de nommage/Pack: tokenizer

Méthode/Fonction: iterTokenizedSentences

Exemples au hotexamples.com: 2

Python iterTokenizedSentences - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de tokenizer.iterTokenizedSentences extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

ScreenAgent

VisibleNode

DirParser

PresencePublisher

EmployerForm

dumps

mi_Error

get_transport

LeakDetectorValgrind

ActionImageForm

Related in langs

DateTime53 (PHP)

sp_PostIndexUserStatus (PHP)

FormMenuRunner (C#)

IJobLeadService (C#)

TEST_BOOL (C++)

value_scalar (C++)

New (Go)

GlobalProviderRegistry (Go)

ByteBuffer (Java)

Address (Java)

Exemple #1

0

Afficher le fichier

Fichier : DB.py Projet : ProjetM1Big2016/ModuleNLP

def tokenize(self): vocab = Counter() for mail in self.mails: mail.sents = list(iterTokenizedSentences(mail.sujet)) + list(iterTokenizedSentences(mail.description)) vocab.update(word for sent in mail.sents for word in sent) self.vocab = vocab

Exemple #2

0

Afficher le fichier

Fichier : ExportManualAnnotDB.py Projet : ProjetM1Big2016/ModuleNLP

"contact-nom", "contact-email", "date-candidature", "validite", "duree", "ville", "lieu", "labo", ] outdir = "archives_SFBI_AnnotationManuelle" mails = list(mailLoaderGen()) words = Counter() for mail in mails: mail.sents = list(iterTokenizedSentences(mail.description)) for sent in mail.sents: words.update(sent) stemmer = Stemmer(set(word for (word, n) in words.items() if n > 10)) for m in mails: outf = outdir + m.mailfile.strip("archives_SFBI") d = m.__dict__ d["date"] = date.fromtimestamp(d["timestamp"]).strftime("%d %B %Y") with open(outf, "wt") as f: d["from"] = d.pop("sender") if m.sfbi: ce = d["contact-email"] ce = "\t".join(ce) if type(ce) is set else ce