Python getUnicodeStems Exemples

Langage de programmation: Python

Espace de nommage/Pack: tharsk.utils

Méthode/Fonction: getUnicodeStems

Exemples au hotexamples.com: 4

Python getUnicodeStems - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de tharsk.utils.getUnicodeStems extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

Quat

to_comment

prepare_upload_bundle

pretty_size

residual_block

JobProxy

urltoname

WBTrigramModel

exception_to_string

disarm

Related in langs

WPAM_Plugin (PHP)

getKunenaImporterParams (PHP)

TimerSettingForm (C#)

MemberPointer (C#)

ReftableC (C++)

GetDocShellTreeItemFor (C++)

IAddress (Go)

LogError (Go)

TomcatLauncherPlugin (Java)

java.util.Map (Java)

Exemple #1

0

Afficher le fichier

def test_getUnicodeStemsWithUnicode(self): wordList = "*(ande-)stād-(ī-tu-)".split() results = [x.encode("utf-8") for x in utils.getUnicodeStems(wordList)] self.assertEqual( results, ['and', 'ande-stad-i-tu-', 'ande-stād-ī-tu-', 'i', 'stad', 'stād', 'tu', 'ī'] )

Exemple #2

0

Afficher le fichier

Fichier : sync.py Projet : oubiwann/tharsk

def run(self): super(AddProtoCelticKeywords, self).run() reader = unicsv.UnicodeReader(self.inFilename) fieldnames = collection.ProtoCelticDictionaryV1().fields writer = unicsv.UnicodeWriter(self.outFilename, fieldnames) writer.writeheader() for row in reader: pclOrig = row["pcl"].split() engOrig = row["eng"].split() pcl = utils.getUnicodeStems(pclOrig) eng = utils.getStems(engOrig) row["see-also"] = "" row["pcl-keywords"] = json.dumps(utils.getUnicodeStems(pcl)) row["eng-keywords"] = json.dumps(utils.getStems(eng)) pcl = pcl + pclOrig eng = eng + engOrig try: row["pcl-metaphone"] = json.dumps(utils.getMetaphones(pcl)) row["eng-metaphone"] = json.dumps(utils.getMetaphones(eng)) except Exception, err: import pdb;pdb.set_trace() writer.writerow(row)

Exemple #3

0

Afficher le fichier

Fichier : sync.py Projet : oubiwann/tharsk

def run(self): super(AddProtoCelticKeywords, self).run() reader = unicsv.UnicodeReader(self.inFilename) fieldnames = collection.ProtoCelticDictionaryV1().fields writer = unicsv.UnicodeWriter(self.outFilename, fieldnames) writer.writeheader() for row in reader: pclOrig = row["pcl"].split() engOrig = row["eng"].split() pcl = utils.getUnicodeStems(pclOrig) eng = utils.getStems(engOrig) row["see-also"] = "" row["pcl-keywords"] = json.dumps(utils.getUnicodeStems(pcl)) row["eng-keywords"] = json.dumps(utils.getStems(eng)) pcl = pcl + pclOrig eng = eng + engOrig try: row["pcl-metaphone"] = json.dumps(utils.getMetaphones(pcl)) row["eng-metaphone"] = json.dumps(utils.getMetaphones(eng)) except Exception, err: import pdb pdb.set_trace() writer.writerow(row)

Exemple #4

0

Afficher le fichier

def test_getUnicodeStemsWithPunctuation(self): wordList = "*(o)bb-nod-e/o".split() results = utils.getUnicodeStems(wordList) self.assertEqual(results, ['eo', 'nod', 'obb', 'obb-nod-eo'])