Python ABWORDS Exemples

Langage de programmation: Python

Espace de nommage/Pack: ab.util.abwords

Class/Type: ABWORDS

Exemples au hotexamples.com: 2

Python ABWORDS - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de ab.util.abwords.ABWORDS extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

ABWORDS(1)

seg_words(1)

Méthodes fréquemment utilisées

ABWORDS (1)

seg_words (1)

Associées

Ui_startscreen

throw

console_set_char_background

autonuma_status

readGraphDataFromDA

loadUi

MintRoomSpecs

write_info

as_np

FixedIterationsStoppingCriterion

Related in langs

NsmUser (PHP)

sessionListUser (PHP)

DeviceUNameMethodArgs (C#)

WebAssetItem (C#)

proc_key (C++)

HEADER_SetTextColor (C++)

Get (Go)

DeleteCert (Go)

ConceptSetPersister (Java)

Exemple #1

0

Afficher le fichier

def __init__(self, params=None): from ab.util.abwords import ABWORDS import os super(ABTokenizer, self).__init__(params) # user dict from params dictList = [] #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_basicDict.txt') #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_groupDict.txt') dictList.append(os.environ[self.ABWDE_HOME] + '/dict/sougou.dict') self._wordparser = ABWORDS(dictList) self._imp_tokenizer = ChunkTokenizer()

Exemple #2

0

Afficher le fichier

class ABTokenizer(Tokenizer): ABWDE_HOME = "ABWDE_HOME" def __init__(self, params=None): from ab.util.abwords import ABWORDS import os super(ABTokenizer, self).__init__(params) # user dict from params dictList = [] #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_basicDict.txt') #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_groupDict.txt') dictList.append(os.environ[self.ABWDE_HOME] + '/dict/sougou.dict') self._wordparser = ABWORDS(dictList) self._imp_tokenizer = ChunkTokenizer() def tokenize(self, stream): gbk_stream = stream.encode('gbk', 'ignore') for chunk in self._imp_tokenizer.tokenize(stream): words = self._wordparser.seg_words(chunk.encode('gbk', 'ignore')) for word in words: yield word.decode('gbk', 'ignore')