Python ABWORDSの例

プログラミング言語: Python

名前空間/パッケージ名: ab.util.abwords

クラス/型: ABWORDS

hotexamples.comのコード掲載数: 2

Python ABWORDS - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのab.util.abwords.ABWORDSの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

ABWORDS(1)

seg_words(1)

コード例 #1

ファイルを表示

 def __init__(self, params=None):
     from ab.util.abwords import ABWORDS
     import os
     super(ABTokenizer, self).__init__(params)
     # user dict from params
     dictList = []
     #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_basicDict.txt')
     #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_groupDict.txt')
     dictList.append(os.environ[self.ABWDE_HOME] + '/dict/sougou.dict')
     self._wordparser = ABWORDS(dictList)
     self._imp_tokenizer = ChunkTokenizer()

コード例 #2

ファイルを表示

class ABTokenizer(Tokenizer):
    ABWDE_HOME = "ABWDE_HOME"

    def __init__(self, params=None):
        from ab.util.abwords import ABWORDS
        import os
        super(ABTokenizer, self).__init__(params)
        # user dict from params
        dictList = []
        #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_basicDict.txt')
        #dictList.append(os.environ[self.ABWDE_HOME] + '/dict/Aibang_groupDict.txt')
        dictList.append(os.environ[self.ABWDE_HOME] + '/dict/sougou.dict')
        self._wordparser = ABWORDS(dictList)
        self._imp_tokenizer = ChunkTokenizer()

    def tokenize(self, stream):
        gbk_stream = stream.encode('gbk', 'ignore')
        for chunk in self._imp_tokenizer.tokenize(stream):
            words = self._wordparser.seg_words(chunk.encode('gbk', 'ignore'))
            for word in words:
                yield word.decode('gbk', 'ignore')