Python lang_parse示例

编程语言: Python

命名空间/包名称: pyplus1

方法/功能: lang_parse

hotexamples.com的示例: 4

Python lang_parse - 已找到4个示例。这些是从开源项目中提取的最受好评的pyplus1.lang_parse现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： fillredis.py 项目： jakeprobst/iplus1

def fill_redis():
    redisdb = redis.Redis(REDIS_SERVER, REDIS_PORT)
    senf = open("sentences.csv")
    for line in senf:
        id, lang, sen = line.strip().split('\t')

        token = pyplus1.lang_parse(lang, sen)
        if token:
            tokenbuf = ','.join(token)
            redisdb.hset(lang, int(id), tokenbuf)

    linkf = open("data/links.csv")
    for line in linkf:
        nlang, nid, tlang, tid = line.split('\t')

        if nlang < tlang:  # nlang sorts before tlang
            merged = (nid) | (tid << 32)
            setname = "%s-%s" % (nlang, tlang)
        else:
            merged = (tid) | (nid << 32)
            setname = "%s-%s" % (tlang, nlang)

        redisdb.sadd(setname, merged)

示例#2

显示文件

文件： fillredis.py 项目： jakeprobst/iplus1

def fill_redis():
    redisdb = redis.Redis(REDIS_SERVER, REDIS_PORT)
    senf = open("sentences.csv")
    for line in senf:
        id, lang, sen = line.strip().split('\t')
        
        token = pyplus1.lang_parse(lang, sen)
        if token:
            tokenbuf = ','.join(token)
            redisdb.hset(lang, int(id), tokenbuf)


    linkf = open("data/links.csv")
    for line in linkf:
        nlang, nid, tlang, tid = line.split('\t')
        
        if nlang < tlang: # nlang sorts before tlang
            merged = (nid) | (tid << 32)
            setname = "%s-%s" % (nlang, tlang)
        else:
            merged = (tid) | (nid << 32)
            setname = "%s-%s" % (tlang, nlang)

        redisdb.sadd(setname, merged)

示例#3

显示文件

 def add_sentence(self, lang, id, sentence):
     words = pyplus1.lang_parse(lang, sentence.encode('utf-8'))
     
     out = '.'.join(words)
     self.redisdb.hset(lang, id, out)

示例#4

显示文件

 def parse_text(self, text):
     for line in text:
         words = pyplus1.lang_parse(self.tlang.encode('utf-8'), line.encode('utf-8'))
         for w in words:
             self.add_word(w)