Python tokenize示例

编程语言: Python

命名空间/包名称: east.utils

方法/功能: tokenize

hotexamples.com的示例: 6

Python tokenize - 已找到6个示例。这些是从开源项目中提取的最受好评的east.utils.tokenize现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： synonyms.py 项目： dmitsf/AST-text-analysis

 def _calculate_word_frequencies(self, text):
     text = common_utils.prepare_text(text)
     words = common_utils.tokenize(text)
     res = collections.defaultdict(int)
     for word in words:
         res[word] += 1
     return res

示例#2

显示文件

文件： synonyms.py 项目： know-nothing/FCART

 def _calculate_word_frequencies(self, text):
     text = common_utils.prepare_text(text)
     words = common_utils.tokenize(text)
     res = collections.defaultdict(int)
     for word in words:
         res[word] += 1
     return res

示例#3

显示文件

文件： easa.py 项目： know-nothing/FCART

 def score(self, query, normalized=True, synonimizer=None):
     if synonimizer:
         synonyms = synonimizer.get_synonyms()
         query_words = common_utils.tokenize(query)
         for i in xrange(len(query_words)):
             query_words[i] = synonyms[query_words[i]] + [query_words[i]]
         possible_queries = map(lambda words: "".join(words),
                                itertools.product(*query_words))
         return max(self._score(q) for q in possible_queries)
     else:
         return self._score(query.replace(" ", ""), normalized)

示例#4

显示文件

文件： easa.py 项目： dmitsf/AST-text-analysis

 def score(self,
           query,
           normalized=True,
           synonimizer=None,
           return_suffix_scores=False):
     if synonimizer:
         synonyms = synonimizer.get_synonyms()
         query_words = common_utils.tokenize(query)
         for i in range(len(query_words)):
             query_words[i] = synonyms[query_words[i]] + [query_words[i]]
         possible_queries = map(lambda words: "".join(words),
                                itertools.product(*query_words))
         return max(self._score(q) for q in possible_queries)
     else:
         return self._score(query.replace(" ", ""), normalized,
                            return_suffix_scores)

示例#5

显示文件

文件： test_utils.py 项目： nocturne2333/AST-text-analysis

 def test_tokenize(self):
     text = "Well, what a sunny day!"
     tokens = ["Well", "what", "a", "sunny", "day"]
     self.assertEqual(utils.tokenize(text), tokens)

示例#6

显示文件

文件： test_utils.py 项目： know-nothing/FCART

 def test_tokenize(self):
     text = "Well, what a sunny day!"
     tokens = ["Well", "what", "a", "sunny", "day"]
     self.assertEqual(utils.tokenize(text), tokens)