Python Languages.tokenize示例

编程语言: Python

命名空间/包名称: translations.utils

类/类型: Languages

方法/功能: tokenize

hotexamples.com的示例: 2

Python Languages.tokenize - 已找到2个示例。这些是从开源项目中提取的最受好评的translations.utils.Languages.tokenize现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

from_string(2)

other_language(2)

tokenize(2)

示例#1

显示文件

文件： models.py 项目： Bisk1/kongming

 def _break_and_wrap(text_to_tokenize_match):
     text_to_tokenize = text_to_tokenize_match.group(0)
     wrapped = ""
     for token in Languages.tokenize(Languages.chinese.value, text_to_tokenize):
         word_zh = WordZH.get_or_create_with_translator(word=token)[0]
         wrapped += '<span class="chinese-word"><span>' + word_zh.pinyin + '</span><span>' + token + '</span></span>'
     return wrapped

示例#2

显示文件

文件： models.py 项目： Bisk1/kongming

 def auto_tokenize(self):
     """
     Tokenize the business text into words, create their objects
     if necessary and link the business text to them.
     Only applied to Chinese words.
     """
     word_model = to_word_model(self.language)
     if word_model == WordZH:
         tokens = Languages.tokenize(self.language, self.text)
         self.words_zh.clear()
         ordinal = 0
         for token in tokens:
             word_object = word_model.get_or_create_with_translator(word=token)[0]
             BusinessTextWordZH.objects.create(text=self, word=word_object, ordinal=ordinal).save()
             ordinal += 1