Python _clean_tokens示例

编程语言: Python

命名空间/包名称: gtts.utils

方法/功能: _clean_tokens

hotexamples.com的示例: 5

Python _clean_tokens - 已找到5个示例。这些是从开源项目中提取的最受好评的gtts.utils._clean_tokens现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： tts.py 项目： veax-void/voice_loader

    def _tokenize(self, text):
        # Pre-clean
        text = text.strip()

        # Apply pre-processors
        for pp in self.pre_processor_funcs:
            log.debug("pre-processing: %s", pp)
            text = pp(text)

        if _len(text) <= self.GOOGLE_TTS_MAX_CHARS:
            return _clean_tokens([text])

        # Tokenize
        log.debug("tokenizing: %s", self.tokenizer_func)
        tokens = self.tokenizer_func(text)

        # Clean
        tokens = _clean_tokens(tokens)

        # Minimize
        min_tokens = []
        for t in tokens:
            min_tokens += _minimize(t, ' ', self.GOOGLE_TTS_MAX_CHARS)

        # Filter empty tokens, post-minimize
        tokens = [t for t in min_tokens if t]

        return min_tokens

示例#2

显示文件

def test_strip():
    _in = [" Bacon  ", "& ", "ipsum\r", "."]
    _out = ["Bacon", "&", "ipsum"]
    assert _clean_tokens(_in) == _out

示例#3

显示文件

def test_only_space_and_punc():
    _in = [",(:)?", "\t    ", "\n"]
    _out = []
    assert _clean_tokens(_in) == _out

示例#4

显示文件

 def test_strip(self):
     _in = [" Bacon  ", "& ", "ipsum\r", "."]
     _out = ["Bacon", "&", "ipsum"]
     self.assertEqual(_clean_tokens(_in), _out)

示例#5

显示文件

 def test_only_space_and_punc(self):
     _in = [",(:)?", "\t    ", "\n"]
     _out = []
     self.assertEqual(_clean_tokens(_in), _out)