Python is_latin示例

编程语言: Python

命名空间/包名称: charset_normalizer.utils

方法/功能: is_latin

hotexamples.com的示例: 3

Python is_latin - 已找到3个示例。这些是从开源项目中提取的最受好评的charset_normalizer.utils.is_latin现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

    def feed(self, character: str) -> None:
        if character.isalpha():
            self._buffer = "".join([self._buffer, character])
            if is_accentuated(character):
                self._buffer_accent_count += 1
            if self._foreign_long_watch is False and is_latin(
                    character
            ) is False and is_cjk(character) is False and is_hangul(
                    character
            ) is False and is_katakana(character) is False and is_hiragana(
                    character) is False and is_thai(character) is False:
                self._foreign_long_watch = True
            return
        if not self._buffer:
            return
        if (character.isspace() or is_punctuation(character)
                or is_separator(character)) and self._buffer:
            self._word_count += 1
            buffer_length = len(self._buffer)  # type: int

            self._character_count += buffer_length

            if buffer_length >= 4 and self._buffer_accent_count / buffer_length >= 0.3:
                self._is_current_word_bad = True
            if buffer_length >= 24 and self._foreign_long_watch:
                self._is_current_word_bad = True

            if self._is_current_word_bad:
                self._bad_word_count += 1
                self._bad_character_count += len(self._buffer)
                self._is_current_word_bad = False

            self._foreign_long_watch = False
            self._buffer = ""
            self._buffer_accent_count = 0
        elif character not in {
                "<", ">", "-", "="
        } and character.isdigit() is False and is_symbol(character):
            self._is_current_word_bad = True
            self._buffer += character

示例#2

显示文件

 def eligible(self, character: str) -> bool:
     return is_latin(character)

示例#3

显示文件

 def eligible(self, character: str) -> bool:
     return character.isalpha() and is_latin(character)