Python is_accentuated 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: charset_normalizer.utils

메소드/함수: is_accentuated

hotexamples.com에서의 예제들: 5

Python is_accentuated - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 charset_normalizer.utils.is_accentuated에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def feed(self, character: str) -> None:
     if self._last_latin_character is not None:
         if is_accentuated(character) and is_accentuated(
                 self._last_latin_character):
             if remove_accent(character) == remove_accent(
                     self._last_latin_character):
                 self._successive_count += 1
     self._last_latin_character = character

예제 #2

파일 보기

 def feed(self, character: str) -> None:
     self._character_count += 1
     if self._last_latin_character is not None:
         if is_accentuated(character) and is_accentuated(
                 self._last_latin_character):
             if character.isupper() and self._last_latin_character.isupper(
             ):
                 self._successive_count += 1
             # Worse if its the same char duplicated with different accent.
             if remove_accent(character) == remove_accent(
                     self._last_latin_character):
                 self._successive_count += 1
     self._last_latin_character = character

예제 #3

파일 보기

    def feed(self, character: str) -> None:
        if character.isalpha():
            self._buffer = "".join([self._buffer, character])
            if is_accentuated(character):
                self._buffer_accent_count += 1
            return
        if not self._buffer:
            return
        if (character.isspace() or is_punctuation(character)
                or is_separator(character)) and self._buffer:
            self._word_count += 1
            buffer_length = len(self._buffer)  # type: int

            self._character_count += buffer_length

            if buffer_length >= 4 and self._buffer_accent_count / buffer_length >= 0.3:
                self._is_current_word_bad = True

            if self._is_current_word_bad:
                self._bad_word_count += 1
                self._bad_character_count += len(self._buffer)
                self._is_current_word_bad = False

            self._buffer = ""
            self._buffer_accent_count = 0
        elif character not in {
                "<", ">", "-", "="
        } and character.isdigit() is False and is_symbol(character):
            self._is_current_word_bad = True
            self._buffer += character

예제 #4

파일 보기

    def feed(self, character: str) -> None:
        self._character_count += 1

        if is_accentuated(character):
            self._accentuated_count += 1

예제 #5

파일 보기

파일: test_utils.py 프로젝트: google-cloud-sdk-unofficial/google-cloud-sdk

def test_is_accentuated(character, expected_is_accentuated):
    assert (is_accentuated(character) is
            expected_is_accentuated), "is_accentuated behavior incomplete"