Python guessBytesCharsetの例

プログラミング言語: Python

名前空間/パッケージ名: hachoir.core.i18n

メソッド/関数: guessBytesCharset

hotexamples.comのコード掲載数: 6

Python guessBytesCharset - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのhachoir.core.i18n.guessBytesCharsetの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

    def _convertText(self, text):
        if not self._charset:
            # charset is still unknown: guess the charset
            self._charset = guessBytesCharset(text, default=FALLBACK_CHARSET)

        # Try to convert to Unicode
        try:
            return str(text, self._charset, "strict")
        except UnicodeDecodeError as exc:
            err = exc

        # --- Conversion error ---

        # Fix truncated UTF-16 string like 'B\0e' (3 bytes)
        # => Add missing nul byte: 'B\0e\0' (4 bytes)
        if err.reason == "truncated data" \
                and err.end == len(text) \
                and self._charset == "UTF-16-LE":
            try:
                text = str(text + b"\0", self._charset, "strict")
                self.warning("Fix truncated %s string: add missing nul byte" %
                             self._charset)
                return text
            except UnicodeDecodeError:
                pass

        # On error, use FALLBACK_CHARSET
        self.warning("Unable to convert string to Unicode: %s" % err)
        return str(text, FALLBACK_CHARSET, "strict")

コード例 #2

ファイルを表示

ファイル: string_field.py プロジェクト: JackDandy/SickGear

    def _convertText(self, text):
        if not self._charset:
            # charset is still unknown: guess the charset
            self._charset = guessBytesCharset(text, default=FALLBACK_CHARSET)

        # Try to convert to Unicode
        try:
            return unicode(text, self._charset, "strict")
        except UnicodeDecodeError as err:
            pass

        # --- Conversion error ---

        # Fix truncated UTF-16 string like 'B\0e' (3 bytes)
        # => Add missing nul byte: 'B\0e\0' (4 bytes)
        if err.reason == "truncated data" \
                and err.end == len(text) \
                and self._charset == "UTF-16-LE":
            try:
                text = unicode(text + "\0", self._charset, "strict")
                self.warning("Fix truncated %s string: add missing nul byte" % self._charset)
                return text
            except UnicodeDecodeError, err:
                pass

コード例 #3

ファイルを表示

 def _guessCharset(self):
     addr = self.absolute_address + self._content_offset * 8
     bytes = self._parent.stream.readBytes(addr, self._content_size)
     return guessBytesCharset(bytes, default=FALLBACK_CHARSET)

コード例 #4

ファイルを表示

def guessStreamCharset(stream, address, size, default=None):
    size = min(size, 1024 * 8)
    bytes = stream.readBytes(address, size // 8)
    return guessBytesCharset(bytes, default)

コード例 #5

ファイルを表示

ファイル: string_field.py プロジェクト: JackDandy/SickGear

 def _guessCharset(self):
     addr = self.absolute_address + self._content_offset * 8
     bytes = self._parent.stream.readBytes(addr, self._content_size)
     return guessBytesCharset(bytes, default=FALLBACK_CHARSET)

コード例 #6

ファイルを表示

ファイル: input_helper.py プロジェクト: JackDandy/SickGear

def guessStreamCharset(stream, address, size, default=None):
    size = min(size, 1024 * 8)
    bytes = stream.readBytes(address, size // 8)
    return guessBytesCharset(bytes, default)