Python resolve_encoding примеры использования

Язык программирования: Python

Пространство имен/Пакет: w3lib.encoding

Метод/Функция: resolve_encoding

Примеров на hotexamples.com: 15

Python resolve_encoding - 15 примеров найдено. Это лучшие примеры Python кода для w3lib.encoding.resolve_encoding, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: text.py Проект: AugustLONG/scrapy

 def _auto_detect_fun(self, text):
     for enc in (self._DEFAULT_ENCODING, 'utf-8', 'cp1252'):
         try:
             text.decode(enc)
         except UnicodeError:
             continue
         return resolve_encoding(enc)

Пример #2

Показать файл

 def _auto_detect_fun(self, text):
     for enc in (self._DEFAULT_ENCODING, 'utf-8', 'cp1252'):
         try:
             text.decode(enc)
         except UnicodeError:
             continue
         return resolve_encoding(enc)

Пример #3

Показать файл

Файл: text.py Проект: CzaOrz/sourceCodeLearning

 def _auto_detect_fun(self, text):
     for enc in (self._DEFAULT_ENCODING, 'utf-8', 'cp1252'):
         try:
             text.decode(enc)
         except UnicodeError:
             continue
         # print('!!!!!!!!', enc)
         return resolve_encoding(
             enc)  # todo, whats? how do you kill my encoding?

Пример #4

Показать файл

def _detect_encoding(bytestring, default_encoding='utf-8'):
    # NOTE: alternatively `UnicodeDammit(x).originalEncoding`
    # NOTE: alternatively use scrapy.http.TextResponse().text
    encoding = chardet.detect(bytestring).get('encoding')
    if encoding:
        # TODO: `resolve_encoding`?
        return resolve_encoding(encoding)
    else:
        return default_encoding

Пример #5

Показать файл

Файл: text.py Проект: wusy1209/scrapy

    def _auto_detect_fun(self, text):
        for enc in (self._DEFAULT_ENCODING, 'utf-8', 'ascii', 'GB18030'):
            try:
                text.decode(enc)
            except UnicodeError:
                continue
            return resolve_encoding(enc)

        #detect by chardet by wsy
        cc = chardet.detect(text)
        if cc is None:
            return
        enc = cc.get('encoding', None)
        if enc is None:
            return
        try:
            text.decode(enc)
        except:
            return None
        else:
            return resolve_encoding(enc)

Пример #6

Показать файл

Файл: test_downloadermiddleware_httpcompression.py Проект: ArturGaspar/scrapy

    def test_process_response_no_content_type_header(self):
        headers = {
            'Content-Encoding': 'identity',
        }
        plainbody = b"""<html><head><title>Some page</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312">"""
        respcls = responsetypes.from_args(url="http://www.example.com/index", headers=headers, body=plainbody)
        response = respcls("http://www.example.com/index", headers=headers, body=plainbody)
        request = Request("http://www.example.com/index")

        newresponse = self.mw.process_response(request, response, self.spider)
        assert isinstance(newresponse, respcls)
        self.assertEqual(newresponse.body, plainbody)
        self.assertEqual(newresponse.encoding, resolve_encoding('gb2312'))

Пример #7

Показать файл

    def test_process_response_no_content_type_header(self):
        headers = {
            'Content-Encoding': 'identity',
        }
        plainbody = b"""<html><head><title>Some page</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312">"""
        respcls = responsetypes.from_args(url="http://www.example.com/index", headers=headers, body=plainbody)
        response = respcls("http://www.example.com/index", headers=headers, body=plainbody)
        request = Request("http://www.example.com/index")

        newresponse = self.mw.process_response(request, response, self.spider)
        assert isinstance(newresponse, respcls)
        self.assertEqual(newresponse.body, plainbody)
        self.assertEqual(newresponse.encoding, resolve_encoding('gb2312'))

Пример #8

Показать файл

Файл: test_downloadermiddleware_httpcompression.py Проект: BillWangCS/scrapy

    def test_process_response_force_recalculate_encoding(self):
        headers = {
            'Content-Type': 'text/html',
            'Content-Encoding': 'gzip',
        }
        f = BytesIO()
        plainbody = b"""<html><head><title>Some page</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312">"""
        zf = GzipFile(fileobj=f, mode='wb')
        zf.write(plainbody)
        zf.close()
        response = HtmlResponse("http;//www.example.com/page.html", headers=headers, body=f.getvalue())
        request = Request("http://www.example.com/")

        newresponse = self.mw.process_response(request, response, self.spider)
        assert isinstance(newresponse, HtmlResponse)
        self.assertEqual(newresponse.body, plainbody)
        self.assertEqual(newresponse.encoding, resolve_encoding('gb2312'))

Пример #9

Показать файл

    def test_process_response_force_recalculate_encoding(self):
        headers = {
            'Content-Type': 'text/html',
            'Content-Encoding': 'gzip',
        }
        f = BytesIO()
        plainbody = b"""<html><head><title>Some page</title><meta http-equiv="Content-Type" content="text/html; charset=gb2312">"""
        zf = GzipFile(fileobj=f, mode='wb')
        zf.write(plainbody)
        zf.close()
        response = HtmlResponse("http;//www.example.com/page.html", headers=headers, body=f.getvalue())
        request = Request("http://www.example.com/")

        newresponse = self.mw.process_response(request, response, self.spider)
        assert isinstance(newresponse, HtmlResponse)
        self.assertEqual(newresponse.body, plainbody)
        self.assertEqual(newresponse.encoding, resolve_encoding('gb2312'))

Пример #10

Показать файл

    def test_process_response_encoding_inside_body(self):
        headers = {
            'Content-Type': 'text/html',
            'Content-Encoding': 'gzip',
        }
        f = BytesIO()
        plainbody = (
            b'<html><head><title>Some page</title>'
            b'<meta http-equiv="Content-Type" content="text/html; charset=gb2312">'
        )
        zf = GzipFile(fileobj=f, mode='wb')
        zf.write(plainbody)
        zf.close()
        response = Response("http;//www.example.com/",
                            headers=headers,
                            body=f.getvalue())
        request = Request("http://www.example.com/")

        newresponse = self.mw.process_response(request, response, self.spider)
        assert isinstance(newresponse, HtmlResponse)
        self.assertEqual(newresponse.body, plainbody)
        self.assertEqual(newresponse.encoding, resolve_encoding('gb2312'))
        self.assertStatsEqual('httpcompression/response_count', 1)
        self.assertStatsEqual('httpcompression/response_bytes', 104)

Пример #11

Показать файл

 def _assert_response_encoding(self, response, encoding):
     self.assertEqual(response.encoding, resolve_encoding(encoding))

Пример #12

Показать файл

Файл: test_http_response.py Проект: elkingtowa/pyrake

 def _assert_response_encoding(self, response, encoding):
     self.assertEqual(response.encoding, resolve_encoding(encoding))

Пример #13

Показать файл

Файл: test_encoding.py Проект: azizur77/w3lib

 def test_resolve_encoding(self):
     self.assertEqual(resolve_encoding('latin1'), 'cp1252')
     self.assertEqual(resolve_encoding(' Latin-1'), 'cp1252')
     self.assertEqual(resolve_encoding('gb_2312-80'), 'gb18030')
     self.assertEqual(resolve_encoding('unknown encoding'), None)

Пример #14

Показать файл

Файл: test_encoding.py Проект: Dior222/w3lib

 def test_resolve_encoding(self):
     self.assertEqual(resolve_encoding('latin1'), 'cp1252')
     self.assertEqual(resolve_encoding(' Latin-1'), 'cp1252')
     self.assertEqual(resolve_encoding('gb_2312-80'), 'gb18030')
     self.assertEqual(resolve_encoding('unknown encoding'), None)

Пример #15

Показать файл

 def test_resolve_encoding(self):
     self.assertEqual(resolve_encoding("latin1"), "cp1252")
     self.assertEqual(resolve_encoding(" Latin-1"), "cp1252")
     self.assertEqual(resolve_encoding("gb_2312-80"), "gb18030")
     self.assertEqual(resolve_encoding("unknown encoding"), None)