Python decodeHtml Beispiele

Programmiersprache: Python

Namespace / Paketname: crawler.utils.charset

Methode / Funktion: decodeHtml

Beispiele auf hotexamples.com: 3

Python decodeHtml - 3 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die crawler.utils.charset.decodeHtml, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

Datei: ConfigSpider.py Projekt: huangpanxx/POAS

 def extract_and_fill(self, item, data):
     html = decodeHtml(data) #转换到utf8编码
     info = parseHtml(html) #解析
     
     item['publish_datetime'] = info['datetime']
     item['title'] = info['title']
     item['content'] = info['text']

Beispiel #2

Datei anzeigen

Datei: SinaSpider.py Projekt: huangpanxx/POAS

    def parse_detail(self, response):

        url = response.url
        item = CrawlItem(
            url=url, site=self.site_name, crawl_datetime=datetime.datetime.now(), uuid=hashlib.md5(url).hexdigest()
        )

        # 数据
        data = response.body

        # 转换到utf8编码
        html = decodeHtml(data)

        # 解析
        info = parseHtml(html)
        item["publish_datetime"] = info["datetime"]
        item["title"] = info["title"]
        item["content"] = info["text"]

        return item

Beispiel #3

Datei anzeigen

Datei: news_extractor.py Projekt: huangpanxx/POAS

 def getHtml(url):
     opener = urllib2.urlopen(url)
     data = opener.read()
     html = decodeHtml(data)
     return html