Python HtmlDownloader 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: HtmlDownload

클래스/타입: HtmlDownloader

hotexamples.com에서의 예제들: 5

Python HtmlDownloader - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 HtmlDownload.HtmlDownloader에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

HtmlDownloader(2)

download(2)

save_fig(1)

자주 사용되는 메소드들

HtmlDownloader (2)

download (2)

save_fig (1)

예제 #1

파일 보기

파일: beautiful_face.py 프로젝트: Hanbearhug/GAN

class FaceSpider:
    def __init__(self):
        self.downloader = HtmlDownloader()
        self.urlmanager = UrlManager()

    def crawl(self, path):
        url = self.urlmanager.img_urls
        self.downloader.save_fig(url, path)

예제 #2

파일 보기

    def parse(self, url):
        response = HtmlDownloader.download(url)

        tree = etree.HTML(response)
        nodes = tree.xpath("//td/text()")

        txt = ""
        for count in range(len(nodes)):
            if (count % 7 == 0):
                txt = txt + "('" + nodes[count] + "'"
                txt = txt + ",'" + nodes[count + 1] + "'"
                txt = txt + ",'" + nodes[count + 3] + "'),"
        txt = txt[:-1]
        sql = "insert into iprecord(ip,port,protocol) values" + txt
        print(sql)
        self.db.execute(sql)

예제 #3

파일 보기

파일: MenetSpider.py 프로젝트: Hanbearhug/multiprocess-spider

class MenetSpider:
    def __init__(self):
        self.downloader = HtmlDownloader()
        self.urlmanager = UrlManager()
        self.parser = HtmlParser()
        self.output = DataOutput()

    def crawl(self, i):
        try:
            print(f"Process {i} is running")
            url = self.urlmanager.get_new_url(i)
            html = self.downloader.download(url)
            data = self.parser.parser(html)
            return data
        except:
            print(f"crawl failed at {i}")
            return pd.DataFrame([0, 0, 0, 0, 0, 0, 0, 0, 0],
                                columns=[
                                    '编码', "药品名称", "生产企业", "批文文号", "商品名", "剂型",
                                    "规格", "进口国产", "批准日期"
                                ])

예제 #4

파일 보기

파일: beautiful_face.py 프로젝트: Hanbearhug/GAN

 def __init__(self):
     self.downloader = HtmlDownloader()
     self.urlmanager = UrlManager()

예제 #5

파일 보기

파일: MenetSpider.py 프로젝트: Hanbearhug/multiprocess-spider

 def __init__(self):
     self.downloader = HtmlDownloader()
     self.urlmanager = UrlManager()
     self.parser = HtmlParser()
     self.output = DataOutput()