Python craw 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: blog_spider

메소드/함수: craw

hotexamples.com에서의 예제들: 4

Python craw - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 blog_spider.craw에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: 02producer_consumer_spider.py 프로젝트: xinggevip/scrapyDemo01

def do_craw(url_queue:queue.Queue,html_queue:queue.Queue):
    while True:
        url = url_queue.get()
        html = blog_spider.craw(url)
        html_queue.put(html)
        print(threading.current_thread().name,f"craw {url}","url_queue.size=",url_queue.qsize())
        time.sleep(random.randint(1,2))

예제 #2

파일 보기

파일: 01threadtest.py 프로젝트: xinggevip/scrapyDemo01

def single_thread():
    print("single_thread start")
    for url in blog_spider.urls:
        print(url)
        html = blog_spider.craw(url)
        # res = blog_spider.parse(html)
        # print(res)
    print("single_thread end")

예제 #3

파일 보기

파일: 01.multi_thread_craw.py 프로젝트: persional0524/pythonAlgrothmLiu

def single_thread():
    print("single_thread begin:")
    for url in blog_spider.urls:
        blog_spider.craw(url)
    print("single_thread end:")

예제 #4

파일 보기

import gevent.monkey

gevent.monkey.patch_all()

import gevent
import blog_spider
import time

begin = time.time()
for url in blog_spider.urls:
    blog_spider.craw(url)
end = time.time()
print("single thread, cost = ", end - begin)

begin = time.time()
tasks = [gevent.spawn(blog_spider.craw, url) for url in blog_spider.urls]
gevent.joinall(tasks)
end = time.time()
print("gevent, cost = ", end - begin)