Python craw примеры использования

Язык программирования: Python

Пространство имен/Пакет: blog_spider

Метод/Функция: craw

Примеров на hotexamples.com: 4

Python craw - 4 примера найдено. Это лучшие примеры Python кода для blog_spider.craw, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: 02producer_consumer_spider.py Проект: xinggevip/scrapyDemo01

def do_craw(url_queue:queue.Queue,html_queue:queue.Queue):
    while True:
        url = url_queue.get()
        html = blog_spider.craw(url)
        html_queue.put(html)
        print(threading.current_thread().name,f"craw {url}","url_queue.size=",url_queue.qsize())
        time.sleep(random.randint(1,2))

Пример #2

Показать файл

Файл: 01threadtest.py Проект: xinggevip/scrapyDemo01

def single_thread():
    print("single_thread start")
    for url in blog_spider.urls:
        print(url)
        html = blog_spider.craw(url)
        # res = blog_spider.parse(html)
        # print(res)
    print("single_thread end")

Пример #3

Показать файл

Файл: 01.multi_thread_craw.py Проект: persional0524/pythonAlgrothmLiu

def single_thread():
    print("single_thread begin:")
    for url in blog_spider.urls:
        blog_spider.craw(url)
    print("single_thread end:")

Пример #4

Показать файл

import gevent.monkey

gevent.monkey.patch_all()

import gevent
import blog_spider
import time

begin = time.time()
for url in blog_spider.urls:
    blog_spider.craw(url)
end = time.time()
print("single thread, cost = ", end - begin)

begin = time.time()
tasks = [gevent.spawn(blog_spider.craw, url) for url in blog_spider.urls]
gevent.joinall(tasks)
end = time.time()
print("gevent, cost = ", end - begin)