Python WebCrawler.create_worker 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: web_crawler

클래스/타입: WebCrawler

메소드/함수: create_worker

hotexamples.com에서의 예제들: 4

Python WebCrawler.create_worker - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 web_crawler.WebCrawler.create_worker에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

WebCrawler(20)

create_worker(4)

create_master(2)

compute_ranks(1)

crawl_page(1)

crawl_web(1)

get_page_contents(1)

get_page_request_object(1)

get_products_urls(1)

is_outgoing(1)

prepare_link(1)

proc_chkupdate(1)

예제 #1

파일 보기

파일: web_crawler_test_3_supersurfer.py 프로젝트: OceanVision/ocean

import sys
import time

sys.path.append("../web_crawler")
from web_crawler import WebCrawler

sys.path.append("..")
from privileges import construct_full_privilege, privileges_bigger_or_equal


master_crawler = WebCrawler.create_master (
    privileges = construct_full_privilege(),
    start_url = "http://antyweb.pl/"
)


WebCrawler.create_worker (
    privileges = construct_full_privilege(),
    master = master_crawler,
    max_internal_expansion = 5,
    max_external_expansion = 3,
    max_crawling_depth = 100,
)

master_crawler.run()

time.sleep(60*60*24*3)
master_crawler.terminate()

예제 #2

파일 보기

파일: web_crawler_test_1_rss_wp.py 프로젝트: OceanVision/ocean

"""

import sys
import time

sys.path.append("../web_crawler")
from web_crawler import WebCrawler

sys.path.append("..")
from privileges import construct_full_privilege, privileges_bigger_or_equal


master_crawler = WebCrawler.create_master (
    privileges = construct_full_privilege(),
    start_url = "http://rss.wp.pl/"
)


WebCrawler.create_worker (
    master = master_crawler,
    privileges = construct_full_privilege(),
    max_internal_expansion = 10,
    max_database_updates = 10
)

master_crawler.run()

time.sleep(120)
master_crawler.terminate()

예제 #3

파일 보기

파일: web_crawler_exporter.py 프로젝트: OceanVision/ocean

print 'Output will be APPENDED to file named ' + EXPORT_FILE + '\n'

if len(sys.argv) == 1:
    exit()

master_crawler = WebCrawler.create_master (
    privileges = construct_full_privilege(),
    start_url = str(sys.argv[1]),
)

WebCrawler.create_worker (
    privileges = construct_full_privilege(),
    master = master_crawler,
    max_external_expansion = 1000,
    max_internal_expansion = 4,
    max_crawling_depth = 3,
    list_export = True,
    export_dicts = True,
    export_file = EXPORT_FILE,
)

master_crawler.run()

while master_crawler.is_working():
    time.sleep(1)

master_crawler.terminate()
time.sleep(2)

예제 #4

파일 보기

파일: web_crawler_test_2_wykop.py 프로젝트: OceanVision/ocean

This test precisely explores www.wykop.pl in search for RSS feeds.
"""

import sys
import time

sys.path.append("../web_crawler")
from web_crawler import WebCrawler

sys.path.append("..")
from privileges import construct_full_privilege, privileges_bigger_or_equal


master_crawler = WebCrawler.create_master (
    privileges = construct_full_privilege(),
    start_url = "http://www.wykop.pl/"
)


WebCrawler.create_worker (
    privileges = construct_full_privilege(),
    master = master_crawler,
    max_crawling_depth = 3
)

master_crawler.run()

time.sleep(60*60*24*3)
master_crawler.terminate()