Python Spider.close Examples

Programming Language: Python

Namespace/Package Name: Spider

Class/Type: Spider

Method/Function: close

Examples at hotexamples.com: 2

Python Spider.close - 2 examples found. These are the top rated real world Python examples of Spider.Spider.close extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Spider(30)

__init__(5)

crawl(4)

run(3)

crawl_page(3)

get_page(2)

scapy(2)

getContent(2)

insert_jobs(1)

load_users(1)

main(1)

make_request(1)

modify_data(1)

modify_grade(1)

search_cite_papers(1)

printProblems(1)

queryMatrixProblems(1)

hrefFor2018(1)

queryProblems(1)

read_library(1)

status_crawl(1)

serialFetchAllProblems(1)

runSpider(1)

parallelFetchAllProblems(1)

get_my_follower(1)

getdoc(1)

crawl_url(1)

adapt_job_city(1)

alive(1)

analyze_jobs(1)

associate_key_and_job(1)

close(1)

contentOfArtical(1)

crawlPlayer(1)

crawl_error_user(1)

crawler_data(1)

get_page_count(1)

crawling(1)

crawljobs(1)

deleteDatabase(1)

enable_collection(1)

getData(1)

getItemsCount(1)

get_my_fans(1)

Start(1)

user_crawl(1)

Example #1

Show file

File: main.py Project: MosaicHe/cl_spider

import aiohttp

from Spider import Request
from Spider import Spider
import PageParse
import argparse

ARGS = argparse.ArgumentParser(description="caoliu spider")
ARGS.add_argument("--pages", action='store', type=int,
                  default=1, help='Limit page to spider')
ARGS.add_argument("--max_tries", action='store', type=int,
                  default=30, help='Limit retries on network errors')
ARGS.add_argument("--root_dir", action='store',
                  default='./download', help='directory store picture and torrent')
ARGS.add_argument("--max_tasks", action='store', type=int,
                  default=20, help='Limit concurrent connections')

ROOT_DIR = "/media/mosaic/软件/git-myspider/cl_spider/source/"

args = ARGS.parse_args()

loop = asyncio.get_event_loop()
spider = Spider(max_tries=args.max_tries, max_tasks=args.max_tasks)
PageParse.start(spider, 1, args.pages+1,  root_dir=args.root_dir)
loop.run_until_complete(spider.spider())
spider.close()
loop.stop()
loop.run_forever()
loop.close()

Example #2

Show file

File: PageParse.py Project: wuxiongwei/cl_spider

    def __init__(self, spider, url, path, params=None):
        self.path = path
        Request.__init__(self,
                         spider=spider,
                         url=url,
                         params=params,
                         content_type="binary")

    def handle_func(self, content):
        with open(self.path, "wb") as f:
            f.write(content)
            print("%s============>下载完成!" % (self.path))


def start(spider, start_page=1, end_page=2, root_dir="./"):
    print("enter %s" % root_dir)
    os.chdir(root_dir)
    for i in range(start_page, end_page)[::-1]:
        request = IndexPageRequest(spider, CL_URL % i)


if __name__ == "__main__":
    loop = asyncio.get_event_loop()
    spider = Spider(page_num=5, max_tries=30, max_tasks=20, rootDir='./source')
    request = IndexPageRequest(spider, CL_URL % 1)
    loop.run_until_complete(spider.spider())
    spider.close()
    loop.stop()
    loop.run_forever()
    loop.close()