Python ResponseParse.parse 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: cwaliexpress.parser.response_parser

클래스/타입: ResponseParse

메소드/함수: parse

hotexamples.com에서의 예제들: 3

Python ResponseParse.parse - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 cwaliexpress.parser.response_parser.ResponseParse.parse에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ResponseParse(2)

parse(2)

get_category_href(1)

get_items_from_pagenate(1)

parse_paginate(1)

submit_search(1)

예제 #1

파일 보기

파일: aliexpress_debug_spider.py 프로젝트: trujunzhang/djzhang-targets

class AliExpresssDebugSpider(scrapy.Spider):
    name = "aliexpress_debug"
    allowed_domains = ["aliexpress.com"]
    start_urls = [
        'http://www.aliexpress.com/af/macbook-pro.html?ltype=wholesale&amp;d=y&amp;origin=n&amp;isViewCP=y&amp;catId=0&amp;initiative_id=SB_20160520233312&amp;SearchText=macbook+pro',
    ]

    def __init__(self, name=None, **kwargs):
        from cwaliexpress.database_factory import DatabaseFactory, DatabaseTypes

        self._cache_db = DatabaseFactory.get_database(DatabaseTypes.cache,
                                                      kwargs['mongo_uri'])
        self._history_db = DatabaseFactory.get_database(
            DatabaseTypes.history, kwargs['mongo_uri'])

        from cwaliexpress.parser.response_parser import ResponseParse
        self._crawl_parser = ResponseParse()

        super(AliExpresssDebugSpider, self).__init__(name, **kwargs)

    @classmethod
    def from_crawler(cls, crawler, *args, **kwargs):
        return super(AliExpresssDebugSpider, cls).from_crawler(
            crawler, args, mongo_uri=crawler.settings.get('MONGODB_SERVER'))

    def parse(self, response):
        yield WebdriverRequest(response.url,
                               callback=self.parse_search_with_js)

    def parse_search_with_js(self, response):
        item = self._crawl_parser.parse(response.url, response)
        yield item

        self._history_db.process_item(response.url)

예제 #2

파일 보기

파일: aliexpress_debug_spider.py 프로젝트: trujunzhang/djzhang-targets

class AliExpresssDebugSpider(scrapy.Spider):
    name = "aliexpress_debug"
    allowed_domains = ["aliexpress.com"]
    start_urls = [
        'http://www.aliexpress.com/af/macbook-pro.html?ltype=wholesale&amp;d=y&amp;origin=n&amp;isViewCP=y&amp;catId=0&amp;initiative_id=SB_20160520233312&amp;SearchText=macbook+pro',
    ]

    def __init__(self, name=None, **kwargs):
        from cwaliexpress.database_factory import DatabaseFactory, DatabaseTypes

        self._cache_db = DatabaseFactory.get_database(DatabaseTypes.cache, kwargs['mongo_uri'])
        self._history_db = DatabaseFactory.get_database(DatabaseTypes.history, kwargs['mongo_uri'])

        from cwaliexpress.parser.response_parser import ResponseParse
        self._crawl_parser = ResponseParse()

        super(AliExpresssDebugSpider, self).__init__(name, **kwargs)

    @classmethod
    def from_crawler(cls, crawler, *args, **kwargs):
        return super(AliExpresssDebugSpider, cls).from_crawler(crawler,
                                                         args,
                                                         mongo_uri=crawler.settings.get('MONGODB_SERVER')
                                                         )

    def parse(self, response):
        yield WebdriverRequest(response.url, callback=self.parse_search_with_js)

    def parse_search_with_js(self, response):
        item = self._crawl_parser.parse(response.url, response)
        yield item

        self._history_db.process_item(response.url)

예제 #3

파일 보기

class AliExpresssSpider(scrapy.Spider):
    name = "aliexpress"
    allowed_domains = ["aliexpress.com"]
    start_urls = [
        'http://www.aliexpress.com/af/macbook-pro.html?ltype=wholesale&amp;d=y&amp;origin=n&amp;isViewCP=y&amp;catId=0&amp;initiative_id=SB_20160520233312&amp;SearchText=macbook+pro',
    ]

    def __init__(self, name=None, **kwargs):
        from cwaliexpress.database_factory import DatabaseFactory, DatabaseTypes

        self._cache_db = DatabaseFactory.get_database(DatabaseTypes.cache, kwargs['mongo_uri'])
        self._history_db = DatabaseFactory.get_database(DatabaseTypes.history, kwargs['mongo_uri'])

        from cwaliexpress.parser.response_parser import ResponseParse
        self._crawl_parser = ResponseParse()

        super(AliExpresssSpider, self).__init__(name, **kwargs)

    @classmethod
    def from_crawler(cls, crawler, *args, **kwargs):
        return super(AliExpresssSpider, cls).from_crawler(crawler,
                                                          args,
                                                          mongo_uri=crawler.settings.get('MONGODB_SERVER')
                                                          )

    def parse(self, response):
        self._crawl_parser.parse_paginate(response.url, response)

    def parse_detail(self, response):
        item = self._crawl_parser.parse(response.url, response)
        yield item

        yield scrapy.Request(item['cluster'], self.parse_cluster)

        # yield scrapy.Request(response.url, self.parse_relatived_app)

        # the below is that crawl a random relatived app.
        select = '//a[@class="card-click-target"]'
        sel = Selector(response)
        navs = sel.xpath(select)

        if not self._history_db.check_exist(abstractPath):
            yield scrapy.Request(abstractPath, self.parse_detail, meta={'type': title})