Python PyppeteerRequestの例

プログラミング言語: Python

名前空間/パッケージ名: gerapy_pyppeteer

クラス/型: PyppeteerRequest

hotexamples.comのコード掲載数: 8

Python PyppeteerRequest - 8件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのgerapy_pyppeteer.PyppeteerRequestの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

PyppeteerRequest(1)

よく使われるメソッド

PyppeteerRequest (1)

コード例 #1

ファイルを表示

 def start_requests(self):
     for page in range(1, self.max_page + 1):
         url = self.base_url.format(page=page)
         # yield scrapy.Request(url,callback=self.parse)
         yield PyppeteerRequest(url,
                                callback=self.parse_index,
                                wait_for='.item .name')

コード例 #2

ファイルを表示

ファイル: book.py プロジェクト: fakegit/GerapyPyppeteer

 def start_requests(self):
     """
     first page
     :return:
     """
     start_url = f'{self.base_url}/page/1'
     logger.info('crawling %s', start_url)
     yield PyppeteerRequest(start_url, callback=self.parse_index, wait_for='.item .name')

コード例 #3

ファイルを表示

ファイル: book.py プロジェクト: fakegit/GerapyPyppeteer

    def parse_index(self, response):
        """
        extract books and get next page
        :param response:
        :return:
        """
        items = response.css('.item')
        for item in items:
            href = item.css('.top a::attr(href)').extract_first()
            detail_url = response.urljoin(href)
            yield PyppeteerRequest(detail_url, callback=self.parse_detail, wait_for='.item .name')

        # next page
        match = re.search(r'page/(\d+)', response.url)
        if not match:
            return
        page = int(match.group(1)) + 1
        next_url = f'{self.base_url}/page/{page}'
        yield PyppeteerRequest(next_url, callback=self.parse_index, wait_for='.item .name')

コード例 #4

ファイルを表示

ファイル: movie.py プロジェクト: yupengyan/GerapyPyppeteer

 def parse_index(self, response):
     """
     extract movies
     :param response:
     :return:
     """
     items = response.css('.item')
     for item in items:
         href = item.css('a::attr(href)').extract_first()
         detail_url = response.urljoin(href)
         logger.info('detail url %s', detail_url)
         yield PyppeteerRequest(detail_url, callback=self.parse_detail, wait_for='.item')

コード例 #5

ファイルを表示

ファイル: movie.py プロジェクト: yupengyan/GerapyPyppeteer

 def start_requests(self):
     """
     first page
     :return:
     """
     for page in range(1, self.max_page + 1):
         url = f'{self.base_url}/page/{page}'
         logger.debug('start url %s', url)
         cookies = {
             'name': 'germey'
         }
         yield PyppeteerRequest(url, callback=self.parse_index, priority=10, wait_for='.item', pretend=True, cookies=cookies)

コード例 #6

ファイルを表示

ファイル: pretend_test.py プロジェクト: fakegit/GerapyPyppeteer

 def start_requests(self):
     url = 'https://bot.sannysoft.com/'
     yield PyppeteerRequest(url=url,
                            callback=self.parse_index,
                            pretend=True,
                            screenshot=False)

コード例 #7

ファイルを表示

ファイル: sports.py プロジェクト: yupengyan/GerapyPyppeteer

 def start_requests(self):
     for url in self.start_urls:
         yield PyppeteerRequest(url,
                                callback=self.parse_index,
                                pretend=False)

コード例 #8

ファイルを表示

 def start_requests(self):
     for page in range(1, self.max_page + 1):
         url = self.base_url.format(page=page)
         yield PyppeteerRequest(url=url, callback=self.parse_index)