Esempi in Python per Request.info

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: scrapy.http

Classe/tipologia: Request

Metodo/funzione: info

Esempi su hotexamples.com: 4

Request.info in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per scrapy.http.Request.info, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Request(30)

dont_filter(19)

cookies(10)

callback(5)

_msj_category(4)

info(4)

errback(3)

copy(3)

city(1)

_meta(1)

current_page(1)

album_item(1)

album(1)

foldname(1)

add_header(1)

item(1)

item_title(1)

title(1)

url(1)

Esempio n. 1

Mostra file

File: fishingSpider.py Progetto: hedgehogBoby/beyebe-spider-hedgehogBoby

    def parse(self, response):

        try:
            bs4 = BeautifulSoup(response.text, 'html.parser')
            for li in bs4.select('li'):
                info = {}
                info['url'] = 'http://www.pearvideo.com/' + li.select_one("a")['href']
                info['thumbnail'] = li.select_one("img")['src']
                info['title'] = li.select_one("h2").text
                info['vdo-time'] = li.select_one("div[class=\"vdo-time\"]").text
                info['publish-time'] = li.select_one("div[class=\"publish-time\"]").text
                info['cont'] = li.select_one("div[class=\"cont\"]").text
                info['i-icon_col-name'] = li.select_one("a[class=\"i-icon col-name\"]").text
                info['i-icon_like-num'] = li.select_one("span[class=\"i-icon like-num\"]").text

                # 发布新任务
                request = Request(url=info['url'], callback=self.parse_item, priority=3)
                request.info = info
                yield request
        except:
            traceback.print_exc()
        finally:
            print("正在添加新任务至队列头部")
            request = Request(url=response.url, dont_filter=True)
            yield request
            self.sleepMyself()

Esempio n. 2

Mostra file

File: hotwordSpider.py Progetto: hedgehogBoby/beyebe-spider-hedgehogBoby

 def start_requests(self):
     for url in self.start_urls:
         if 'api.1sapp' in url:
             for i in range(10):
                 urlNow = url.replace('{page}', str(i + 1)).replace(
                     '{timeStamp}', str(int(time.time() * 1000)))
                 request = Request(url=urlNow)
                 request.info = {'page': i}
                 yield request
             continue
         yield Request(url=url)

Esempio n. 3

Mostra file

File: qutoutiaoSpider.py Progetto: hedgehogBoby/beyebe-spider-hedgehogBoby

    def parse(self, response):

        try:
            print(response.text)
            msgDict = json.loads(response.text)
            for data in msgDict['data']['data']:
                info = data
                info['fromSpider'] = '推荐流'
                request = Request(url=info['url'],
                                  priority=10,
                                  callback=self.parse_item)
                request.info = info
                yield request
        except:
            traceback.print_exc()
        finally:
            print("正在添加新任务至队列头部")
            request = Request(url=response.url, dont_filter=True)
            yield request
            self.sleepMyself()

Esempio n. 4

Mostra file

File: ydzxSpider.py Progetto: hedgehogBoby/beyebe-spider-hedgehogBoby

    def parse(self, response):

        try:
            print(response.text)
            bs4 = BeautifulSoup(response.text, 'html.parser')

            for li in bs4.select('li'):
                info = {}
                # 发布新任务
                request = Request(url=info['url'],
                                  callback=self.parse_item,
                                  priority=3)
                request.info = info
                yield request
        except:
            traceback.print_exc()
        finally:
            print("正在添加新任务至队列头部")
            request = Request(url=response.url, dont_filter=True)
            yield request
            self.sleepMyself()