Python ComicItem.ComicItem 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: cartoon.items

클래스/타입: ComicItem

메소드/함수: ComicItem

hotexamples.com에서의 예제들: 3

Python ComicItem.ComicItem - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 cartoon.items.ComicItem.ComicItem에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ComicItem(3)

자주 사용되는 메소드들

ComicItem (3)

예제 #1

파일 보기

파일: comic_spider.py 프로젝트: zlszhonglongshen/spider

 def parse1(self, response):
     hxs = Selector(response)
     items = []
     # 章节链接地址
     urls = hxs.xpath('//dd/a[1]/@href').extract()
     # 章节名
     dir_names = hxs.xpath('//dd/a[1]/text()').extract()
     # 保存章节链接和章节名
     for index in range(len(urls)):
         item = ComicItem()
         item['link_url'] = self.server_link + urls[index]
         item['dir_name'] = dir_names[index]
         items.append(item)
     #根据每个章节的链接，发送request请求，并传递item参数
     for item in items[-13:-1]:
         yield scrapy.Request(url=item['link_url'], meta={'item': item}, callback=self.parse2)

예제 #2

파일 보기

파일: comic_spider.py 프로젝트: jsdnhk/python-spider-china

    def parse1(self, response):
        hxs = Selector(response)
        items = []
        #章節鏈接地址
        urls = hxs.xpath('//dd/a[1]/@href').extract()
        #章節名
        dir_names = hxs.xpath('//dd/a[1]/text()').extract()
        #保存章節鏈接和章節名
        for index in range(len(urls)):
            item = ComicItem()
            item['link_url'] = self.server_link + urls[index]
            item['dir_name'] = dir_names[index]
            items.append(item)

        #根據每個章節的鏈接，發送Request請求，並傳遞item參數
        for item in items:
            yield scrapy.Request(url=item['link_url'],
                                 meta={'item': item},
                                 callback=self.parse2)

예제 #3

파일 보기

파일: comic_spider.py 프로젝트: chudeyang0225/cartoon

    def parse1(self, response):
        hxs = Selector(response)
        items = []
        # 章节链接地址
        urls = hxs.xpath('//dd/a[1]/@href').extract()
        # 章节名
        dir_names = hxs.xpath('//dd/a[1]/text()').extract()
        # 保存章节链接和章节名
        for index in range(len(urls)):
            item = ComicItem()
            item['link_url'] = self.server_link + urls[index]
            item['dir_name'] = dir_names[index].replace(" ", "_")
            items.append(item)
        # Find last downloaded file name, then download newly published episode
        print('Current file amount: '+str(len(items)))
        print('Index of last update: '+lastlen)
        with open (BASE_DIR+'/logg.txt','w') as w:
            w.write(str(len(items)))

        # 根据每个章节的链接，发送Request请求，并传递item参数
        for item in items[int(lastlen):]:
            print(item['dir_name'])
            yield scrapy.Request(url=item['link_url'], meta={'item': item}, callback=self.parse2)