Python DataItem 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: data.items

클래스/타입: DataItem

hotexamples.com에서의 예제들: 8

Python DataItem - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 data.items.DataItem에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DataItem(8)

자주 사용되는 메소드들

DataItem (8)

예제 #1

파일 보기

파일: Spider14.py 프로젝트: AbdullahRehmat/reSearch

    def parse(self, response):
        scrapedData = Selector(response).css('a.articleTitleListSmall')

        for data in scrapedData:
            item = DataItem()
            item['title'] = data.css('a.articleTitleListSmall::text').get(),
            item['source'] = 'IslamJesus.ws - Article - Abu Iyyad',
            item['url'] = data.css('a.articleTitleListSmall::attr(href)').get()
            yield item

예제 #2

파일 보기

    def parse(self, response):
        scrapedData = Selector(response).css('a.articleLinkOrange')

        for data in scrapedData:
            item = DataItem()
            item['title'] = data.css('a.articleLinkOrange::text').get(),
            item['source'] = 'HealthyMuslim.com - Article - Abu Iyyad',
            item['url'] = data.css('a.articleLinkOrange::attr(href)').get()
            yield item

예제 #3

파일 보기

파일: get_data.py 프로젝트: albertow14/gsheet

    def parse(self, response):
        items = DataItem()
        items['title'] = response.xpath(
            '//h3[@class="info-name"]/a[1]/@title').extract()
        items['precio'] = response.xpath(
            '//div[@class="product-price "]/span[1]/text()').extract()
        save(items)

        yield items

예제 #4

파일 보기

파일: Spider22.py 프로젝트: AbdullahRehmat/reSearch

    def parse(self, response):
        scrapedData = Selector(response).css('a.uk-link-reset')

        for data in scrapedData:
            item = DataItem()
            item['title'] = data.css('a.uk-link-reset::text').get(),
            item['source'] = 'Salafi Publications - Article',
            item['url'] = "https://www.salafipubs.com/" + \
                data.css('a.uk-link-reset::attr(href)').get()
            yield item

예제 #5

파일 보기

파일: Spider23.py 프로젝트: AbdullahRehmat/reSearch

    def parse(self, response):
        scrapedData = Selector(response).css('h3.mh-posts-list-title')

        for data in scrapedData:
            item = DataItem()
            item['title'] = data.css(
                'h3.mh-posts-list-title > a::attr(title)').get(),
            item['source'] = 'Salafi Sounds - Audio',
            item['url'] = data.css(
                'h3.mh-posts-list-title > a::attr(href)').get()
            yield item

예제 #6

파일 보기

 def parse_datasets(self, response):
     xpath = "//td[1]/p[1]/span[2]/a[1]/@href"
     subSelector = response.xpath(xpath)
     preurl = "http://archive.ics.uci.edu/ml"
     for sub in subSelector:
         item = sub.get()
         url = preurl + item.replace("..", "")
         ditem = DataItem()
         ditem["tmpurl"] = url
         yield scrapy.Request(url,
                              meta={"dataitem": ditem},
                              callback=self.parse_downloads)

예제 #7

파일 보기

 def parse(self, response):
     for rep in response.css('li.public'):
         item = DataItem()
         item['name'] = rep.xpath(
             './/a[@itemprop="name codeRepository"]/text()').re_first(
                 r'\n\s*(.*)')
         item['update_time'] = rep.xpath(
             './/relative-time/@datetime').extract_first()
         data_url = response.urljoin(
             rep.xpath('.//h3/a/@href').extract_first())
         request = scrapy.Request(data_url, callback=self.parse_data)
         request.meta['item'] = item
         yield request

예제 #8

파일 보기

파일: dataSpider.py 프로젝트: mylove1/Crawler-1

    def parse(self, response):
        content = '//div[@class="content"]/article'
        items = []
        for con in response.xpath(content):
            item = DataItem()
            item['module'] = response.xpath(
                '//div[@class="content"]/h1/strong/a/text()').extract()
            item['title'] = con.xpath('h2/a/text()').extract()
            item['note'] = con.xpath('p[@class="note"]/text()').extract()
            item['more'] = con.xpath('p[@class="more"]/a/@href').extract()
            items.append(item)
            yield scrapy.http.Request(item['more'][0],
                                      meta={'item': item},
                                      callback=self.parse2)

            nextPage = response.xpath(
                '//li[@class="next-page"]/a/@href').extract()
            if nextPage:
                next = nextPage[0]
                yield scrapy.http.Request(next, callback=self.parse)