Python Item.get 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: scrapy.item

클래스/타입: Item

메소드/함수: get

hotexamples.com에서의 예제들: 2

Python Item.get - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 scrapy.item.Item.get에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Item(30)

__init__(6)

add_xpath(3)

load_item(3)

get(2)

__str__(1)

clear(1)

fields(1)

예제 #1

파일 보기

파일: pipelines.py 프로젝트: apehex/gdpyr

    def process_item(
            self,
            item: Item,
            spider: Spider) -> Item:
        """
        Save the whole html page to a text file.

        Parameters
        ----------
        item: Item.
            The scraped item, ie the full web page + meta data.
        spider: Spider.
            The spider, one per document type.

        Returns
        -------
        out: Item.
            The input item, unscathed.
        """
        __provider = ''.join(item.get(
            'provider',
            ['none']))
        __text = ''.join(item.get(
            'text',
            ['']))
        __file_path = os.path.join(
            self._path,
            getattr(spider, 'name', 'default'),
            __provider + '.html')

        with open(__file_path, 'w') as __file:
            __file.write(__text)

        return item

예제 #2

파일 보기

 def process_item(self, item: Item, spider):
     item['title'] = item['title'].split()[0]
     if isinstance(item, CommentItem):
         self.collect2.insert_one(dict(item))
     elif isinstance(item, ReviewItem):
         if item.get('num', None):
             item['num'] = int(item['num'].split('.')[1])
             item['actor'] = ''.join(item['actor'].split())
         data = dict(item)
         self.collect.find_one_and_update({'title': item['title']},
                                          {'$set': data},
                                          upsert=True)
     return item