Python Selector.items Beispiele

Programmiersprache: Python

Namespace / Paketname: scrapy.selector

Klasse / Typ: Selector

Methode / Funktion: items

Beispiele auf hotexamples.com: 1

Python Selector.items - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die scrapy.selector.Selector.items, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Selector(30)

strip(30)

split(30)

css(30)

select(30)

replace(30)

extract(30)

re(30)

extract_first(19)

remove_namespaces(16)

index(9)

rstrip(9)

lstrip(9)

encode(8)

register_namespace(6)

find(5)

remove(4)

append(4)

startswith(3)

rindex(3)

extend(3)

get(3)

re_first(2)

getall(2)

lower(2)

pop(1)

partition(1)

extract_unquoted(1)

__getattribute__(1)

rfind(1)

items(1)

decode(1)

find_all(1)

group(1)

__len__(1)

title(1)

to_csv(1)

url(1)

Beispiel #1

Datei anzeigen

Datei: books.py Projekt: runhy/douban-spider

    def parse(self, response):
        i = FirstItemLoader(item=BooksItem(), response=response)
        i.add_value('id', get_md5(response.url))
        i.add_value('url', response.url)
        i.add_css('title', '#wrapper h1 span::text')
        info = Selector(response).css('#info').extract_first()
        info = value_to_dict(info)
        field_map = {
            '作者': 'author',
            '出品方': 'publisher',
            '原作名': 'org_name',
            '译者': 'translators',
            '出版年': 'publish_year',
            '页数': 'page_num',
            '定价': 'price',
            '装帧': 'framed',
            'ISBN': 'isbn',
            '出版社': 'publisher',
            '丛书': 'series',
            '副标题': 'subtitle'
        }
        for k, v in info.items():
            i.add_value(field_map[k], v)
        i.add_css('cover_path', '.nbg::attr(href)')
        i.add_css('rating_num', 'strong[class="ll rating_num "]::text')
        i.add_css('rating_people', '.rating_people span::text')
        i.add_xpath('desc', '//*[@id="link-report"]/span/div[1]')
        i.add_css('contents', '.related_info div:nth-child(4)::text')
        i.add_value('crawled_at', datetime.now())

        book_item = i.load_item()

        yield book_item

        # 根据页面的喜欢读... 提取其他书籍链接, 追踪爬取
        urls = Selector(response).css(
            '#db-rec-section div dl dt a::attr(href)').extract()
        for url in urls:
            yield SplashRequest(url, self.parse, args={'wait': 2})