Python Item示例

编程语言: Python

命名空间/包名称: scrapy_plus.items

类/类型: Item

hotexamples.com的示例: 9

Python Item - 已找到9个示例。这些是从开源项目中提取的最受好评的scrapy_plus.items.Item现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Item(9)

常用方法

Item (9)

示例#1

显示文件

    def parse(self,response):
        # 设置编码方式为GBK
        response.encoding = 'GBK'

        # result=response.re_find_all('{channel\s*:\s*{title\s*:\s*"(.+?)",')
        print(response.url)
        return Item(response.url)

示例#2

显示文件

文件： spiders.py 项目： 952700/scrapy-plus

 def parse_detail(self, response):
     # 获取上一个解析函数传递过来的数据
     data = response.meta['data']
     data['movie_length'] = response.xpath(
         '//span[@property="v:runtime"]/text()')
     # 返回结果
     return Item(data)

示例#3

显示文件

文件： douban.py 项目： Kobe-love/basic11

 def parse(self, response):
     '''解析豆瓣电影top250列表页'''
     title_list = []  # 存储所有的
     for li in response.xpath("//ol[@class='grid_view']/li"):  # 遍历每一个li标签
         title = li.xpath(
             ".//span[@class='title'][1]/text()")  # 提取该li标下的 标题
         title_list.append(title[0])
     yield Item(title_list)

示例#4

显示文件

    def parse(self, response):
        # item = {}
        # item['title'] = response.xpath("//head/title/text()")[0]
        # yield Item(item)

        node_list = response.xpath("//div[@class='hd']")[:3]
        for node in node_list:
            item = {}
            item['page_title'] = node.xpath("./a/span/text()")[0]
            item['page_link'] = node.xpath("./a/@href")[0]
            # Item数据，交给管道
            yield Item(item)

示例#5

显示文件

文件： douban.py 项目： chenxiao17301/MySpiderProject

    def parse(self, response):
        # item = {}
        # item['title'] = response.xpath("//head/title/text()")[0]
        # yield Item(item)

        node_list = response.xpath("//div[@class='hd']")[:3]
        for node in node_list:
            item = {}
            item['page_title'] = node.xpath("./a/span/text()")[0]
            item['page_link'] = node.xpath("./a/@href")[0]
            # Item数据，交给管道
            yield Item(item)
            # Request对象，Engine发送，并由指定的回调函数parse_page解析
            yield Request(item['page_link'], callback="parse_page")

示例#6

显示文件

文件： douban.py 项目： chenxiao17301/MySpiderProject

 def parse_page(self, response):
     print("[parse_page] : [{}] <{}>".format(response.status_code,
                                             response.url))
     yield Item({})

示例#7

显示文件

文件： baidu.py 项目： chenxiao17301/Scrapy-plus

 def parse(self, response):
     item = {}
     item['title'] = response.xpath("//head/title/text()")[0]
     yield Item(item)

示例#8

显示文件

    def parse_detail(self, response):
        data = response.meta['data']
        data['movie_length'] = response.xpath(
            '//span[@property="v:runtime"]/text()')

        return Item(data)

示例#9

显示文件

文件： spider.py 项目： Kobe-love/basic11

 def parse(self, response):
     return Item(response.url)