Ejemplos de MasterRedisItem en Python

Lenguaje de programación: Python

Namespace/Package Name: lianjiaSpider.items

Clase / Tipo: MasterRedisItem

Ejemplos en hotexamples.com: 2

Python MasterRedisItem - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de lianjiaSpider.items.MasterRedisItem extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

MasterRedisItem(2)

Métodos usados con frecuencia

MasterRedisItem (2)

Ejemplo n.º 1

Mostrar archivo

Archivo: ershoufang.py Proyecto: Aries000004/grocery

    def parse_area(self, response):
        """添加不同的区域和页码进行爬取数据"""
        base_url = response.url
        sel = scrapy.Selector(response)

        # 存入Redis 数据库
        item = MasterRedisItem()
        # 添加 redis key  区分不同的爬虫
        item['redis_key'] = 'lianjia:ershoufang'

        areas_urls = sel.xpath('//div[@data-role="ershoufang"]/div/a/@href').extract()
        for area_url in areas_urls:
            area_url = area_url.replace('/ershoufang/', '')
            url = base_url + area_url
            # 添加页码
            for page in range(1, MAX_PAGE + 1):
                url = re.sub('pg\d+/','pg%d' % page, url)
                item['url'] = url
                yield item

Ejemplo n.º 2

Mostrar archivo

Archivo: loupan.py Proyecto: Flavio58it/grocery

    def parse_area(self, response):
        """添加不同的区域进行爬取数据"""
        base_url = response.url
        sel = scrapy.Selector(response)

        # 存入Redis 数据库
        item = MasterRedisItem()
        # 添加 redis key  区分不同的爬虫
        item['redis_key'] = 'lianjia:ershoufang'

        areas_urls = sel.xpath(
            '//ul[@class="district-wrapper"]/li/@data-district-spell').extract(
            )
        for area_url in areas_urls:
            url = base_url + area_url
            # 添加页码
            for page in range(1, MAX_PAGE + 1):
                url += re.sub('pg\d+/', 'pg%s' % page, url)
                item['url'] = url
                yield item