Python PropertyLoader.load_item示例

编程语言: Python

命名空间/包名称: quoka.items

类/类型: PropertyLoader

方法/功能: load_item

hotexamples.com的示例: 2

Python PropertyLoader.load_item - 已找到2个示例。这些是从开源项目中提取的最受好评的quoka.items.PropertyLoader.load_item现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

load_item(2)

add_value(2)

add_css(1)

示例#1

显示文件

文件： properties.py 项目： zartstrom/crawl

    def parse_property(self, response):
        loader = PropertyLoader(item=PropertyItem(), response=response)

        loader.add_css("header", "div.headline > h2::text")
        loader.add_css("description", "div.text::text")
        loader.add_css("price", "div.price strong span::text")
        loader.add_css("postal_code", "div.location span.address span.postal-code::text")
        loader.add_css("city", "div.location span.address span.locality::text")
        loader.add_css("obid", "div.date-and-clicks > strong:nth-child(1)")
        loader.add_css("ad_created", "div.date-and-clicks::text")
        loader.add_css("phone", "ul.contacts > li > span:nth-child(2)::text")
        loader.add_value("created", date.today())
        loader.add_value("url", response.url)
        loader.add_value("commercial", response.meta.get("commercial"))
        loader.add_value("property_type", response.meta.get("property_type"))
        loader.add_value("city_category", response.meta.get("city_category"))  # stats

        item = loader.load_item()
        return item

示例#2

显示文件

文件： properties.py 项目： zartstrom/crawl

    def parse_page(self, response):
        """crawl properties on a page"""

        # handle "Partner-Anzeigen"
        # need to identify correct css/xpath
        #print len(response.xpath("//div[text() = 'Partner-Anzeige']"))
        #print len(response.css("div #ResultListData > ul.alist > li[data-ssp]"))
        #from scrapy.shell import inspect_response
        #inspect_response(response, self)
        for box in response.css("div #ResultListData > ul > li[data-ssp]"):
            loader = PropertyLoader(item=PropertyItem(), response=response)
            #loader.add_css("header", box.css("h3::text"))
            loader.add_value("advertiser_id", "Immobilienscout24")
            loader.add_value("commercial", response.meta.get("commercial"))
            loader.add_value("property_type", response.meta.get("property_type"))
            loader.add_value("city_category", response.meta.get("city_category"))  # stats

            item = loader.load_item()
            yield item

        # handle non-"Partner-Anzeigen"
        for sel in response.css("div #ResultListData > ul > li.hlisting  > div.n2 > a::attr(\"href\")"):
            url = add_scheme_host(sel.extract())
            yield scrapy.Request(url, self.parse_property, meta=response.meta)