Python NuggetItem Beispiele

Programmiersprache: Python

Namespace / Paketname: watson.items

Klasse / Typ: NuggetItem

Beispiele auf hotexamples.com: 3

Python NuggetItem - 3 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die watson.items.NuggetItem, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

NuggetItem(3)

Häufig verwendete Methoden

NuggetItem (3)

Beispiel #1

Datei anzeigen

Datei: wikipedia.py Projekt: AlphaRomeo13/watson_crawler

 def parse_item(self, response):
     scope = response.xpath('//*[@id="mw-content-text"]')
     for sel in scope.xpath('//h1 | .//h2 | .//h3 | .//h4 | .//p | .//ol | .//ul | .//pre'):
         item = NuggetItem()
         item['content'] = sel.extract()
         item['title'] = response.xpath('//title/text()').extract()
         yield item

Beispiel #2

Datei anzeigen

Datei: wikipedia.py Projekt: AlphaRomeo13/watson_crawler

 def parse_start_url(self, response):
     scope = response.xpath('//*[@id="mw-content-text"]')
     for sel in scope.xpath('//h1 | .//h2 | .//h3 | .//h4 | .//p | .//ol | .//ul | .//pre'):   # use: '//h2[1]/preceding-sibling::p' to get intro paragraphs
             item = NuggetItem()
             item['content'] = sel.extract()
             item['title'] = response.xpath('//title/text()').extract()
             yield item

Beispiel #3

Datei anzeigen

 def parse_start_url(self, response):
     for sel in response.xpath('//h1 | //h2 | //p | //pre | //ul | //ol'):
         item = NuggetItem()
         item['content'] = sel.extract()
         item['title'] = response.xpath('//title/text()').extract()
         yield item