Python GovCnItem Exemples

Langage de programmation: Python

Espace de nommage/Pack: gov_cn.items

Class/Type: GovCnItem

Exemples au hotexamples.com: 2

Python GovCnItem - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de gov_cn.items.GovCnItem extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

GovCnItem(2)

Méthodes fréquemment utilisées

GovCnItem (2)

Exemple #1

0

Afficher le fichier

def parse_content(self, response): item = GovCnItem() item['datePublished'] = response.meta.get('time').strip() item['headline'] = response.meta.get('title') item['Bigtype'] = response.meta.get('Bigtype') item['articleBody'] = response.css('td.b12c').xpath( 'string(.)').extract_first() item['annex'] = [ urlparse.urljoin(response.url, each_pic) for each_pic in response.css('td.b12c img::attr(src)').extract() ] if not item['articleBody']: item['articleBody'] = response.css('div#UCAP-CONTENT').xpath( 'string(.)').extract_first() item['annex'] = [ urlparse.urljoin(response.url, each_pic) for each_pic in response.css('div#UCAP-CONTENT img::attr(src)').extract() ] try: item['copyrightHolder'] = response.css( 'span.font::text').extract_first().split(u'：')[1].strip() except: item['copyrightHolder'] = '' item['url'] = response.url yield item

Exemple #2

0

Afficher le fichier

def parse_content(self, response): item = GovCnItem() item['datePublished'] = '' item['headline'] = response.meta.get('title') item['Bigtype'] = response.meta.get('Bigtype') item['articleBody'] = response.css('div#UCAP-CONTENT').xpath( 'string(.)').extract_first() item['annex'] = [ urlparse.urljoin(response.url, each_pic) for each_pic in response.css('div#UCAP-CONTENT img::attr(src)').extract() ] item['copyrightHolder'] = '' item['url'] = response.url yield item