Python Headline示例

编程语言: Python

命名空间/包名称: myproject.items

类/类型: Headline

hotexamples.com的示例: 9

Python Headline - 已找到9个示例。这些是从开源项目中提取的最受好评的myproject.items.Headline现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Headline(9)

常用方法

Headline (9)

示例#1

显示文件

 def parse_topics(self, response):
     item = Headline()
     item['title'] = response.css('head title::text').extract_first()
     item['body'] = " ".join(response.css('.o-article_block p')\
         .xpath('string()')\
         .extract())
     yield item

示例#2

显示文件

 def parse_topics(self, response):
     """
     Scrape title and body-text
     """
     item = Headline()
     item['title'] = response.css('.newsTitle ::text').extract_first()
     item['body'] = response.css('.hbody').xpath('string()').extract_first()
     yield item

示例#3

显示文件

文件： test.py 项目： takinai/football

    def parse_topics(self, response):
        item = Headline()
        item['title'] = response.css('.newsTitle ::text').extract_first()
        item['body'] = response.css('.hbody').xpath('string()').extract_first()
        yield item


# scrapy runspider xxx.py

示例#4

显示文件

 def parse_topics(self, response):
     """
     トピックスのページからタイトルと本文を抜き出す。
     """
     item = Headline()
     item['title'] = response.css('.newsTitle ::text').extract_first()
     item['body'] = response.css('.hbody').xpath('string()').extract_first()
     yield item

示例#5

显示文件

 def parse_page(self, response):
     """
     トピックスのページからタイトルと本文を抜き出す。
     """
     item = Headline()
     item['url'] = response.url
     item['html'] = response.text
     yield item

示例#6

显示文件

 def parse_topics(self, response):
     """
     トピックスのページからタイトルと本文を抜き出す
     """
     item = Headline()  # Headlineオブジェクトを作成
     item['title'] = response.css(
         '.newsTitle ::text').extract_first()  # タイトル
     item['body'] = response.css('.hbody').xpath(
         'string()').extract_first()  # 本文
     yield item  # Itemをyieldして、データを抽出する

示例#7

显示文件

文件： news_crawl.py 项目： tryuichi/tryScrapy

 def parse_topics(self, response):
     """
     トピックスのページからタイトルと本文を抜き出す。
     """
     item = Headline()  # Headlineオブジェクトの作成。
     item['title'] = response.css(
         '.newsTitle ::text').extract_first()  # タイトル
     item['body'] = response.css('.hbody').xpath(
         'string()').extract_first()  # 本文
     #item['body'] = ''.join(response.css('.hbody ::text').extract()) # 本文 CSSセレクターのみを使う場合
     yield item  # Itemをyieldして、データを抽出する。

示例#8

显示文件

 def parse_topics(self, response):
     """
     トピックスのページからタイトルと本文を抜き出す。
     """
     item = Headline()
     #item['title'] = response.css('.tpcNews_title::text').get()
     #item['body'] = response.css('.tpcNews_summary').xpath('string()').get()
     item['title'] = response.css(
         '.pickupMain_articleTitle::text').get()  # タイトル
     item['body'] = response.css('.pickupMain_articleSummary').xpath(
         'string()').get()  # 本文
     yield item

示例#9

显示文件

文件： news.py 项目： taken10/scraping

 def parse_topics(self, response):
     item = Headline()
     item['title'] = response.css('.pickupMain_articleTitle ::text').extract_first()
     item['body'] = response.css('.pickupMain_articleSummary ::text').extract_first()
     yield item