Python UrlextractItemの例

プログラミング言語: Python

名前空間/パッケージ名: urlExtract.items

クラス/型: UrlextractItem

hotexamples.comのコード掲載数: 5

Python UrlextractItem - 5件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのurlExtract.items.UrlextractItemの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

UrlextractItem(5)

よく使われるメソッド

UrlextractItem (5)

コード例 #1

ファイルを表示

ファイル: familydoctor.py プロジェクト: tenaghirmb/HISBs

 def parse_url(self, response):
     if len(response.url) < 100:
         item = UrlextractItem()
         item['site'] = 'familydoctor'
         url = re.search('www\.familydoctor\.com\.cn\/.*?\/.*',
                         response.url).group()
         item['url'] = url
         yield item

コード例 #2

ファイルを表示

ファイル: fx120.py プロジェクト: tenaghirmb/HISBs

 def parse_url(self, response):
     if len(response.url) < 100:
         item = UrlextractItem()
         item['site'] = 'fx120'
         item['url'] = response.url
         yield item
         try:
             try:
                 url = re.search('http.*?www.*?fx120.*?/.*?/',
                                 response.url).group()
             except AttributeError:
                 url = re.search('.*?fx120.net/', response.url).group()
             item = UrlextractItem()
             item['site'] = 'fx120'
             item['url'] = url
             yield item
         except AttributeError:
             pass

コード例 #3

ファイルを表示

 def parse_url(self, response):
     if len(response.url) < 100:
         try:
             item = UrlextractItem()
             item['site'] = 'haodf'
             url = re.search('.*?\.haodf\.com/', response.url).group()
             item['url'] = url
             yield item
         except AttributeError:
             pass

コード例 #4

ファイルを表示

ファイル: healthSina.py プロジェクト: tenaghirmb/HISBs

 def parse_url(self, response):
     if len(response.url) < 100:
         try:
             item = UrlextractItem()
             item['site'] = 'healthSina'
             url = re.search('.*?health\.sina\.com\.cn/.*?/',
                             response.url).group()
             item['url'] = url
             yield item
         except AttributeError:
             pass

コード例 #5

ファイルを表示

ファイル: net39.py プロジェクト: tenaghirmb/HISBs

 def parse_url(self, response):
     if len(response.url) < 100:
         item = UrlextractItem()
         item['site'] = 'net39'
         item['url'] = response.url
         yield item