Python load_existing_urlsの例

プログラミング言語: Python

名前空間/パッケージ名: eventfinda.dao_utils

メソッド/関数: load_existing_urls

hotexamples.comのコード掲載数: 4

Python load_existing_urls - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのeventfinda.dao_utils.load_existing_urlsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: aisa_city_spider.py プロジェクト: luotigerlsx/DataAnalysis_ML

 def parse(self, response):
     '''
     Parse starting page. Extract event list, then yield further request for each event
     '''
     
     # load existing events for filtering
     existing_urls = load_existing_urls(self.name)
     
     # extract all events related content
     events_element = response.xpath('//div[@class="wrapper clearfix "]//div[contains(@class, "views-row")]')
     self.logger.info('Found %d events on url %s', len(events_element), response.url)
     
     for event in events_element:
         title = event.xpath('.//div[@class="views-field-title"]//a/text()').extract_first()
         url = urlparse.urljoin(response.url, event.xpath('.//div[@class="views-field-title"]//a/@href').extract_first())
         
         if url not in existing_urls:
             category = event.xpath('.//div[@class="views-field-field-event-category-value-1"]//a/text()').extract_first()
             
             # yield request for newly found event
             yield Request(url, meta={"category": category}, callback=self.parse_one_event)
         else:
             self.logger.info('Event %s with url %s has already been parsed', title, url)

コード例 #2

ファイルを表示

ファイル: event_brite_spider.py プロジェクト: luotigerlsx/DataAnalysis_ML

 def __init__(self):
     # load existing urls for filtering
     self.existing_urls = load_existing_urls(self.name)

コード例 #3

ファイルを表示

ファイル: whats_happen_spider.py プロジェクト: luotigerlsx/DataAnalysis_ML

 def __init__(self):
     # load existing urls for whatshappen
     self.existing_urls = load_existing_urls(self.name)

コード例 #4

ファイルを表示

ファイル: event_finda_spider.py プロジェクト: luotigerlsx/DataAnalysis_ML

 def __init__(self):
     """Load existing urls for source eventfinda"""
     self.existing_urls = load_existing_urls(self.name)