Python get_biz_urlsの例

プログラミング言語: Python

名前空間/パッケージ名: feverbot.fever_utils

メソッド/関数: get_biz_urls

hotexamples.comのコード掲載数: 6

Python get_biz_urls - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfeverbot.fever_utils.get_biz_urlsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: pipelines.py プロジェクト: JohnStuartRutledge/Feverbot

    def spider_opened(self, spider):
        '''Initialize your exporters when spider first starts
        '''
        if spider.name == 'AptratingsSpider':
            BIZ_DICT, PROPS = get_biz_urls("Apartment Ratings")

        for k, v in PROPS.items():
            self.d[v] = {
              "url"    : k,
              # "stats"  : stats.get_stats(), # this goes at end
              "totals" : {
                  "overall_construction": -1,
                  "overall_grounds"     : -1,
                  "overall_maintenance" : -1,
                  "overall_noise"       : -1,
                  "overall_office_staff": -1,
                  "overall_parking"     : -1,
                  "overall_safety"      : -1,
                  "recommended_by"      : -1,
                  "total_overall_rating": -1
              },
              "comments" : []
            }

コード例 #2

ファイルを表示

    def spider_opened(self, spider):
        '''Initialize your exporters when spider first starts
        '''
        if spider.name == 'AptratingsSpider':
            BIZ_DICT, PROPS = get_biz_urls("Apartment Ratings")

        for k, v in PROPS.items():
            self.d[v] = {
                "url": k,
                # "stats"  : stats.get_stats(), # this goes at end
                "totals": {
                    "overall_construction": -1,
                    "overall_grounds": -1,
                    "overall_maintenance": -1,
                    "overall_noise": -1,
                    "overall_office_staff": -1,
                    "overall_parking": -1,
                    "overall_safety": -1,
                    "recommended_by": -1,
                    "total_overall_rating": -1
                },
                "comments": []
            }

コード例 #3

ファイルを表示

ファイル: fever_yelp.py プロジェクト: hsd315/Feverbot

from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy import log
#from scrapy.contrib.spiders import Rule
from feverbot.items import Yelp
from feverbot.fever_utils import now, get_biz_urls

#-----------------------------------------------------------------------------
#
#-----------------------------------------------------------------------------

BIZ_DICT, PROPS = get_biz_urls("Yelp")


class YelpSpider(BaseSpider):
    '''Spider for crawling Yelp and extracting ratings data
    To use, first cd into your Scrapy project directory. then:
    >>> scrapy crawl YelpSpider
    '''
    name = 'YelpSpider'
    allowed_domains = ['http://www.yelp.com']
    start_urls = PROPS.keys()

    def parse(self, response):
        '''Parse the data out of Yelps HTML page
        '''
        hxs = HtmlXPathSelector(response)
        ylp = Yelp()
        url = response.url

        if response.status == 302:

コード例 #4

ファイルを表示

ファイル: fever_aptratings.py プロジェクト: JohnStuartRutledge/Feverbot

from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.exceptions import CloseSpider
from scrapy.selector import HtmlXPathSelector
from urlparse import urljoin
from scrapy import log
from feverbot.items import Apt, AptReview
from feverbot.fever_utils import now, get_biz_urls, autoViv, replace_txt
from feverbot.fever_utils import replace_escape_chars as esc_chars

#-----------------------------------------------------------------------------
#
#-----------------------------------------------------------------------------

# return a list of all apartment-ratings URL's you want to scrape
BIZ_DICT, PROPS = get_biz_urls("Apartment Ratings")

logline = 79*'*'

class AptratingsSpider(CrawlSpider):
    '''
    Spider for crawling Apartment Ratings and extracting ratings data
    http://readthedocs.org/docs/scrapy/en/latest/topics/spiders.html?highlight=crawlspider
    TODO - dump spider stats into json file in pipelines

    To activate the spider from the command line type:
    >>> cd fever
    >>> cd apps/webcrawlers/feverbot
    >>> scrapy crawl AptratingsSpider
    '''
    name = 'AptratingsSpider'

コード例 #5

ファイルを表示

ファイル: fever_aptratings.py プロジェクト: hsd315/Feverbot

from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.exceptions import CloseSpider
from scrapy.selector import HtmlXPathSelector
from urlparse import urljoin
from scrapy import log
from feverbot.items import Apt, AptReview
from feverbot.fever_utils import now, get_biz_urls, autoViv, replace_txt
from feverbot.fever_utils import replace_escape_chars as esc_chars

#-----------------------------------------------------------------------------
#
#-----------------------------------------------------------------------------

# return a list of all apartment-ratings URL's you want to scrape
BIZ_DICT, PROPS = get_biz_urls("Apartment Ratings")

logline = 79 * '*'


class AptratingsSpider(CrawlSpider):
    '''
    Spider for crawling Apartment Ratings and extracting ratings data
    http://readthedocs.org/docs/scrapy/en/latest/topics/spiders.html?highlight=crawlspider
    TODO - dump spider stats into json file in pipelines

    To activate the spider from the command line type:
    >>> cd fever
    >>> cd apps/webcrawlers/feverbot
    >>> scrapy crawl AptratingsSpider
    '''

コード例 #6

ファイルを表示

ファイル: fever_yelp.py プロジェクト: JohnStuartRutledge/Feverbot

from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy import log
#from scrapy.contrib.spiders import Rule
from feverbot.items import Yelp
from feverbot.fever_utils import now, get_biz_urls

#-----------------------------------------------------------------------------
#
#-----------------------------------------------------------------------------

BIZ_DICT, PROPS = get_biz_urls("Yelp")

class YelpSpider(BaseSpider):
    '''Spider for crawling Yelp and extracting ratings data
    To use, first cd into your Scrapy project directory. then:
    >>> scrapy crawl YelpSpider
    '''
    name            = 'YelpSpider'
    allowed_domains = ['http://www.yelp.com']
    start_urls      = PROPS.keys()

    def parse(self, response):
        '''Parse the data out of Yelps HTML page
        '''
        hxs = HtmlXPathSelector(response)
        ylp = Yelp()
        url = response.url

        if response.status == 302:
            self.log('302: Redirected', level=log.INFO)