Esempi in Python per Spider.init

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: scrapy.spider

Classe/tipologia: Spider

Metodo/funzione: __init__

Esempi su hotexamples.com: 10

Spider.__init__ in Python: 10 esempi trovati. Questi sono i migliori esempi reali in Python per scrapy.spider.Spider.__init__, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Spider(30)

set_crawler(5)

__init__(2)

__del__(1)

close(1)

log(1)

Esempio n. 1

Mostra file

File: school_spider.py Progetto: wirror800/crawler

    def __init__(self, name=None, **kwargs):
        Spider.__init__(self, name)

        self.conn = MySQLdb.connect(
            host="localhost", 
            user="******", 
            passwd="123456", 
            db="driving", 
            charset="utf8"
        )
        self.cursor = self.conn.cursor()

        self.redispool = redis.ConnectionPool(
            host='localhost', 
            port=6379, 
            db=0
        )

        self.redis = redis.Redis(connection_pool=self.redispool)

        urls = self.getUrls();
        for url in urls:
            done = self.hasCrawled(url)
            if done==False:
                self.start_urls.append(url)
                self.cacheTodo(url)

Esempio n. 2

Mostra file

File: zhaopin_pider.py Progetto: bingyangli/zhaopin

 def __init__(self, name=None, **kwargs):
     Spider.__init__(self, name, **kwargs)
     self.db = MySQLdb.connect(host="localhost",
         user="******",
         passwd="12345689",
         db="zhaopin",
         charset='utf8')                         
     self.cursor = self.db.cursor()

Esempio n. 3

Mostra file

File: zeus.py Progetto: nevor1531/crawler

    def __init__(self, **kwargs):
        Spider.__init__(self, **kwargs)

        self.config_file = kwargs.get('config_file', None)
        config = kwargs.get('config', None)
        if self.config_file:
            jconfig = jsonload(open(self.config_file))
        elif config:
            jconfig = jsonloads(config)
        else:
            self.log('config_file or config is expected', level=log.CRITICAL)
            raise Exception('config_file or config is expected')

        self.template = config_parse(jconfig)

        # 指定单个要爬的入口地址，可用于测试，或者单独爬取某个页面
        self.specify_url = kwargs.get('specify_url', None)

Esempio n. 4

Mostra file

File: province_spider.py Progetto: wirror800/crawler

    def __init__(self, name=None, **kwargs):
        Spider.__init__(self, name)

        self.dbpool = adbapi.ConnectionPool('MySQLdb',
            db = 'driving',
            user = '******',
            passwd = '123456',
            cursorclass = MySQLdb.cursors.DictCursor,
            charset = 'utf8',
            use_unicode = False
        )

        specialCities = [110000, 120000, 310000, 500000];
        cities = json.loads(self.jsonStr)
        for city in cities:
            if city['parent'] or (city['code'] in specialCities):
                self.start_urls.append(''.join(['http://jiaxiao.jiaxiaozhijia.com/',city['pinyin']]))
                self.city_codes[city['pinyin']] = city['code']

Esempio n. 5

Mostra file

File: tweet_hr.py Progetto: LordofthePeople/Tweets-Downloader

	def __init__(self):
        	Spider.__init__(self)

Esempio n. 6

Mostra file

 def __init__(self):
     Spider.__init__(self)
     self.verificationErrors = []
     self.driver = webdriver.Firefox()

Esempio n. 7

Mostra file

File: Amazon_spider.py Progetto: thetimeofblack/ENCA-Andriod

 def __init__(self):
     Spider.__init__(self)
     self.browser = webdriver.Firefox()
     self.cursor.execute(
         'create table if not exists CleaningAgents (cleaningAgentID int primary key, name varchar(20),description varchar(20),instruction varchar(20),application Time long,frequency long,cleaningAgentType varchar(20))'
     )

Esempio n. 8

Mostra file

File: droplet.py Progetto: luotigerlsx/DataAnalysis_ML

 def __init__(self, config, **kwargs):
     Spider.__init__(self, **kwargs)
     self.config_file = kwargs.get('config_file')
     self.config = FocusedCrawlerConfigure(config, self.config_file).config

Esempio n. 9

Mostra file

File: Amazon_spider.py Progetto: MirrShad/ENCA-Andriod

	def __init__(self):
		Spider.__init__(self)
		self.browser = webdriver.Firefox()
		self.cursor.execute('create table if not exists CleaningAgents (cleaningAgentID int primary key, name varchar(20),description varchar(20),instruction varchar(20),application Time long,frequency long,cleaningAgentType varchar(20))')

Esempio n. 10

Mostra file

File: tesco_spider.py Progetto: itech001/MyTesting

 def __init__(self):
     Spider.__init__(self)
     self.verificationErrors = []
     self.driver = webdriver.Firefox()

Esempi in Python per Spider.__init__

Esempi in Python per Spider.init