コード例 #1
0
ファイル: crawler.py プロジェクト: zhaoylcd/lagou_job_crawler
 def append_bottom(self, keywords_dict):
     while True:
         try:
             keywords_str = json.dumps(keywords_dict)
             self.key_queue_conn.put(keywords_str)
             return
         except Exception as e:
             print u'重新插入redis队尾异常%s' % e
             time.sleep(5)
             try:
                 #重新连接
                 self.company_name_queue = RedisQueue.getredisQueue("%s:keywords" % self.key_queue_name,redis_host= self.redis_host,redis_port=self.redis_port)
                 continue
             except Exception as e1:
                 self.logging.error(u"连接Redis队列失败。错误信息:%s" % e1)
                 time.sleep(600)
             continue
コード例 #2
0
ファイル: crawler.py プロジェクト: zhaoylcd/lagou_job_crawler
 def pop_key_words(self):
     while True:
         try:
             keywords_dict = self.key_queue_conn.get(timeout=60)
             if keywords_dict is None:
                 raise Exception(u'队列中没有内容返回')
             keywords_dict = keywords_dict.strip()
             if len(keywords_dict) < 1:
                 raise Exception(u'队列中数据异常')
             return keywords_dict
         except Exception as e:
             print u'从队列中%s取key,value对异常 %s' % (self.key_queue_name, e)
             time.sleep(60*5)
             try:
                 #重新连接
                 self.company_name_queue = RedisQueue.getredisQueue("%s:keywords" % self.key_queue_name,redis_host= self.redis_host,redis_port=self.redis_port)
                 continue
             except Exception as e1:
                 self.logging.error(u"连接Redis队列失败。错误信息:%s" % e1)
                 time.sleep(600)
             continue
コード例 #3
0
ファイル: crawler.py プロジェクト: zhaoylcd/lagou_job_crawler
 def __init__(self, key_queue_name, name,queue_name,process_number=1,redis_host=None,redis_port=None):
     Producer.__init__(self,name, queue_name, process_number, redis_host = redis_host, redis_port = redis_port)
     self.key_queue_name = key_queue_name
     self.key_queue_conn = RedisQueue.getredisQueue("%s:keywords" % key_queue_name, redis_host = redis_host,redis_port = redis_port, redis_password = None)
     self.redis_host = redis_host
     self.redis_port = redis_port