예제 #1
0
파일: _51job.py 프로젝트: wolfwhoami/xxxxx
 def check_should_fetch(self, jdid):
     if not PageStoreBase.check_should_fetch(self, jdid):
         return False
     if CData.getholes:
         indexUrl = "%s://%s" % (self.channel, jdid)
         if self.find_any(indexUrl):
             return False
     return True
예제 #2
0
 def __init__(self):
     PageStoreBase.__init__(self, "qixinbao")
예제 #3
0
 def __init__(self,
              channel,
              dburl="mongodb://*****:*****@localhost/admin"):
     PageStoreBase.__init__(self, channel, dburl)
예제 #4
0
파일: _51job.py 프로젝트: wolfwhoami/xxxxx
 def __init__(self):
     PageStoreBase.__init__(self, 'jd_51job')#, dburl='mongodb://localhost/page')
     # self.testmode = 1
     self.hdoc = None
예제 #5
0
 def __init__(self):
     PageStoreBase.__init__(self, 'co_zhuopin', 'mongodb://hadoop2/co_crawler')
     # self.testmode = 1
     self.hdoc = None
예제 #6
0
 def __init__(self, channel, dburl="mongodb://hadoop2/co_crawler"):
     PageStoreBase.__init__(self, channel, dburl)
예제 #7
0
파일: zhilian.py 프로젝트: wolfwhoami/xxxxx
 def __init__(self):
     PageStoreBase.__init__(self, 'jd_zhilian')
     self.hdoc = None
예제 #8
0
파일: sum.py 프로젝트: wolfwhoami/xxxxx
 def __init__(self):
     PageStoreBase.__init__(self, "qichacha")
예제 #9
0
 def __init__(self):
     PageStoreBase.__init__(self, 'cv_liepin', dburl=LPCVConfig.mongdb_url)
     self.testmode = False
     self._not_need_cv_fs = FileSaver(LPCVConfig.NOT_NEED_CV_FN)
     self._not_access_by_qiye = FileSaver(LPCVConfig.NOT_ACCESS_BY_QIYE)
예제 #10
0
파일: cv51.py 프로젝트: wolfwhoami/xxxxx
 def __init__(self):
     PageStoreBase.__init__(self, mongo_channel, mongo_cvdb_url)
예제 #11
0
    def __init__(self, channel, dburl):
        PageStoreBase.__init__(self, channel, dburl)

        # 子类需要覆盖
        self.log = None
예제 #12
0
 def __init__(self):
     PageStoreBase.__init__(self, 'cv_zhilian', mongo_cvdb_url)
예제 #13
0
 def __init__(self):
     PageStoreBase.__init__(self,
                            'cv_chinahr',
                            dburl='mongodb://hadoop2/cv_crawler')