Ejemplo n.º 1
0
 def check_should_fetch(self, jdid):
     if not PageStoreBase.check_should_fetch(self, jdid):
         return False
     if CData.getholes:
         indexUrl = "%s://%s" % (self.channel, jdid)
         if self.find_any(indexUrl):
             return False
     return True
Ejemplo n.º 2
0
 def __init__(self):
     PageStoreBase.__init__(self, "qixinbao")
Ejemplo n.º 3
0
 def __init__(self,
              channel,
              dburl="mongodb://*****:*****@localhost/admin"):
     PageStoreBase.__init__(self, channel, dburl)
Ejemplo n.º 4
0
 def __init__(self):
     PageStoreBase.__init__(self, 'jd_51job')#, dburl='mongodb://localhost/page')
     # self.testmode = 1
     self.hdoc = None
Ejemplo n.º 5
0
 def __init__(self):
     PageStoreBase.__init__(self, 'co_zhuopin', 'mongodb://hadoop2/co_crawler')
     # self.testmode = 1
     self.hdoc = None
Ejemplo n.º 6
0
 def __init__(self, channel, dburl="mongodb://hadoop2/co_crawler"):
     PageStoreBase.__init__(self, channel, dburl)
Ejemplo n.º 7
0
 def __init__(self):
     PageStoreBase.__init__(self, 'jd_zhilian')
     self.hdoc = None
Ejemplo n.º 8
0
 def __init__(self):
     PageStoreBase.__init__(self, "qichacha")
Ejemplo n.º 9
0
 def __init__(self):
     PageStoreBase.__init__(self, 'cv_liepin', dburl=LPCVConfig.mongdb_url)
     self.testmode = False
     self._not_need_cv_fs = FileSaver(LPCVConfig.NOT_NEED_CV_FN)
     self._not_access_by_qiye = FileSaver(LPCVConfig.NOT_ACCESS_BY_QIYE)
Ejemplo n.º 10
0
 def __init__(self):
     PageStoreBase.__init__(self, mongo_channel, mongo_cvdb_url)
Ejemplo n.º 11
0
    def __init__(self, channel, dburl):
        PageStoreBase.__init__(self, channel, dburl)

        # 子类需要覆盖
        self.log = None
Ejemplo n.º 12
0
 def __init__(self):
     PageStoreBase.__init__(self, 'cv_zhilian', mongo_cvdb_url)
Ejemplo n.º 13
0
 def __init__(self):
     PageStoreBase.__init__(self,
                            'cv_chinahr',
                            dburl='mongodb://hadoop2/cv_crawler')