Python Jd_Db 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: jd_db

클래스/타입: Jd_Db

hotexamples.com에서의 예제들: 6

Python Jd_Db - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 jd_db.Jd_Db에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Jd_Db(3)

db_query_extend(2)

db_query_process(1)

db_unprocess_count(1)

예제 #1

파일 보기

파일: suning_spider.py 프로젝트: taozhijiang/dust_repos

    def run(self):
        print ("启动商品咨询线程 %d ...\n" % self.threadID)
        jda = JdAnysisConsult(self.threadID)
        jdb = Jd_Db()
        while True:
            with gdb_lock:
                full_url = jdb.db_query_process()

            if full_url:
                jda.get_product_consults(full_url)
            else:
                print("咨询线程[%d]提取产品为空，等待..." % self.threadID)
                time.sleep(20)

        print ("退出商品咨询线程 %d ..." % self.threadID)

예제 #2

파일 보기

    def run(self):
        print("启动商品咨询线程 %d ...\n" % self.threadID)
        jda = JdAnysisConsult(self.threadID)
        jdb = Jd_Db(jd_config.SQLITE_DB)
        while True:
            with gdb_lock:
                full_url = jdb.db_query_process()

            if full_url:
                jda.get_product_consults(full_url)
            else:
                print("咨询线程[%d]提取产品为空，等待..." % self.threadID)
                time.sleep(10)

        print("退出商品咨询线程 %d ..." % self.threadID)

예제 #3

파일 보기

파일: suning_spider.py 프로젝트: taozhijiang/dust_repos

    def run(self):
        print ("启动线程 %d ...\n" % self.threadID)
        jdb = Jd_Db()
        while True:
            #if jdb.db_unprocess_count() > 200000:
            #    #print ("系统负载重，暂停展开网页...\n")
            #    time.sleep(60)
            #    continue

            with gdb_lock:
                while True:
                    full_url = jdb.db_query_extend()
                    if full_url:
                        break
                    else:
                        time.sleep(20)

            print("线程[%d]正在处理：%s" % (self.threadID, full_url) )
            get_product_ids(full_url, jdb, self.threadID)

        print ("退出线程 %d ..." % self.threadID)

예제 #4

파일 보기

    def run(self):
        print("启动线程 %d ...\n" % self.threadID)
        jdb = Jd_Db()
        while True:
            #if jdb.db_unprocess_count() > 200000:
            #    #print ("系统负载重，暂停展开网页...\n")
            #    time.sleep(60)
            #    continue

            with gdb_lock:
                while True:
                    full_url = jdb.db_query_extend()
                    if full_url:
                        break
                    else:
                        time.sleep(20)

            print("线程[%d]正在处理：%s" % (self.threadID, full_url))
            get_product_ids(full_url, jdb, self.threadID)

        print("退出线程 %d ..." % self.threadID)

예제 #5

파일 보기

파일: jd_spider.py 프로젝트: dream1986/jd_spider

 def run(self):
     print ("启动线程 %d ...\n" % self.threadID)
     jdb = Jd_Db(jd_config.SQLITE_DB)
     while True:
         if jdb.db_unprocess_count() > 200000:                
             #print ("系统负载重，暂停展开网页...\n")
             time.sleep(60)
             continue 
             
         with gdb_lock:
             while True:
                 full_url = jdb.db_query_extend()
                 if full_url:
                     #if re.match(r'^http://(help|red|tuan|auction|jr|smart|gongyi|app|en|media|m|myjd|chat|read|chongzhi|z|giftcard|fw|you|mobile).jd.com', full_url) or re.match(r'^http://www.jd.com/compare/', full_url) or re.match(r'^http://club.jd.com/consultation/', full_url) :
                     #    print("线程[%d]正在处理：%s [删除]" % (self.threadID, full_url) )
                     #    jdb.db_drop_rubbish(full_url)
                     #else:
                     #    break
                     break
                 
         print("线程[%d]正在处理：%s" % (self.threadID, full_url) )
         get_product_ids(full_url, jdb, self.threadID)
                 
     print ("退出线程 %d ..." % self.threadID)

예제 #6

파일 보기

    def run(self):
        print("启动线程 %d ...\n" % self.threadID)
        jdb = Jd_Db(jd_config.SQLITE_DB)
        while True:
            if jdb.db_unprocess_count() > 200000:
                #print ("系统负载重，暂停展开网页...\n")
                time.sleep(60)
                continue

            with gdb_lock:
                while True:
                    full_url = jdb.db_query_extend()
                    if full_url:
                        #if re.match(r'^http://(help|red|tuan|auction|jr|smart|gongyi|app|en|media|m|myjd|chat|read|chongzhi|z|giftcard|fw|you|mobile).jd.com', full_url) or re.match(r'^http://www.jd.com/compare/', full_url) or re.match(r'^http://club.jd.com/consultation/', full_url) :
                        #    print("线程[%d]正在处理：%s [删除]" % (self.threadID, full_url) )
                        #    jdb.db_drop_rubbish(full_url)
                        #else:
                        #    break
                        break

            print("线程[%d]正在处理：%s" % (self.threadID, full_url))
            get_product_ids(full_url, jdb, self.threadID)

        print("退出线程 %d ..." % self.threadID)