Exemple #1
0
    def go(self):
        # print("第一步开始进行爬取")
        # all_go(task_code=self.task_code, task_id=self.task_id)
        # print("成功完成爬取数据到爬虫数据表\n------------------现在开始下载pdf、img文件-----------------")

        # pdf_download = PdfDownload(self.task_id)
        # pdf_download.go()
        # img_download = ImgDownload()
        # img_download.go()
        # print("pdf、img下载完成,开始对数据进行分析并存入数据库")

        data_processing = DataProcessing()
        data_processing.go(self.task_id)
    def go(self):
        print("开始进行爬取")
        all_go(self.task_code, self.task_id)
        print(
            "成功完成爬取数据到爬虫数据表\n------------------现在开始下载pdf、img文件-----------------"
        )
        pdf_download = PdfDownload()
        pdf_download.go()
        # 此类目无图片
        print("pdf、img下载完成,开始对数据进行分析并存入数据库")

        # 以下为数据分析,基本全部需要改
        main = DataProcessing()
        main.go(self.task_id)
    def go(self):
        print("开始进行爬取")
        forth_go(self.url, task_code=self.task_code, task_id=self.task_id)
        print(
            "成功完成爬取数据到爬虫数据表\n------------------现在开始下载pdf、img文件-----------------"
        )
        pdf_download = PdfDownload(self.task_id)
        pdf_download.go()
        img_download = ImgDownload()
        img_download.go()
        print("pdf、img下载完成,开始对数据进行分析并存入数据库")

        # 以下为数据分析,基本全部需要改
        data_processing = DataProcessing()
        data_processing.go(self.task_id)
Exemple #4
0
 def go(self):
     step = [3]
     if 1 in step:
         print("开始进行爬取")
         all_go(task_code=self.task_code, task_id=self.task_id)
         print("成功完成爬取数据到爬虫数据表\n------------------现在开始下载pdf、img文件-----------------")
     if 2 in step:
         pdf_download = PdfDownload()
         pdf_download.go()
         img_download = ImgDownload()
         img_download.go()
         print("pdf、img下载完成,开始对数据进行分析并存入数据库")
     if 3 in step:
         # 以下为数据分析,基本全部需要改
         data_processing = DataProcessing()
         data_processing.go(self.task_id)
    def go(self):
        print("开始进行爬取")
        csv_to_db = CsvToDb(task_code=self.task_code, task_id=self.task_id)
        csv_to_db.csv_download()
        csv_to_db.get_csv_data()
        print(
            "成功完成爬取数据到爬虫数据表\n------------------现在开始下载pdf、img文件-----------------"
        )
        pdf_download = PdfDownload(self.task_id)
        pdf_download.go()
        # 此类目无图片
        print("pdf、img下载完成,开始对数据进行分析并存入数据库")

        # 以下为数据分析,基本全部需要改
        main = DataProcessing()
        main.go(self.task_id)