Python Crawl.Crawl примеры использования

Язык программирования: Python

Пространство имен/Пакет: Crawl

Класс/Тип: Crawl

Метод/Функция: Crawl

Примеров на hotexamples.com: 5

Python Crawl.Crawl - 5 примеров найдено. Это лучшие примеры Python кода для Crawl.Crawl.Crawl, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Crawl(5)

begin(3)

crawl_next_page_for_links(2)

dropTable(2)

filter(2)

get(2)

Finish(1)

Run(1)

add_url(1)

dropAndCreate(1)

dummy(1)

end(1)

load_next_page(1)

Пример #1

Показать файл

def deepCrawl(crawled) :
    tmp = []
    for each in crawled :
        crawl = Crawl(each['url'])
        crawl.filter()
        tmp.extend(crawl.get())
    return tmp

Пример #2

Показать файл

Файл: TicketPrice.py Проект: liangweijia6000/TicketPrice

def Run():
    start_urls = Ctrip.StartURL()
    my_crawl = Crawl(start_urls)
    try:
        my_crawl.Run()
        price_pannel_list = my_crawl.price_pannel_list
        for price_pannel in price_pannel_list:
            SplunkLog.Save(price_pannel)
    finally:
        my_crawl.Finish()

Пример #3

Показать файл

def appCrawl(url):
    crawl = Crawl(url)
    crawl.filter()
    crawled = []
    crawled.extend(crawl.get())
    crawled.extend(SubCrawl.deepCrawl(crawled))
    crawled = SubCrawl.deleteOverlap(crawled)
    crawled = SubCrawl.replaceAttack(crawled)
    crawled = SubCrawl.getAttackable(crawled)
    return crawled

Пример #4

Показать файл

 def crawl(self):
     self.url = input(">>> Enter url of website: ")
     if not self.url:
         self.url = "http://testphp.vulnweb.com"
     if not self.url.startswith("http"):
         self.url = "http://" + self.url
     host = self.url.replace("http://", "").replace("https://", "").split("/")[0]
     current_path = os.path.dirname(os.path.realpath(__file__))
     self.output_dir = os.path.join(current_path, "output/" + host)
     if os.path.exists(self.output_dir):
         chose = input("Scan results are available at output/{}, continue? (Y/N | Default = Y)".format(host))
         if chose.upper() == "N":
             print("Stopping.....")
             exit()
         else:
             shutil.rmtree(self.output_dir)
     os.makedirs(self.output_dir)
     crawl = Crawl(self.url)
     return crawl

Пример #5

Показать файл

Файл: StockAnalysis.py Проект: N66630/StockAnalysis

    sDB_User = _cf["StockAnalysis"]["DB_User"]
    sDB_Pwd = _cf["StockAnalysis"]["DB_Pwd"]
    sDB_Name = _cf["StockAnalysis"]["DB_Name"]
    #endregion

    log = Log.hyLog()  #第一種函數宣告, 要用 instance (或是呼叫函數時第一個引數帶入物件)

    start_date = datetime.date(2019, 11, 1)  #.strftime("%Y%m%d")
    end_date = datetime.date.today()  #.strftime("%Y%m%d")
    day = datetime.timedelta(days=1)  #獲取昨天的日期
    log.writeLog(apname=_APName,
                 text="要處理的時間 ({} ~ {})".format(start_date.strftime("%Y%m%d"),
                                                end_date.strftime("%Y%m%d")))

    # initial crawl object
    craw = Crawl(sDownloadFilePath)
    db = DB(_APName, sDB_Host, sDB_User, sDB_Pwd, sDB_Name)
    sleep_sec = 5
    lastprocmonth = 0
    while start_date <= end_date:
        try:
            # 星期六,日不處理
            if start_date.weekday() == 5 or start_date.weekday() == 6:
                start_date = start_date + day
                continue
            #暫時的 code
            procemonthdata = False
            if start_date.month != lastprocmonth:
                procemonthdata = True
                lastprocmonth = start_date.month