Python PageCrawler.crawl примеры использования

Язык программирования: Python

Пространство имен/Пакет: data_scrapers

Класс/Тип: PageCrawler

Метод/Функция: crawl

Примеров на hotexamples.com: 2

Python PageCrawler.crawl - 2 примера найдено. Это лучшие примеры Python кода для data_scrapers.PageCrawler.crawl, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

crawl(2)

get_data(2)

Основные методы

crawl (2)

get_data (2)

Пример #1

Показать файл

Файл: db_updaters.py Проект: blennon/lc_scraper

    def get_new_loan_pages(self, wait, N):
        LPP = LoanPageParser()
        loanids = self.new_loans_set()

        # pull N loan pages at a time and insert into DB
        counter = 0
        num_loanids = len(loanids)
        while len(loanids)>0:
            LC = PageCrawler(self.loan_page_url, self.loan_page_login_str, wait)
            
            # create subset of loans to crawl for
            loans_to_grab = []
            for i in range(N):
                try:
                    loans_to_grab.append(loanids.pop())
                except IndexError:
                    break
                
            LC.crawl(loans_to_grab)
            loans = LC.get_data()
           
            # parse loan and insert into DB
            for loanID in loans:
                html = loans[loanID]
                db_doc = LPP.parse_html(html)
                self.loans.update({'loanID':db_doc['loanID']},
                                  {'$set': db_doc}, upsert=True, safe=True)
                counter += 1
            print 'inserted loan %s of %s' % (counter, num_loanids)

Пример #2

Показать файл

Файл: db_updaters.py Проект: blennon/lc_scraper

 def get_note_pages(self, note_tups, wait):
     PC = PageCrawler(self.note_page_url, self.login_str, wait)    
     PC.crawl(note_tups)
     return PC.get_data()