Python ScraperUtils.build_uber_opener примеры использования

Язык программирования: Python

Пространство имен/Пакет: JL

Класс/Тип: ScraperUtils

Метод/Функция: build_uber_opener

Примеров на hotexamples.com: 1

Python ScraperUtils.build_uber_opener - 1 пример найден. Это лучшие примеры Python кода для JL.ScraperUtils.build_uber_opener, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

scraper_main(4)

build_uber_opener(1)

extract_canonical_url(1)

tidy_url(1)

Пример #1

Показать файл

Файл: times.py Проект: bcampbell/journalisted

    return art


def TidyURL( url ):
    """ Tidy up URL - trim off params, query, fragment... """
    o = urlparse.urlparse( url )
    url = urlparse.urlunparse( (o[0],o[1],o[2],'','','') );
    return url

def ContextFromURL( url ):
    """Build up an article scrape context from a bare url."""
    url = TidyURL(url)
    context = {}
    context['srcurl'] = url
    context['permalink'] = url
    context['srcorgname'] = u'times'
    context['lastseen'] = datetime.now()
    return context



if __name__ == "__main__":
    # create a url opener which remembers cookies (as well as throttling and all the other uber-opener stuff)
    cj = cookielib.LWPCookieJar()
    opener = ScraperUtils.build_uber_opener(cookiejar=cj)

    # large maxerrors to handle video-only pages
    ScraperUtils.scraper_main( FindArticles, ContextFromURL, Extract, max_errors=200, prep=Prep, sesh=opener )