Python Scraper.loadHtml примеры использования

Язык программирования: Python

Пространство имен/Пакет: issue.scraper.scraper

Класс/Тип: Scraper

Метод/Функция: loadHtml

Примеров на hotexamples.com: 3

Python Scraper.loadHtml - 3 примера найдено. Это лучшие примеры Python кода для issue.scraper.scraper.Scraper.loadHtml, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

loadHtml(3)

load(3)

extractImageUrls(2)

makeThumbnails(2)

thumbnailImages(1)

Пример #1

Показать файл

Файл: test_scraper.py Проект: ecolemo/issuetrackr

 def testLoadWithWrongURL(self):
     url = "http://wrongwuhaha.com/"
     scraper = Scraper(url)
     def loadHtml(url):
         raise urllib2.URLError('no site')
     scraper.loadHtml = loadHtml
     try:
         scraper.load()
         self.fail("no exception")
     except RetrieveDataError, e:
         pass

Пример #2

Показать файл

Файл: test_scraper.py Проект: ecolemo/issuetrackr

    def testMediatoday(self):
        url = "http://www.mediatoday.co.kr/news/articleView.html?idxno=98608"
        scraper = Scraper(url)
        def loadHtml(url):
            with open('mediatoday.html') as f: return f.read()
        scraper.loadHtml = loadHtml

        self.assertEquals (url, scraper.url)
        self.assertEquals ('http://www.mediatoday.co.kr', scraper.siteUrl)

        scraper.load()
        expectedTitle = u'미디어오늘 : "강용석 의원님, 우리는 닥치고 개그나 할게요"'
        self.assertEquals (expectedTitle, scraper.title)

Пример #3

Показать файл

Файл: test_scraper.py Проект: ecolemo/issuetrackr

    def testEtomato(self):
        url = "http://news.etomato.com/Home/ReadNews.aspx?no=201886"
        scraper = Scraper(url)
        def loadHtml(url):
            with open('news_etomato.html') as f: return f.read()
        scraper.loadHtml = loadHtml
            
        self.assertEquals (url, scraper.url)
        self.assertEquals ('http://news.etomato.com', scraper.siteUrl)

        scraper.load()
        expectedTitle = u'경제전문 멀티미디어 뉴스 - 뉴스 토마토 -'
        self.assertEquals (expectedTitle, scraper.title)

        thumbnailImages = scraper.makeThumbnails(scraper.extractImageUrls(scraper.soup, scraper.siteUrl))
        self.assertTrue (thumbnailImages is not None)