Python Scraper Beispiele

Programmiersprache: Python

Namespace / Paketname: issue.scraper.scraper

Klasse / Typ: Scraper

Beispiele auf hotexamples.com: 5

Python Scraper - 5 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die issue.scraper.scraper.Scraper, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

loadHtml(3)

load(3)

extractImageUrls(2)

makeThumbnails(2)

thumbnailImages(1)

Beispiel #1

Datei anzeigen

Datei: test_scraper.py Projekt: ecolemo/issuetrackr

    def testParsingError(self):
        url = "http://test.co.kr"
        def loadHtml(self,url):
            with open('parse_error.html') as f: return f.read()

        Scraper.loadHtml = loadHtml

        scraper = Scraper(url).load()
        self.assertEquals ("no title", scraper.title)
        thumbnailImages = scraper.makeThumbnails(scraper.extractImageUrls(scraper.soup, scraper.siteUrl))
        self.assertEquals([], thumbnailImages)

Beispiel #2

Datei anzeigen

Datei: test_scraper.py Projekt: ecolemo/issuetrackr

 def testLoadWithWrongURL(self):
     url = "http://wrongwuhaha.com/"
     scraper = Scraper(url)
     def loadHtml(url):
         raise urllib2.URLError('no site')
     scraper.loadHtml = loadHtml
     try:
         scraper.load()
         self.fail("no exception")
     except RetrieveDataError, e:
         pass

Beispiel #3

Datei anzeigen

Datei: test_scraper.py Projekt: ecolemo/issuetrackr

    def testMediatoday(self):
        url = "http://www.mediatoday.co.kr/news/articleView.html?idxno=98608"
        scraper = Scraper(url)
        def loadHtml(url):
            with open('mediatoday.html') as f: return f.read()
        scraper.loadHtml = loadHtml

        self.assertEquals (url, scraper.url)
        self.assertEquals ('http://www.mediatoday.co.kr', scraper.siteUrl)

        scraper.load()
        expectedTitle = u'미디어오늘 : "강용석 의원님, 우리는 닥치고 개그나 할게요"'
        self.assertEquals (expectedTitle, scraper.title)

Beispiel #4

Datei anzeigen

Datei: scraper.py Projekt: ecolemo/issuetrackr

def scrap(request, resource_id):
    url = request.GET['url']

    try:
        scraper = Scraper(url).load()

        data = {
            'status':'ok',
            'title':scraper.title,
            'images':scraper.thumbnailImages(),
            'url':url,
            'site_url':scraper.siteUrl,
        }
    except Exception as e:
        print 'controller.scraper:', e
        data = {
            'status':'error'
        }
        
    return render_to_json(data)

Beispiel #5

Datei anzeigen

Datei: test_scraper.py Projekt: ecolemo/issuetrackr

    def testEtomato(self):
        url = "http://news.etomato.com/Home/ReadNews.aspx?no=201886"
        scraper = Scraper(url)
        def loadHtml(url):
            with open('news_etomato.html') as f: return f.read()
        scraper.loadHtml = loadHtml
            
        self.assertEquals (url, scraper.url)
        self.assertEquals ('http://news.etomato.com', scraper.siteUrl)

        scraper.load()
        expectedTitle = u'경제전문 멀티미디어 뉴스 - 뉴스 토마토 -'
        self.assertEquals (expectedTitle, scraper.title)

        thumbnailImages = scraper.makeThumbnails(scraper.extractImageUrls(scraper.soup, scraper.siteUrl))
        self.assertTrue (thumbnailImages is not None)