Python DefaultScraper.encodeurl 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pycrawler.scraper

클래스/타입: DefaultScraper

메소드/함수: encodeurl

hotexamples.com에서의 예제들: 3

Python DefaultScraper.encodeurl - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pycrawler.scraper.DefaultScraper.encodeurl에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

encodeurl(3)

parseurl(3)

fetch(1)

fetchone(1)

자주 사용되는 메소드들

encodeurl (3)

parseurl (3)

fetch (1)

fetchone (1)

예제 #1

파일 보기

파일: test_scraper.py 프로젝트: ymero/PyCrawler

 def test_url(self):
     url = 'http://www.google.com'
     data = {'a': 1, 'b': 2, 'c': 3}
     full = DefaultScraper.encodeurl('POST', url, data)
     self.assertTrue('<args>' in full)
     url2, data2 = DefaultScraper.parseurl(full)
     self.assertEqual(url, url2)
     self.assertEqual(data, data2)

예제 #2

파일 보기

파일: WSJCrawler.py 프로젝트: ymero/PyCrawler

 def _parsepage(self, page, oriurl):
     page = page[page.index('> ')+2:-5].strip()
     if ',' in page:
         page = page.replace(',', '')
     if page.startswith('1-'):
         url, data = DefaultScraper.parseurl(oriurl)
         keyword = data['KEYWORDS']
         total = int(page.split(' of ')[1])
         phase = Phase(data['fromDate'], data['toDate'], keyword, total)
         urls = []
         for i in xrange(2, phase.pages+1):
             data['page_no'] = i
             urls.append(DefaultScraper.encodeurl('POST', url, data))
         self._spider.addtask(urls)
         return phase

예제 #3

파일 보기

파일: WSJCrawler.py 프로젝트: ymero/PyCrawler

def generateseeds(keyword, year, month=None):
    base = 'http://online.wsj.com/search/term.html?KEYWORDS=' + urllib.quote(keyword)
    data = {'KEYWORDS': keyword,
            'fromDate': '',
            'toDate': '',
            'source': 'WSJ.com',
            'media': 'All',
            'page_no': '',
            'sorted_by': 'relevance',
            'date_range': '90 days',
            'adv_search': 'open'}
    urls = []
    if not month:
        month = list(xrange(1, 13))
    for y in year:
        for m in month:
            ys = str(y % 100) if y % 100 >= 10 else ('0' + str(y % 100))
            ms = str(m) if m >= 10 else ('0' + str(m))
            d = lastday(y, m)
            ds = str(d) if d >= 10 else ('0' + str(d))
            data['fromDate'] = ms+'/01/'+ys
            data['toDate'] = ms+'/'+ds+'/'+ys
            urls.append(DefaultScraper.encodeurl('POST', base, data))
    return urls