Python setupRequest 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: webutils

메소드/함수: setupRequest

hotexamples.com에서의 예제들: 8

Python setupRequest - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 webutils.setupRequest에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: crawler.py 프로젝트: zhuyue1314/scripts-1

	def scanPage(self, url, depth):
		req = urllib2.Request(url)
		webutils.setupRequest(req)
		response = self._opener.open(req)
		if response == None:
			raise StopIteration()
		try:
			html = response.read()
		except:
			raise StopIteration()

		links = self._reexp.findall(html)
		linkRec = set()
		for link in links:
			if re.search(r'^javascript:', link):
				continue
			link = self.adjustUrl(url, link)
			if not link in self._linkList and not link in linkRec:
				if link.find(self._scope) != -1:
					linkRec.add(link)
					yield link
		self._linkList = self._linkList.union(linkRec)
		if self._maxCount >= 0 and len(self._linkList) >= self._maxCount:
		  	raise StopIteration()

		depth -= 1
		if depth <= 0:
			raise StopIteration()

		for link in linkRec:				
			for link2 in self.scanPage(link, depth):
				yield link2

예제 #2

파일 보기

파일: gfsoso.py 프로젝트: zhuyue1314/scripts-1

def _refreshCookie(opener, what):

    what = urllib2.quote(what)
    url = GFSOSO_HOME + '?q=%s' % (what)
    req = urllib2.Request(url)
    webutils.setupRequest(req)
    req.add_header('Referer', GFSOSO_HOME)
    try:
        response = opener.open(req, timeout=REQ_TIMEOUT)
        # print response.geturl()
        if response.geturl().find(GFSOSO_HOME) == -1:
            global RedirectedUrl
            RedirectedUrl = response.geturl()
            RedirectedUrl = RedirectedUrl[0:RedirectedUrl.find('/', 7) + 1]
            # print 'Redirect', RedirectedUrl
            return False

        html = response.read()
    except Exception, e:
        print e
        html = ''
        if e.code == 301:  # moved
            # html = reduce(lambda x,y: x + y, e.readlines())
            for line in e.readlines():
                html += line
        else:
            print "Exception: url: %s - " % url, e
            return False

예제 #3

파일 보기

파일: gfsoso.py 프로젝트: brock7/scripts

def _refreshCookie(opener, what):

	what = urllib2.quote(what)
	url = GFSOSO_HOME + '?q=%s' % (what)
	req = urllib2.Request(url)
	webutils.setupRequest(req)
	req.add_header('Referer', GFSOSO_HOME)
	try:
		response = opener.open(req, timeout = REQ_TIMEOUT)
		# print response.geturl()
		if response.geturl().find(GFSOSO_HOME) == -1:
			global RedirectedUrl
			RedirectedUrl = response.geturl()
			RedirectedUrl = RedirectedUrl[0 : RedirectedUrl.find('/', 7) + 1]
			# print 'Redirect', RedirectedUrl
			return False

		html = response.read()
	except Exception, e:
		print e
		html = ''
		if e.code == 301: # moved
			# html = reduce(lambda x,y: x + y, e.readlines())
			for line in e.readlines():
				html += line
		else:
			print "Exception: url: %s - " % url, e
			return False

예제 #4

파일 보기

파일: gfsoso.py 프로젝트: zhuyue1314/scripts-1

def _gfsosoPageHandler(opener, url):
    req = urllib2.Request(url)
    webutils.setupRequest(req)
    req.add_header('Referer', url[:-4])

    try:
        response = opener.open(req, timeout=REQ_TIMEOUT)
        html = response.read()
        #print html
    except Exception, e:
        print "Exception: url: %s - " % url, e
        raise StopIteration()

예제 #5

파일 보기

파일: gfsoso.py 프로젝트: brock7/scripts

def _gfsosoPageHandler(opener, url):
	req = urllib2.Request(url)
	webutils.setupRequest(req)
	req.add_header('Referer', url[:-4])

	try:
		response = opener.open(req, timeout = REQ_TIMEOUT)
		html = response.read()
		#print html
	except Exception, e:
		print "Exception: url: %s - " % url, e
		raise StopIteration()

예제 #6

파일 보기

파일: searchbase.py 프로젝트: zhuyue1314/scripts-1

    def _pageHandler(self, url):
        # print 'page handler'
        req = urllib2.Request(url)
        webutils.setupRequest(req)
        req.add_header('Referer', url[:-4])

        try:
            response = self._opener.open(req, timeout=self.reqTimeout)
            html = response.read()
            # print html
        except Exception, e:
            print "Exception: url: %s - " % url, e
            raise StopIteration()

예제 #7

파일 보기

파일: bingsearch.py 프로젝트: zhuyue1314/scripts-1

def _bingSearchPageHandler(opener, url):
    #print url
    #response = opener.open(url, data = None, timeout = 10)
    req = urllib2.Request(url)
    webutils.setupRequest(req)
    req.add_header('Proxy-Connection', 'Keep-Alive')

    try:
        response = opener.open(req, timeout=REQ_TIMEOUT)
        html = response.read()
        #print html
    except Exception, e:
        print "Exception: url: %s - " % url, e
        raise StopIteration()

예제 #8

파일 보기

파일: bingsearch.py 프로젝트: brock7/scripts

def _bingSearchPageHandler(opener, url):
	#print url
	#response = opener.open(url, data = None, timeout = 10)
	req = urllib2.Request(url)
	webutils.setupRequest(req) 
	req.add_header('Proxy-Connection', 'Keep-Alive')

	try:
		response = opener.open(req, timeout = REQ_TIMEOUT)
		html = response.read()
		#print html
	except Exception, e:
		print "Exception: url: %s - " % url, e
		raise StopIteration()