Python RequestModel 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: model.RequestModel

클래스/타입: RequestModel

hotexamples.com에서의 예제들: 4

Python RequestModel - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 model.RequestModel.RequestModel에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

getProxies(4)

getHeaders(2)

자주 사용되는 메소드들

getProxies (4)

getHeaders (2)

예제 #1

파일 보기

    def run(self):
        while not self.NOT_EXIST:
            # 队列为空, 结束
            if self.queue.empty():
                NOT_EXIST = 1
                self.queue.task_done()
                break

            url = self.queue.get()
            try:
                response = requests.get(url,
                                        headers=RequestModel.getHeaders(),
                                        proxies=RequestModel.getProxies(),
                                        timeout=3)
                print('Top 子线程 ' + str(self.id) + ' 请求【 ' + url + ' 】的结果： ' +
                      str(response.status_code))
                # time.sleep(1000)

                # 需将电影天堂的页面的编码改为 GBK, 不然会出现乱码的情况
                response.encoding = 'GBK'

                if response.status_code != 200:
                    self.queue.put(url)
                    time.sleep(20)
                else:
                    temp = dytt_Lastest.getMoiveInforms(url, response.text)
                    TaskQueue.getContentQueue().put(temp)
                time.sleep(5)

            except Exception as e:
                # self.queue.put(url)
                print(e)

예제 #2

파일 보기

    def getMaxsize(cls):
        response = requests.get(cls.breakoutUrl,
                                headers=RequestModel.getHeaders(),
                                proxies=RequestModel.getProxies(),
                                timeout=3)
        # 需将电影天堂的页面的编码改为 GBK, 不然会出现乱码的情况
        response.encoding = 'GBK'

        selector = etree.HTML(response.text)
        # 提取信息
        optionList = selector.xpath("//select[@name='sldd']/text()")
        return len(optionList) - 1  # 因首页重复, 所以要减1

예제 #3

파일 보기

    def run(self):
        while not self.NOT_EXIST:
            # 队列为空, 结束
            if self.queue.empty():
                NOT_EXIST = 1
                self.queue.task_done()
                break

            url = self.queue.get()
            try:
                response = requests.get(url,
                                        headers=RequestModel.getHeaders(),
                                        proxies=RequestModel.getProxies(),
                                        timeout=3)
                print('Floor 子线程 ' + str(self.id) + ' 请求【 ' + url + ' 】的结果： ' +
                      str(response.status_code))
                # time.sleep(1000)

                # 需将电影天堂的页面的编码改为 GBK, 不然会出现乱码的情况
                response.encoding = 'GBK'

                if response.status_code != 200:
                    self.queue.put(url)
                    time.sleep(20)
                else:
                    moivePageUrlList = dytt_Lastest.getMoivePageUrlList(
                        response.text)
                    for item in moivePageUrlList:
                        each = self.host + item
                        # print(each)
                        # time.sleep(1000)
                        TaskQueue.putToMiddleQueue(each)
                time.sleep(3)  # 5

            except Exception as e:
                # print('catsh  Exception ==== ')
                # self.queue.put(url)
                print(e)

예제 #4

파일 보기

파일: test.py 프로젝트: wylunbelievable/spider

# ========================================================================================
# Top 子线程 3 请求【 http://www.dytt8.net/html/gndy/dyzz/20141029/46502.html 】的结果： 200
# Top 子线程 2 请求【 http://www.dytt8.net/html/gndy/dyzz/20141026/46484.html 】的结果： 200
# Top 子线程 0 请求【 http://www.dytt8.net/html/gndy/dyzz/20141022/46458.html 】的结果： 200
# ========================================================================================
# Top 子线程 4 请求【 http://www.dytt8.net/html/gndy/dyzz/20120815/38998.html 】的结果： 200
# Top 子线程 3 请求【 http://www.dytt8.net/html/gndy/dyzz/20120811/38936.html 】的结果： 200
# Top 子线程 0 请求【 http://www.dytt8.net/html/gndy/dyzz/20120825/39129.html 】的结果： 200
# Top 子线程 1 请求【 http://www.dytt8.net/html/gndy/dyzz/20120809/38919.html 】的结果： 200
# Top 子线程 2 请求【 http://www.dytt8.net/html/gndy/dyzz/20120807/38894.html 】的结果： 200
# Top 子线程 3 请求【 http://www.dytt8.net/html/gndy/dyzz/20120904/39251.html 】的结果： 200

# '''
url = 'http://www.dytt8.net/html/gndy/dyzz/20120807/38894.html'
response = requests.get(url,
                        headers=RequestModel.getHeaders(),
                        proxies=RequestModel.getProxies(),
                        timeout=3)
print(' 请求【 ' + url + ' 】的结果： ' + str(response.status_code))
response.encoding = 'GBK'
selector = etree.HTML(response.text)
# print(response.text)   # 页面内容

content = selector.xpath(
    "//div[@class='co_content8']/ul/tr/td/div/td/p/text()")
print('第 1 次： content')
print(content)

# 匹配出来有两张图片, 第一张是海报, 第二张是电影画面截图
imgs = selector.xpath("//div[@class='co_content8']/ul/tr/td/div/td/p/img/@src")