Python SiteData 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: src.lib.structs

클래스/타입: SiteData

hotexamples.com에서의 예제들: 11

Python SiteData - 11개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 src.lib.structs.SiteData에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

SiteData(10)

name(10)

pages(10)

enabled(3)

use_proxy(2)

base_url(1)

current_page(1)

page_limit(1)

to_request(1)

예제 #1

파일 보기

def config():
    site = SiteData()
    site.name = '快代理'
    site.enabled = True
    site.pages = ['https://www.kuaidaili.com/free/{}/{}'.format(i, ii) for i in ['inha', 'intr'] for ii in
                  range(1, 10)]
    return site

예제 #2

파일 보기

파일: jiangxianli.py 프로젝트: wind959/pyproxy-async

def config():
    site = SiteData()
    site.name = '免费代理IP库'
    site.pages = [
        'http://ip.jiangxianli.com/?page=%d' % i for i in range(1, 5)
    ]
    return site

예제 #3

파일 보기

def config():
    site = SiteData()
    site.name = '齐乐分享'
    site.pages = [
        'https://bbs.76fx.com/ip/pt.php?sxb=&tqsl=1000&port=&export=&ktip=&sxa=&Api=2'
    ]
    return site

예제 #4

파일 보기

def config():
    site = SiteData()
    site.name = 'Github proxy list'
    site.pages = [
        'https://raw.githubusercontent.com/clarketm/proxy-list/master/proxy-list-raw.txt'
    ]
    return site

예제 #5

파일 보기

def config():
    site = SiteData()
    site.name = '云代理 ip3366'
    site.enabled = True
    site.pages = [
        'http://www.ip3366.net/free/?stype=%s&page=%s' % (i, ii)
        for i in range(1, 3) for ii in range(1, 5)
    ]
    return site

예제 #6

파일 보기

파일: ihuan.py 프로젝트: wind959/pyproxy-async

def config():
    site = SiteData()
    site.name = '小幻HTTP代理'
    site.use_proxy = True
    site.pages = ['https://ip.ihuan.me/']
    site.base_url = 'https://ip.ihuan.me/'
    site.page_limit = 20
    site.current_page = 1
    return site

예제 #7

파일 보기

파일: xicidaili.py 프로젝트: wind959/pyproxy-async

def config():
    site = SiteData()
    site.name = '西刺代理'
    site.enabled = True
    site.use_proxy = True
    site.pages = [
        'http://www.xicidaili.com/{}/{}'.format(i, ii)
        for i in ['nn', 'nt', 'wn', 'wt'] for ii in range(1, 5)
    ]
    return site

예제 #8

파일 보기

파일: ip_get.py 프로젝트: wind959/pyproxy-async

 async def crawl_site(self, site: SiteData, page_limit: int = 0):
     headers = {'User-Agent': self.get_user_agent()}
     headers.update(site.headers)
     async with aiohttp.ClientSession(timeout=aiohttp.ClientTimeout(
             Config.DEFAULT_REQUEST_TIME_OUT),
                                      headers=headers) as session:
         pages = site.pages if page_limit == 0 else site.pages[0:page_limit]
         for page in pages:
             try:
                 await self.crawl_single_page(session, site,
                                              site.to_request(page))
             except MaxRetryException as e:
                 Logger.warn('[get] Max retry skip, message: %s' % str(e))
                 continue
             finally:
                 if site.page_interval:
                     await asyncio.sleep(site.page_interval)

예제 #9

파일 보기

def config():
    site = SiteData()
    site.name = 'Spys.me'
    site.pages = ['http://spys.me/proxy.txt']
    return site

예제 #10

파일 보기

def config():
    site = SiteData()
    site.name = 'Proxy daily'
    site.pages = ['https://proxy-daily.com/']
    return site

예제 #11

파일 보기

def config():
    site = SiteData()
    site.name = '全网代理IP'
    site.pages = ['http://www.goubanjia.com/']
    return site