Python MogoQueue.clear 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mongodb_queue

클래스/타입: MogoQueue

메소드/함수: clear

hotexamples.com에서의 예제들: 2

Python MogoQueue.clear - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mongodb_queue.MogoQueue.clear에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MogoQueue(21)

peek(10)

clear(2)

push(2)

pop_title(1)

예제 #1

파일 보기

def startDown(url, rule, num, start, decoding=None):
    if not decoding:
        decoding = 'utf8'
    #req=urllib.request.urlopen(url)
    #response= request.get(url, 3)
    #body=response.text #req.read().decode(decoding)

    f = open(url)
    body = f.read()
    f.close()
    debs = body.split('\n')

    rule = re.compile(rule)
    #debs=rule.findall(body)
    crawl_queue = MogoQueue('cetc15-apt', 'crawl_queue')
    crawl_queue.clear()  #
    for l in debs:
        l = l.strip()
        if (len(l) == 0 or not l.startswith(PREFIX_STR)):
            continue
        print 'deb:' + l[start:]
        crawl_queue.push(l[start:], 'a')
    for i in range(num):
        d = download(crawl_queue)
        d.start()

예제 #2

파일 보기

파일: E_Hen_spider2_1.py 프로젝트: zhipeter/Python

def start(url):
    response = request.get(url, 3)
    Soup = BeautifulSoup(response.text, 'lxml')
    title = Soup.find('div', class_='gm').find('h1', id='gj').get_text()
    spider_queue = MogoQueue('meinv', 'img_queue')
    spider_queue.clear()
    print(u'清除集合img_queue')
    spider_queue = MogoQueue('meinv', 'img_queue')
    print(u'新建集合img_queue')
    max_span = Soup.find('table', class_='ptt').find_all('td')[-2].get_text()
    page_url = url
    for i in range(1,int(max_span)+1):
        html = request.get(page_url, 3)
        Soup = BeautifulSoup(html.text, 'lxml')
        all_a = Soup.find('div', id='gdt').find_all('a')
        for a in all_a:
            href = a['href']
            name = a.img['alt']
            spider_queue.push(href, title,name)
        page_url =url+'?p='+str(i)