Exemplos de getHtml em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: commen

Método / Função: getHtml

Exemplos em hotexamples.com: 4

getHtml em Python - 4 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de commen.getHtml em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Relacionados

is_userpriv_capable

find_rigid_tfm

goto

matrix

update_extraspikes

DAO

CiSet

create_context

get_D_rho

Pages

Related in langs

HTMLOUT (PHP)

GemToGoldRatePeer (PHP)

PediatricSymptonChecklist (C#)

ArchivoEmpleadoModels (C#)

viewMode (C++)

AddObj2Kill (C++)

NewProxyPlugin (Go)

NewSignedCert (Go)

AbstractPartRenderer (Java)

Template (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: kuaidaili.py Projeto: wangqi504635/webSpider

def get_ip(): page = 1 base_url = 'http://www.kuaidaili.com/proxylist/' while page <= 10: url = base_url + str(page) data = getHtml(url) soup = BeautifulSoup(data,'lxml') for tr in soup.find_all('tr'): ip = tr.contents[1].string port = tr.contents[3].string if 'IP' == ip: continue yield ip,port page+=1 sleep(1)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: kuaidaili.py Projeto: wangqi504635/webSpider

def get_ip(): page = 1 base_url = 'http://www.kuaidaili.com/proxylist/' while page <= 10: url = base_url + str(page) data = getHtml(url) soup = BeautifulSoup(data, 'lxml') for tr in soup.find_all('tr'): ip = tr.contents[1].string port = tr.contents[3].string if 'IP' == ip: continue yield ip, port page += 1 sleep(1)

Exemplo n.º 3

0

Exibir arquivo

Arquivo: qsbk.py Projeto: wangqi504635/webSpider

__author__ = 'wangqi' import re from commen import getHtml # -*- coding:utf-8 -*- page = 1 initail_url = 'http://www.qiushibaike.com/hot/page/' + str(page) html = getHtml(initail_url) pattern = re.compile('<div.*?author">.*?<a.*?<img.*?>(.*?)</a>.*?<div.*?'+ 'content">(.*?).*?</div>(.*?)<div class="stats.*?class="number">(.*?)</i>',re.S) items = re.findall(pattern,html) for item in items: haveImg = re.search("img",item[3]) if not haveImg: print(item[0],item[1],item[2],item[4])

Exemplo n.º 4

0

Exibir arquivo

Arquivo: qsbk.py Projeto: wangqi504635/webSpider

__author__ = 'wangqi' import re from commen import getHtml # -*- coding:utf-8 -*- page = 1 initail_url = 'http://www.qiushibaike.com/hot/page/' + str(page) html = getHtml(initail_url) pattern = re.compile( '<div.*?author">.*?<a.*?<img.*?>(.*?)</a>.*?<div.*?' + 'content">(.*?).*?</div>(.*?)<div class="stats.*?class="number">(.*?)</i>', re.S) items = re.findall(pattern, html) for item in items: haveImg = re.search("img", item[3]) if not haveImg: print(item[0], item[1], item[2], item[4])