Exemplos de get_pic_link em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: myapp.parser

Método / Função: get_pic_link

Exemplos em hotexamples.com: 3

get_pic_link em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de myapp.parser.get_pic_link em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Relacionados

get_bool_param

db_version

get_output

latlongs_to_networked_locations

set_password

SnmpTrapUtils

LineSearch

ordered_unique

get_event

unregisterObserver

Related in langs

RepositoryServices (PHP)

rexform (PHP)

UstKategoriler (C#)

NodeViewModel (C#)

fixnum_to_bignum (C++)

HPX_TEST (C++)

NewMemcache (Go)

Executer (Go)

CopySpecInternal (Java)

LiRhsPart (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: tasks.py Projeto: hackstoic/fdbbs_picture_downloader

def crawl(self): """ 使用递归，需要解决最大递归深度的问题 RuntimeError: maximum recursion depth exceeded while calling a Python object """ print "start crawling url: %s" % self.start_url raw_html_data = downloader.read_page(url=self.start_url) if not raw_html_data: return 1 urlmanager.update_url(url=self.start_url, status=1) pic_links = parser.get_pic_link(raw_html_data) next_link = parser.get_next_link(raw_html_data) for pic_link in pic_links: print "get picture link: %s" % pic_link self.PicMgrObj.download_picture(pic_link) file_name, postfix = self.PicMgrObj.extract_pic_name(pic_link) desc = "查看描述请前往：%s" % self.start_url self.PicMgrObj.save_desc(file_name=file_name, desc=desc) urlmanager.update_url(url=next_link) non_visited_urls = urlmanager.get_non_visited_urls() while non_visited_urls: # 只要有没被访问过的url，就一直递归爬取下去 for url in non_visited_urls: self.start_url = url self.crawl() return 0

Exemplo n.º 2

0

Exibir arquivo

Arquivo: tasks.py Projeto: hackstoic/fdbbs_picture_downloader

def crawl(self): """ 使用递归，需要解决最大递归深度的问题 RuntimeError: maximum recursion depth exceeded while calling a Python object """ print "start crawling url: %s" % self.start_url raw_html_data = downloader.read_page(url=self.start_url) if not raw_html_data: return 1 urlmanager.update_url(url=self.start_url, status=1) pic_links = parser.get_pic_link(raw_html_data) next_link = parser.get_next_link(raw_html_data) for pic_link in pic_links: print "get picture link: %s" % pic_link self.PicMgrObj.download_picture(pic_link) file_name, postfix = self.PicMgrObj.extract_pic_name(pic_link) desc = "查看描述请前往：%s" % self.start_url self.PicMgrObj.save_desc(file_name=file_name, desc=desc) urlmanager.update_url(url=next_link) non_visited_urls = urlmanager.get_non_visited_urls() while non_visited_urls: # 只要有没被访问过的url，就一直递归爬取下去 for url in non_visited_urls: self.start_url = url self.crawl() return 0

Exemplo n.º 3

0

Exibir arquivo

Arquivo: tests.py Projeto: hackstoic/fdbbs_picture_downloader

def test_get_pic_link(self): rawdata = read_page(self.url) res = get_pic_link(rawdata) print res return res