Exemplos de LLXSParser em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: parser

Classe / Tipo: LLXSParser

Exemplos em hotexamples.com: 2

LLXSParser em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de parser.LLXSParser em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

parse_content_page(1)

parse_list_page(1)

parse_novel_page(1)

to_utf8(1)

Métodos Frequentes

parse_content_page (1)

parse_list_page (1)

parse_novel_page (1)

to_utf8 (1)

Relacionados

Backend

UCFRHandler

JabberAdapter

DiscardLocalChanges

bursts_printer

LatentLocationUpdate

save_config_file

DataHandling

TimespanMaker

gensalt

Related in langs

Kelunik\AcmeClient\getArgumentDescription (PHP)

K2HelperAttachments (PHP)

IntraObjectHandler (C#)

SangriaInfo (C#)

PSDRV_WriteLineTo (C++)

AvailMem (C++)

SendHtmlMail (Go)

Evaluate (Go)

MClient (Java)

BPMNOSGIService (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: crawler_service.py Projeto: lingcarzy/novel-1

class LLXSCrawler(Crawler): def __init__(self): Crawler.__init__(self) self.parser = LLXSParser() def crawl(self, url): #get novel page html = utils.http_get(url, encode="gbk") html = self.parser.to_utf8(html) #html = utils.gbk_to_utf8(html) novel = self.parser.parse_novel_page(url, html) list_url = novel['list_url'] html = utils.http_get(list_url, encode='gbk') html = self.parser.to_utf8(html) chapter_list = self.parser.parse_list_page(list_url, html) novel['chapter_list'] = chapter_list novel["chapters"] = len(chapter_list) novel['update_time'] = time.time() novel["last_chapter"] = chapter_list[-1]["url"] return novel def crawl_content(self, url): html = utils.http_get(url, encode='gbk') html = self.parser.to_utf8(html) content = self.parser.parse_content_page(url, html) return content

Exemplo n.º 2

0

Exibir arquivo

Arquivo: crawler_service.py Projeto: lingcarzy/novel-1

def __init__(self): Crawler.__init__(self) self.parser = LLXSParser()