Python HtmlParser.parser_json示例

编程语言: Python

命名空间/包名称: parsers

类/类型: HtmlParser

方法/功能: parser_json

hotexamples.com的示例: 1

Python HtmlParser.parser_json - 已找到1个示例。这些是从开源项目中提取的最受好评的parsers.HtmlParser.parser_json现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

get_text(7)

get_links(4)

HtmlParser(3)

_parse_movies(1)

get_meta(1)

get_transcludes(1)

parse_urls(1)

parser_json(1)

示例#1

显示文件

class SpiderMain(object):
    
    def __init__(self):
        self.manager = URLManager()
        self.down = Download()
        self.parser = HtmlParser()
        self.output = DataOutput()
    
    def crawl(self, root_url):
        content = self.down.download(root_url)
        movie_ids = self.parser.parse_urls(content)
        count = 0
        
        for mid in movie_ids:
            if count > 10:
                break
            movie_link = '''http://service.library.mtime.com/Movie.api?\
            Ajax_CallBack=true\
            &Ajax_CallBackType=Mtime.Library.Services\
            &Ajax_CallBackMethod=GetMovieOverviewRating\
            &Ajax_CrossDomain=1\
            &Ajax_RequestUrl=http%3A%2F%2Fmovie.mtime.com%2F{0}%2F\
            &t={1}\
            &Ajax_CallBackArgument0={2}\
            '''.format(mid, datetime.datetime.now().strftime("%Y%m%d%H%M%S%f"), mid)
            
            res = self.down.download(movie_link.replace(' ', ''))
            self.parser.parser_json(res)
            count += 1
        
        self.output.store_data(self.parser.items)
        self.output.close_connect()