Python TidyHTMLTreeBuilder.TreeBuilder示例

编程语言: Python

命名空间/包名称: elementtidy

方法/功能: TreeBuilder

hotexamples.com的示例: 1

Python TidyHTMLTreeBuilder.TreeBuilder - 已找到1个示例。这些是从开源项目中提取的最受好评的elementtidy.TidyHTMLTreeBuilder.TreeBuilder现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

parse(7)

TreeBuilder(1)

示例#1

显示文件

文件： HtmlDom.py 项目： wbornor/feednut

class HtmlDom:
    
    def __init__(self, url):
        try:
            f = file(url)
            data = f.read()
            f.close()
        except IOError, e:
            try:
                result = fetch(url, agent=MOZILLA_AGENT)
                data = result['data']
            except:
                raise IOError, 'invalid URL'
        
        # create parser
        parser = tidy.TreeBuilder()
        parser.feed(data)
        xmlText = _etree.tostring(parser.close())
        
        #create the DOM
        reader = PyExpat.Reader()
        self.dom = reader.fromString(xmlText)
        
        self.nss = {u'html': XHTML_NAMESPACE}
        self.context = xml.xpath.Context.Context(self.dom, processorNss=self.nss)