Python Tidy.parseの例

プログラミング言語: Python

名前空間/パッケージ名: org.w3c.tidy

クラス/型: Tidy

メソッド/関数: parse

hotexamples.comのコード掲載数: 2

Python Tidy.parse - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのorg.w3c.tidy.Tidy.parseの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

setWraplen(3)

setIndentAttributes(3)

setIndentContent(3)

setSmartIndent(3)

setNumEntities(3)

parse(2)

Tidy(1)

setQuoteAmpersand(1)

setXHTML(1)

setTrimEmptyElements(1)

setShowWarnings(1)

setOutputEncoding(1)

setQuiet(1)

setPrintBodyOnly(1)

setMakeClean(1)

setInputEncoding(1)

setDropEmptyParas(1)

parseDOM(1)

setXmlOut(1)

コード例 #1

ファイルを表示

ファイル: examples.py プロジェクト: gidiko/gridapp

    def crawl(site, trm , depth, linksfile):
        from java.net import URL
        from org.w3c.tidy import Tidy
        pattern = re.compile('href="/wiki/(.*?)"')
        f = open(linksfile, 'a+')
        #try:
        if depth < MAX_DEPTH:
            print 'crawling [%s]...' % trm,
            print >> f, '[%s]' % trm

            td = Tidy()
            td.setXmlOut(1)

            u = URL(site + trm)

            input = BufferedInputStream(u.openStream())
            output = ByteArrayOutputStream()
            #tidy.setInputEncoding("UTF8")
            #tidy.setOutputEncoding("UTF8")

            td.parse(input, output)
            content = output.toString()
            hits = pattern.findall(content)

            for hit in hits:
                if hit.find(":") == -1:
                    print >> f, hit
            print 'done.'
            print >> f, ''
            for hit in hits:
                if hit.find(":") == -1:
                    crawl(site, hit, depth + 1, linksfile)
        #except:
        #    print "wrong"
        f.close()

コード例 #2

ファイルを表示

ファイル: preview.py プロジェクト: kiranba/the-fascinator

 def __tidy(self, content):
     tidy = Tidy()
     tidy.setIndentAttributes(False)
     tidy.setIndentContent(False)
     tidy.setPrintBodyOnly(True)
     tidy.setSmartIndent(False)
     tidy.setWraplen(0)
     tidy.setXHTML(True)
     tidy.setNumEntities(True)
     tidy.setShowWarnings(False)
     tidy.setQuiet(True)
     out = ByteArrayOutputStream()
     tidy.parse(IOUtils.toInputStream(content, "UTF-8"), out)
     return out.toString("UTF-8")