Python Tidy.setXmlOut примеры использования

Язык программирования: Python

Пространство имен/Пакет: org.w3c.tidy

Класс/Тип: Tidy

Метод/Функция: setXmlOut

Примеров на hotexamples.com: 1

Python Tidy.setXmlOut - 1 пример найден. Это лучшие примеры Python кода для org.w3c.tidy.Tidy.setXmlOut, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

setWraplen(3)

setIndentAttributes(3)

setIndentContent(3)

setSmartIndent(3)

setNumEntities(3)

parse(2)

Tidy(1)

setQuoteAmpersand(1)

setXHTML(1)

setTrimEmptyElements(1)

setShowWarnings(1)

setOutputEncoding(1)

setQuiet(1)

setPrintBodyOnly(1)

setMakeClean(1)

setInputEncoding(1)

setDropEmptyParas(1)

parseDOM(1)

setXmlOut(1)

Пример #1

Показать файл

Файл: examples.py Проект: gidiko/gridapp

    def crawl(site, trm , depth, linksfile):
        from java.net import URL
        from org.w3c.tidy import Tidy
        pattern = re.compile('href="/wiki/(.*?)"')
        f = open(linksfile, 'a+')
        #try:
        if depth < MAX_DEPTH:
            print 'crawling [%s]...' % trm,
            print >> f, '[%s]' % trm

            td = Tidy()
            td.setXmlOut(1)

            u = URL(site + trm)

            input = BufferedInputStream(u.openStream())
            output = ByteArrayOutputStream()
            #tidy.setInputEncoding("UTF8")
            #tidy.setOutputEncoding("UTF8")

            td.parse(input, output)
            content = output.toString()
            hits = pattern.findall(content)

            for hit in hits:
                if hit.find(":") == -1:
                    print >> f, hit
            print 'done.'
            print >> f, ''
            for hit in hits:
                if hit.find(":") == -1:
                    crawl(site, hit, depth + 1, linksfile)
        #except:
        #    print "wrong"
        f.close()