Python AdvancedHTMLParser.getRootNodes 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: AdvancedHTMLParser.Parser

클래스/타입: AdvancedHTMLParser

메소드/함수: getRootNodes

hotexamples.com에서의 예제들: 3

Python AdvancedHTMLParser.getRootNodes - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 AdvancedHTMLParser.Parser.AdvancedHTMLParser.getRootNodes에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

AdvancedHTMLParser(30)

getElementById(21)

parseStr(12)

getHTML(9)

getRoot(3)

parseFile(2)

getRootNodes(2)

reset(1)

getMiniHTML(1)

getFormattedHTML(1)

contains(1)

getElementsByName(1)

getElementsByClassName(1)

getElementsByAttr(1)

createElementsFromHTML(1)

createElementFromHTML(1)

createElement(1)

setRoot(1)

예제 #1

파일 보기

파일: test_Building.py 프로젝트: wangxl1998/AdvancedHTMLParser

    def test_multipleRoot(self):
        parser = AdvancedHTMLParser()

        root1 = AdvancedTag('div')
        root1.setAttribute('id', 'div1')

        root2 = AdvancedTag('div')
        root2.setAttribute('id', 'div2')

        parser.parseStr(root1.outerHTML + root2.outerHTML)

        assert len(
            parser.getRootNodes()) == 2, 'Expected two root nodes on tree'

        foundRoot1 = parser.getElementById('div1')
        assert foundRoot1, 'Expected to find id=div1 in multi-root tree'

        foundRoot2 = parser.getElementById('div2')
        assert foundRoot2, 'Expected to find id=div1 in multi-root tree'

        combinedHTML = (foundRoot1.outerHTML + foundRoot2.outerHTML).replace(
            '\n', '').strip()
        parsedHTML = parser.getHTML().replace('\n', '').strip()

        assert combinedHTML == parsedHTML, 'Expected single element outerHTMLs to match parser HTML. """\n%s\n""" != """\n%s\n"""' % (
            combinedHTML, parsedHTML)

예제 #2

파일 보기

파일: test_InvalidHtml.py 프로젝트: wangxl1998/AdvancedHTMLParser

    def test_HandleMultipleRoot(self):
        parser = AdvancedHTMLParser()
        try:
            parser.parseStr(MULTIPLE_ROOT)
        except Exception as e:
            raise AssertionError('Failed to properly parse invalid HTML with multiple root nodes')

        oneEm = parser.getElementById('one')
        assert oneEm , 'Failed to find first element'
        assert len(parser.getRootNodes()) == 2

예제 #3

파일 보기

파일: test_Building.py 프로젝트: RLWJR/AdvancedHTMLParser

    def test_multipleRoot(self):
        parser = AdvancedHTMLParser()

        root1 =  AdvancedTag('div')
        root1.setAttribute('id', 'div1')

        root2 = AdvancedTag('div')
        root2.setAttribute('id', 'div2')

        parser.parseStr(root1.outerHTML + root2.outerHTML)

        assert len(parser.getRootNodes()) == 2, 'Expected two root nodes on tree'

        foundRoot1 = parser.getElementById('div1')
        assert foundRoot1, 'Expected to find id=div1 in multi-root tree'

        foundRoot2 = parser.getElementById('div2')
        assert foundRoot2, 'Expected to find id=div1 in multi-root tree'

        combinedHTML = (foundRoot1.outerHTML + foundRoot2.outerHTML).replace('\n', '').strip()
        parsedHTML = parser.getHTML().replace('\n', '').strip()

        assert combinedHTML == parsedHTML, 'Expected single element outerHTMLs to match parser HTML. """\n%s\n""" != """\n%s\n"""' %(combinedHTML, parsedHTML)