Python HTMLParser.feed Beispiele

Programmiersprache: Python

Namespace / Paketname: lxml.etree

Klasse / Typ: HTMLParser

Methode / Funktion: feed

Beispiele auf hotexamples.com: 4

Python HTMLParser.feed - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die lxml.etree.HTMLParser.feed, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

HTMLParser(30)

feed(4)

close(3)

Häufig verwendete Methoden

HTMLParser (30)

feed (4)

close (3)

Beispiel #1

Datei anzeigen

Datei: html.py Projekt: nijel/weblate

def extract_bleach(text):
    """Extract tags from text in a form suitable for bleach."""
    extractor = MarkupExtractor()
    parser = HTMLParser(collect_ids=False, target=extractor)
    parser.feed(text)
    return {
        "tags": extractor.found_tags,
        "attributes": extractor.found_attributes
    }

Beispiel #2

Datei anzeigen

def parse_html(name, html):
    """
    Parse the provided html to find a dataset
    """
    parser = HTMLParser(encoding="UTF-8")
    try:
        parser.feed(html)
        dom = parser.close()
    except:
        return {}

    dataset = {
        u'name': name,
        u'title': get_title(dom),
        u'notes': get_notes(dom),
        u'owner_org': get_owner_org(dom),
        u'resources': parse_resources(dom),
    }

    dataset.update(get_extra_meta(dom))

    return dataset

Beispiel #3

Datei anzeigen

Datei: dm_parse.py Projekt: summertriangle-dev/arposandra

def dm_to_html_v2(dmtext, klass=DMWalkState, tag=None):
    mark = str(uuid.uuid4())
    dmtext, has_blinds = fix_tags(dmtext)
    p = HTMLParser()
    p.feed(f"<div id='{mark}'>".encode("ascii"))
    p.feed(dmtext)
    p.feed(b"</div>")

    doc = p.close()
    root = doc.find(f".//div[@id = '{mark}']")

    synth_root = klass(for_region=tag)
    synth_root.ingest_element(root)

    return synth_root

Beispiel #4

Datei anzeigen

Datei: dm_parse.py Projekt: summertriangle-dev/arposandra

def dm_to_html(dmtext, tag=None):
    mark = str(uuid.uuid4())
    dmtext, has_blinds = fix_tags(dmtext)
    p = HTMLParser()
    p.feed(f"<div id='{mark}'>".encode("ascii"))
    p.feed(dmtext)
    p.feed(b"</div>")

    doc = p.close()
    root = doc.find(f".//div[@id = '{mark}']")

    synth_root = DMWalkState(for_region=tag)
    synth_root.ingest_element(root)

    text = synth_root.get_html()
    if has_blinds:
        text = FIX_BLIND_TIMESTAMP_CODES.sub(fix_blind_ts, text)

    return (
        text,
        list(synth_root.card_master_references) or None,
        list(synth_root.image_references) or None,
    )