Python convert_entitiesの例

プログラミング言語: Python

名前空間/パッケージ名: opencore.utilities.converters.entities

メソッド/関数: convert_entities

hotexamples.comのコード掲載数: 3

Python convert_entities - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのopencore.utilities.converters.entities.convert_entitiesの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: html.py プロジェクト: junkafarian/opencore

    def convert(self, filename, encoding=None, mimetype=None):
        # XXX: dont read entire file into memory
        doc = open(filename, 'r').read()

        # convert to unicode
        if not encoding:
            mo = charset_reg.search(doc)
            encoding = mo.group(1)
        doc = unicode(doc, encoding, 'replace')
        doc = convert_entities(doc)
        result = html2text(doc)

        # convert back to utf-8
        return StringIO.StringIO(result.encode('utf-8')), 'utf-8'

コード例 #2

ファイルを表示

ファイル: sgml.py プロジェクト: amarandon/opencore

    def convert(self, filename, encoding, mimetype):

        # XXX: dont read entire file into memory
        doc = open(filename, 'r').read()

        # Use encoding from XML preamble if present
        mo = encoding_reg.search(doc)
        if mo:
            encoding = mo.group(1)

        if not encoding:
            encoding = default_encoding
        
        if not isinstance(doc, unicode):
            doc = unicode(doc, encoding, 'replace')
        doc = convert_entities(doc)
        doc = doc.encode('utf-8')
        p = StripTagParser()
        p.feed(doc)
        p.close()
        return StringIO.StringIO(p), 'utf-8'

コード例 #3

ファイルを表示

ファイル: adapters.py プロジェクト: amarandon/opencore

def extract_text_from_html(text):
    if not isinstance(text, unicode):
        text = unicode(text, 'utf-8', 'replace')
    return html2text(convert_entities(text))