Python preprocess 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mwlib.xhtmlwriter

메소드/함수: preprocess

hotexamples.com에서의 예제들: 9

Python preprocess - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mwlib.xhtmlwriter.preprocess에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def to_html(cls, kb_entry):
     r = kb_entry.body.replace("\r", "")
     parsed = parseString(title=kb_entry.subject, raw=r, wikidb=cls.NOCDB(kb_entry))
     preprocess(parsed)
     xhtml = MWXHTMLWriter()
     xhtml.writeBook(parsed)
     block = ET.tostring(xhtml.xmlbody)
     return block

예제 #2

파일 보기

파일: test_xhtmlwriter.py 프로젝트: aarddict/mwlib.xhtml

def getXHTML(wikitext):
    db = DummyDB()
    r = parseString(title="test", raw=wikitext, wikidb=db)
    preprocess(r)
    show(sys.stdout, r)
    dbw = MWXHTMLWriter()
    dbw.writeBook(r)
    return dbw.asstring()

예제 #3

파일 보기

파일: wikitext2xhtml.py 프로젝트: michaelmrose/dotfiles

def getXHTML(wikitext):
    db = DummyDB()
    r = parseString(title="", raw=wikitext, wikidb=db)
    preprocess(r)
    dbw = MWXHTMLWriter()
    with SuppressOutput():
        dbw.writeBook(r)
    return dbw.asstring()

예제 #4

파일 보기

파일: arwiki_parser.py 프로젝트: natsheh/arwiki_parser

def getXHTML(wikitext, title, language):
    db = DummyDB()
    db.normalize_and_get_page = noop
    r = parseString(title=title, raw=wikitext, wikidb=db, lang=language)
    if not r:
        return None
    preprocess(r)
    removeLangLinks(r)
    dbw = MWXHTMLWriter()
    dbw.writeBook(r)
    return dbw.asstring()

예제 #5

파일 보기

파일: arwiki_parser.py 프로젝트: lazycrazyowl/arwiki_parser

def getXHTML(wikitext, title, language):
    db = DummyDB()
    db.normalize_and_get_page = noop
    r = parseString(title=title, raw=wikitext, wikidb=db, lang=language)
    if not r:
        return None
    preprocess(r)
    removeLangLinks(r)
    dbw = MWXHTMLWriter()
    dbw.writeBook(r)
    return dbw.asstring()

예제 #6

파일 보기

파일: xml-server.py 프로젝트: aarddict/mwlib

    def _servXML(self, args, query, dialect="mwxml"):
        if not len(args):
            self._doc(error="require articlename")
            return
        unknown = [k for k in query if k not in ("debug", "imageresolver")]
        if unknown:
            return self._doc(error="unknown option %r" % unknown)
        title = args.pop()
        base_url = "http://%s/" % ("/".join(args) or default_baseurl)
        debug = bool(query.setdefault("debug", [default_debug])[0])

        language = "en" # FIXME
        namespace="en.wikipedia.org" # FIXME

        print "_servXML", title, base_url, debug

        db = mwapidb.WikiDB(base_url)
        db.print_template = None # deactivate print template lookups
        tree = db.getParsedArticle(title, revision=None)

        if dialect == "mwxhtml":
            xhtmlwriter.preprocess(tree)
            dbw = xhtmlwriter.MWXHTMLWriter(imagesrcresolver=imagesrcresolver,
                                            debug=False)
        elif dialect == "mwxml":
            advtree.buildAdvancedTree(tree) # this should be optional
            dbw = xhtmlwriter.MWXMLWriter() # 1:1 XML from parse tree
        elif dialect == "dbxml":
            from mwlib import docbookwriter
            docbookwriter.preprocess(tree)
            dbw = docbookwriter.DocBookWriter(imagesrcresolver=imagesrcresolver,
                                            debug=debug) 
        else:
            raise Exception, "unkonwn export"


        dbw.writeBook(tree)
        if debug:
            dbw.writeparsetree(tree)

        response = dbw.asstring()
        
        self.send_response(200)
        self.send_header("Content-type", "text/xml")
        self.send_header("Content-length", str(len(response)))
        self.end_headers()
        self.wfile.write(response)
        
        # shut down the connection
        self.wfile.flush()

예제 #7

파일 보기

 def to_html(cls, kb_entry):
     from mwlib.uparser import parseString
     from mwlib.xhtmlwriter import MWXHTMLWriter, preprocess
     try:
         import xml.etree.ElementTree as ET
     except:
         from elementtree import ElementTree as ET
     r = kb_entry.body.replace("\r", "")
     parsed = parseString(title=kb_entry.subject,
                          raw=r,
                          wikidb=cls.NOCDB(kb_entry))
     preprocess(parsed)
     xhtml = MWXHTMLWriter()
     xhtml.writeBook(parsed)
     block = ET.tostring(xhtml.xmlbody)
     return block

예제 #8

파일 보기

파일: mediawikibook.py 프로젝트: GunioRobot/epub

def get_xhtml(wikitext):
    r = parseString(title="", raw=wikitext)
    preprocess(r)
    dbw = MyWriter()
    dbw.writeBook(r)
    text = dbw.asstring()
    text = re.sub('<p />', '', text)
    text = re.sub('<p> ', '<p>', text)
    text = re.sub(' </p>', '</p>', text)
    text = re.sub('</p><p>', '</p>\n<p>', text)
    text = re.sub(' <br /> &#160;&#160;&#160;&#160;&#160; ', '</p>\n<p>', text)
    text = re.sub('&#160;&#160;&#160;&#160;&#160; ', '<p>', text)
    text = re.sub('</dd><dd>', '</dd>\n<dd>', text)
    text = re.sub('<body><div class="mwx.article"><h1 />', '', text)
    text = re.sub('</div></body>', '', text)
    return text

예제 #9

파일 보기

파일: mediawiki.py 프로젝트: dotmpe/docutils-ext

 def run(self):
     raw = u'\n'.join(self.content)
     # empty wikidb
     db = DummyDB()
     # run parser and pre-processors
     parsed = parseString(title='Export', raw=raw, wikidb=db)
     preprocess(parsed)
     # write XHTML
     xhtml = MWXHTMLWriter()
     xhtml.writeBook(parsed)
     # remove the H1 heading (title) from the document
     article = xhtml.xmlbody.getchildren()[0]
     article.remove(article.getchildren()[0]) # remove caption
     # render to string
     block = ET.tostring(xhtml.xmlbody)
     return [nodes.raw('', block, format='html')]