Python OpenDocumentTextFile 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: odt2txt

메소드/함수: OpenDocumentTextFile

hotexamples.com에서의 예제들: 4

Python OpenDocumentTextFile - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 odt2txt.OpenDocumentTextFile에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def content_index(content, filename=None, content_type=None):
    fname, ext = os.path.splitext(filename)
    result = ''
    if ext == '.doc':  #or content_type ?
        (stdin, stdout) = os.popen2('antiword -', 'b')
        stdin.write(content)
        stdin.close()
        result = stdout.read().decode('latin1',
                                      'replace').encode('utf-8', 'replace')
    elif ext == '.pdf':
        fname = os.tempnam(filename) + '.pdf'
        fp = file(fname, 'wb')
        fp.write(content)
        fp.close()
        fp = os.popen('pdftotext -enc UTF-8 -nopgbrk ' + fname + ' -', 'r')
        result = fp.read()
        fp.close()
    elif ext == '.odt':
        s = StringIO.StringIO(content)
        o = odt2txt.OpenDocumentTextFile(s)
        result = o.toString().encode('ascii', 'replace')
    elif ext in ('.txt', '.py', '.patch', '.html', '.csv'):
        result = content
    return result

예제 #2

파일 보기

파일: std_index.py 프로젝트: aleemtahir/odoo-1

 def _doIndexContent(self, content):
     s = StringIO.StringIO(content)
     o = odt2txt.OpenDocumentTextFile(s)
     result = _to_unicode(o.toString())
     s.close()
     return result

예제 #3

파일 보기

import os
import odt2txt
import re

to_find = "nul"
occurences = {}
for folder, subfolders, files in os.walk("./"):
    for file in files:
        if file.endswith(".odt"):
            print(file)
            fn = os.path.join(folder, file)
            odt = odt2txt.OpenDocumentTextFile(fn)
            unicode = odt.toString()
            occurences[fn] = [m.start() for m in re.finditer(to_find, unicode)]

예제 #4

파일 보기

def ParseODT(doc):
    odt = odt2txt.OpenDocumentTextFile(doc)
    unicode = odt.toString()
    out_utf8 = unicode.encode("utf-8")
    return out_utf8