コード例 #1
0
ファイル: pdfparser.py プロジェクト: geekben/codeiscool
 def __init__(self, rsrcmgr, outfp, codec='utf-8', pageno=1, laparams=None,
              showpageno=False, imagewriter=None):
     TextConverter.__init__(self, rsrcmgr, outfp, codec=codec, pageno=pageno, laparams=laparams)
     self.showpageno = showpageno
     self.imagewriter = imagewriter
     self.text = ''
     return
コード例 #2
0
 def __init__(self, rsrcmgr, codec='cp1251', pageno=1, laparams=None):
     dummy = io.StringIO()
     TextConverter.__init__(self, rsrcmgr, outfp=dummy, codec=codec, pageno=pageno, laparams=laparams)
     self.annots = set()
     # self.sentences = list()
     self.current_sentence = ''
     self.current_sentence_should_be_added_to_these_annotations_on_end = set()
コード例 #3
0
 def __init__(self, rsrcmgr, codec='utf-8', pageno=1, laparams=None):
     dummy = io.StringIO()
     TextConverter.__init__(self,
                            rsrcmgr,
                            outfp=dummy,
                            codec=codec,
                            pageno=pageno,
                            laparams=laparams)
     self.annots = set()
コード例 #4
0
ファイル: pdf_in.py プロジェクト: yask123/moin-2.0
 def __init__(self, rsrcmgr, pageno=1, laparams=None, showpageno=False):
     TextConverter.__init__(self,
                            rsrcmgr,
                            None,
                            codec=None,
                            pageno=pageno,
                            laparams=laparams,
                            showpageno=showpageno)
     self.__text = []
コード例 #5
0
 def __init__(self,
              rsrcmgr,
              outfp,
              codec='utf-8',
              pageno=1,
              laparams=None,
              showpageno=False,
              imagewriter=None):
     TextConverter.__init__(self,
                            rsrcmgr,
                            outfp,
                            codec=codec,
                            pageno=pageno,
                            laparams=laparams,
                            showpageno=showpageno,
                            imagewriter=imagewriter)
     return
コード例 #6
0
ファイル: pdf2txt.py プロジェクト: goginenir6/pdfshapeminer
 def __init__(self,
              rsrcmgr,
              outfp,
              codec='utf-8',
              pageno=1,
              laparams=None,
              showpageno=False,
              imagewriter=None):
     TextConverter.__init__(self,
                            rsrcmgr,
                            outfp,
                            codec=codec,
                            pageno=pageno,
                            laparams=laparams)
     self.showpageno = showpageno
     self.imagewriter = imagewriter
     self.textlines = {}  # per pagenumber
     self.pagenumber = 0
     return
コード例 #7
0
ファイル: preprocess.py プロジェクト: avkameth/bots.v220
 def __init__(self, *args, **kwargs):
     TextConverter.__init__(self, *args, **kwargs)
コード例 #8
0
 def __init__(self, *args, **kwargs):
     TextConverter.__init__(self, *args, **kwargs)
     pass
コード例 #9
0
ファイル: pdf2text.py プロジェクト: zaim/bukutip
 def __init__(self, *args, **kwargs):
     self.results = []
     TextConverter.__init__(self, *args, **kwargs)
コード例 #10
0
ファイル: pdf_in.py プロジェクト: pombredanne/moin2
 def __init__(self, rsrcmgr, pageno=1, laparams=None, showpageno=False):
     TextConverter.__init__(self, rsrcmgr, None, codec=None, pageno=pageno, laparams=laparams,
                            showpageno=showpageno)
     self.__text = []
コード例 #11
0
 def __init__(self, separator=',', threshold=1.5, *args, **kwargs):
     TextConverter.__init__(self, *args, **kwargs)
     self.separator = separator
     self.threshold = threshold
コード例 #12
0
ファイル: pdf2csv_camp99.py プロジェクト: toto/schedule
 def __init__(self, rsrcmgr, outfp, laparams=laparams):
     TextConverter.__init__(self, rsrcmgr, outfp, laparams=laparams)
     return
コード例 #13
0
ファイル: f.py プロジェクト: kamekame/alpha
 def __init__(self, *args, **kwargs):
     TextConverter.__init__(self, *args, **kwargs)
     self.separator = separator
     self.threshold = threshold
コード例 #14
0
 def __init__(self, *args, **kwargs):
     TextConverter.__init__(self, *args, **kwargs)
     self.pages = {}