Python pdfstring_to_text Examples

Programming Language: Python

Namespace/Package Name: ebdata.parsing.pdftotext

Method/Function: pdfstring_to_text

Examples at hotexamples.com: 4

Python pdfstring_to_text - 4 examples found. These are the top rated real world Python examples of ebdata.parsing.pdftotext.pdfstring_to_text extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

File: retrieval.py Project: AndrewJHart/everyblock_code

 def parse_list(self, page):
     precinct, raw_pdf = page
     pdf_text = pdfstring_to_text(raw_pdf, keep_layout=False)
     m = pdf_re.search(pdf_text)
     if not m:
         raise ScraperBroken("Didn't find data in PDF for precinct %s" % precinct)
     else:
         yield dict(m.groupdict(), precinct=precinct)

Example #2

Show file

File: retrieval.py Project: frankk00/openblock

 def parse_list(self, page):
     precinct, raw_pdf = page
     pdf_text = pdfstring_to_text(raw_pdf, keep_layout=False)
     m = pdf_re.search(pdf_text)
     if not m:
         raise ScraperBroken("Didn't find data in PDF for precinct %s" % precinct)
     else:
         yield dict(m.groupdict(), precinct=precinct)

Example #3

Show file

 def parse_detail(self, page, list_record):
     text = pdfstring_to_text(page)
     m = self.parse_detail_re.search(text)
     if m:
         self.logger.debug('Got a match for parse_detail_re')
         return m.groupdict()
     else:
         self.logger.warning("Regex failed on %s", self.__current_url)
         raise SkipRecord

Example #4

Show file

File: retrieval.py Project: AndrewJHart/everyblock_code

 def parse_detail(self, page, list_record):
     text = pdfstring_to_text(page)
     m = self.parse_detail_re.search(text)
     if m:
         self.logger.debug('Got a match for parse_detail_re')
         return m.groupdict()
     else:
         self.logger.warning("Regex failed on %s", self.__current_url)
         raise SkipRecord