Ejemplo n.º 1
0
def look_for_line(pdf: PDFQuery, line: str, regex=False) -> PyQuery:
    if not regex:
        pq_obj = pdf.pq('LTTextLineHorizontal:contains("{}")'.format(line))
    else:
        pq_obj = pdf.pq()

    return pq_obj
Ejemplo n.º 2
0
class File(object):
    def __init__(self, filename: str):
        self.filename = Path(filename)
        self.file = PDFQuery(self.filename)

    def page(self, number: int) -> Any:
        return self.file.load(number)
Ejemplo n.º 3
0
 def load_file(self):
     return PDFQuery(self.filename)
Ejemplo n.º 4
0
 def __init__(self, filename: str):
     self.filename = Path(filename)
     self.file = PDFQuery(self.filename)