def pdf(): pdf_parser = PDFParser() pdf_parser.parse(r'files/Test3.pdf') print('pdf parser', pdf_parser.get_processed_stems(), len(pdf_parser.get_processed_stems()))
def test_PDFParser(self): pdf = PDFParser() pdf.parse('files/Test.pdf') text = [] assert pdf.get_processed_stems() == text