Python RasterisedDocumentParser.parse 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: paperless_tesseract.parsers

메소드/함수: parse

hotexamples.com에서의 예제들: 5

Python RasterisedDocumentParser.parse - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 paperless_tesseract.parsers.RasterisedDocumentParser.parse에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

RasterisedDocumentParser(22)

get_text(16)

parse(5)

get_thumbnail(4)

calculate_a4_dpi(1)

construct_ocrmypdf_parameters(1)

extract_text(1)

get_dpi(1)

예제 #1

파일 보기

파일: test_parser.py 프로젝트: papermerge/paperless-ng

 def test_bmp(self):
     parser = RasterisedDocumentParser(None)
     parser.parse(os.path.join(self.SAMPLE_FILES, "simple.bmp"),
                  "image/bmp")
     self.assertTrue(os.path.isfile(parser.archive_path))
     self.assertTrue("this is a test document" in parser.get_text().lower())

예제 #2

파일 보기

 def test_skip_noarchive_notext(self):
     parser = RasterisedDocumentParser(None)
     parser.parse(os.path.join(self.SAMPLE_FILES, "multi-page-images.pdf"), "application/pdf")
     self.assertTrue(os.path.join(parser.archive_path))
     self.assertContainsStrings(parser.get_text().lower(), ["page 1", "page 2", "page 3"])

예제 #3

파일 보기

 def test_multi_page_pages_force(self):
     parser = RasterisedDocumentParser(None)
     parser.parse(os.path.join(self.SAMPLE_FILES, "multi-page-digital.pdf"), "application/pdf")
     self.assertTrue(os.path.isfile(parser.archive_path))
     self.assertContainsStrings(parser.get_text().lower(), ["page 1", "page 2", "page 3"])

예제 #4

파일 보기

 def test_multi_page_analog_pages_redo(self):
     parser = RasterisedDocumentParser(None)
     parser.parse(os.path.join(self.SAMPLE_FILES, "multi-page-images.pdf"), "application/pdf")
     self.assertTrue(os.path.isfile(parser.archive_path))
     self.assertContainsStrings(parser.get_text().lower(), ["page 1", "page 2"])
     self.assertFalse("page 3" in parser.get_text().lower())

예제 #5

파일 보기

    def test_with_form_force(self):
        parser = RasterisedDocumentParser(None)

        parser.parse(os.path.join(self.SAMPLE_FILES, "with-form.pdf"), "application/pdf")

        self.assertContainsStrings(parser.get_text(), ["Please enter your name in here:", "This is a PDF document with a form."])