Ejemplos de AbbyyPdfTextExtractor en Python

Lenguaje de programación: Python

Namespace/Package Name: abbyy

Ejemplos en hotexamples.com: 6

Python AbbyyPdfTextExtractor - 6 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de abbyy.AbbyyPdfTextExtractor extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

AbbyyPdfTextExtractor(3)

setApplicationCredentials(3)

extractPages(2)

processPdfPage(2)

Ejemplo n.º 1

Mostrar archivo

Archivo: AbbyyPdfTextExtractorTest.py Proyecto: manishgs/pdf-processor

 def testScannedPdfPageForUnauthorisec(self):
     pdfSeparate = PdfSeparate("tests/sample-scanned-1.pdf", self.indir)
     pdfSeparate.extractPages()
     self.assertTrue(os.path.isfile(os.path.join(self.indir, "1.pdf")))
     try:
         abbyyPdf = AbbyyPdfTextExtractor(self.indir, self.outdir, 1, "english")
         abbyyPdf.setApplicationCredentials("nouser", "nopassword")
         abbyyPdf.processPdfPage(1)
     except HTTPError as e:
         self.assertEqual(e.code, 401)
         self.assertEqual(e.reason, "Unauthorized")

Ejemplo n.º 2

Mostrar archivo

Archivo: AbbyyPdfTextExtractorNetworkTest.py Proyecto: anjesh/pdf-processor

    def testScanned44PdfPageForNetwork(self):
        pdfSeparate = PdfSeparate('tests/sample-scanned-44pages.pdf', self.indir)
        pdfSeparate.extractPages()
        self.assertTrue(os.path.isfile(os.path.join(self.indir,"1.pdf")))

        try:
            abbyyPdf = AbbyyPdfTextExtractor(self.indir, self.outdir, 44, "english")
            abbyyPdf.setApplicationCredentials(self.configParser.get('abbyy','appid'), self.configParser.get('abbyy','password'))
            abbyyPdf.extractPages();
            self.assertTrue(os.path.isfile(os.path.join(self.outdir,"1.txt")))
            self.assertTrue(os.path.isfile(os.path.join(self.outdir,"44.txt")))
        except Exception:
            pass

Ejemplo n.º 3

Mostrar archivo

Archivo: AbbyyPdfTextExtractorTest.py Proyecto: manishgs/pdf-processor

    def testScannedPdfPage(self):
        pdfSeparate = PdfSeparate("tests/sample-scanned-1.pdf", self.indir)
        pdfSeparate.extractPages()
        self.assertTrue(os.path.isfile(os.path.join(self.indir, "1.pdf")))

        try:
            abbyyPdf = AbbyyPdfTextExtractor(self.indir, self.outdir, 1, "english")
            abbyyPdf.setApplicationCredentials(
                self.configParser.get("abbyy", "appid"), self.configParser.get("abbyy", "password")
            )
            abbyyPdf.processPdfPage(1)
            self.assertTrue(os.path.isfile(os.path.join(self.outdir, "1.txt")))
        except Exception:
            pass

Ejemplo n.º 4

Mostrar archivo

 def extractTextFromScannedDoc(self):
     """
     makes api calls 
     """
     self.logger.info('Calling Abbyy: OCR-ing %d pages at %s', self.totalPages, os.path.join(self.outputDir,'text'))
     abbyyPdf = AbbyyPdfTextExtractor(os.path.join(self.outputDir,'pages'), os.path.join(self.outputDir,'text'), self.totalPages, self.language)
     abbyyPdf.setApplicationCredentials(self.configParser.get('abbyy','appid'), self.configParser.get('abbyy','password'))
     abbyyPdf.extractPages();

Ejemplo n.º 5

Mostrar archivo

Archivo: AbbyyPdfTextExtractorTest.py Proyecto: pombredanne/pdf-processor

 def testScannedPdfPageForUnauthorisec(self):
     pdfSeparate = PdfSeparate('tests/sample-scanned-1.pdf', self.indir)
     pdfSeparate.extractPages()
     self.assertTrue(os.path.isfile(os.path.join(self.indir, "1.pdf")))
     try:
         abbyyPdf = AbbyyPdfTextExtractor(self.indir, self.outdir, 1,
                                          "english")
         abbyyPdf.setApplicationCredentials('nouser', 'nopassword')
         abbyyPdf.processPdfPage(1)
     except HTTPError as e:
         self.assertEqual(e.code, 401)
         self.assertEqual(e.reason, "Unauthorized")

Ejemplo n.º 6

Mostrar archivo

Archivo: AbbyyPdfTextExtractorTest.py Proyecto: pombredanne/pdf-processor

    def testScannedPdfPage(self):
        pdfSeparate = PdfSeparate('tests/sample-scanned-1.pdf', self.indir)
        pdfSeparate.extractPages()
        self.assertTrue(os.path.isfile(os.path.join(self.indir, "1.pdf")))

        try:
            abbyyPdf = AbbyyPdfTextExtractor(self.indir, self.outdir, 1,
                                             "english")
            abbyyPdf.setApplicationCredentials(
                self.configParser.get('abbyy', 'appid'),
                self.configParser.get('abbyy', 'password'))
            abbyyPdf.processPdfPage(1)
            self.assertTrue(os.path.isfile(os.path.join(self.outdir, "1.txt")))
        except Exception:
            pass