Python OcrHelperの例

プログラミング言語: Python

名前空間/パッケージ名: sparknlp.ocr

クラス/型: OcrHelper

hotexamples.comのコード掲載数: 3

Python OcrHelper - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsparknlp.ocr.OcrHelperの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

createDataset(3)

createMap(3)

OcrHelper(1)

getMinTextLayer(1)

getPreferredMethod(1)

setMinTextLayer(1)

setPreferredMethod(1)

コード例 #1

ファイルを表示

 def runTest():
     OcrHelper.setMinTextLayer(8)
     print("text layer is: " + str(OcrHelper.getMinTextLayer()))
     pdf_path = "file:///" + os.getcwd(
     ) + "/../ocr/src/test/resources/pdfs/"
     data = OcrHelper.createDataset(spark=SparkContextForTest.spark,
                                    input_path=pdf_path,
                                    output_col="region",
                                    metadata_col="metadata")
     data.show()
     OcrHelper.setMinTextLayer(0)
     print("Text layer disabled")
     data = OcrHelper.createDataset(spark=SparkContextForTest.spark,
                                    input_path=pdf_path,
                                    output_col="region",
                                    metadata_col="metadata")
     data.show()
     OcrHelper.setMinTextLayer(10)
     content = OcrHelper.createMap(
         input_path="../ocr/src/test/resources/pdfs")
     print(content)
     document_assembler = DocumentAssembler() \
         .setInputCol("region") \
         .setOutputCol("document")
     document_assembler.transform(data).show()

コード例 #2

ファイルを表示

 def runTest():
     data = OcrHelper.createDataset(
         spark=SparkContextForTest.spark,
         input_path="../ocr/src/test/resources/pdfs/",
         output_col="region",
         metadata_col="metadata")
     data.show()
     content = OcrHelper.createMap(
         input_path="../ocr/src/test/resources/pdfs/")
     print(content)
     document_assembler = DocumentAssembler() \
         .setInputCol("region") \
         .setOutputCol("document")
     document_assembler.transform(data).show()

コード例 #3

ファイルを表示

 def runTest():
     OcrHelper.setPreferredMethod('text')
     print("text layer is: " + str(OcrHelper.getPreferredMethod()))
     pdf_path = "file:///" + os.getcwd() + "/../ocr/src/test/resources/pdfs/"
     data = OcrHelper.createDataset(
         spark=SparkContextForTest.spark,
         input_path=pdf_path)
     data.show()
     OcrHelper.setPreferredMethod('image')
     print("Text layer disabled")
     data = OcrHelper.createDataset(
         spark=SparkContextForTest.spark,
         input_path=pdf_path)
     data.show()
     OcrHelper.setPreferredMethod('text')
     content = OcrHelper.createMap(input_path="../ocr/src/test/resources/pdfs")
     print(content)
     document_assembler = DocumentAssembler() \
         .setInputCol("text") \
         .setOutputCol("document")
     document_assembler.transform(data).show()