Exemplos de OutputGenerator.writeTextractOutputs em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: og

Classe / Tipo: OutputGenerator

Método / Função: writeTextractOutputs

Exemplos em hotexamples.com: 2

OutputGenerator.writeTextractOutputs em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de og.OutputGenerator.writeTextractOutputs em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

OutputGenerator(15)

run(12)

indexDocument(5)

generateInsights(2)

writeTextractOutputs(2)

structurePageForm(1)

structurePageTable(1)

structurePageText(1)

Métodos Frequentes

OutputGenerator (15)

run (12)

indexDocument (5)

generateInsights (2)

writeTextractOutputs (2)

structurePageForm (1)

structurePageTable (1)

structurePageText (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: textract_processor.py Projeto: keshava/jarvis-be

def processImage(documentId, bucketName, objectName, callerId): response = callTextract(bucketName, objectName) print("Generating output for documentId: {}".format(documentId)) opg = OutputGenerator(documentId=documentId, response=response, bucketName=textractBucketName, objectName=objectName, forms=False, tables=False) tagging = "documentId={}".format(documentId) opg.writeTextractOutputs(taggingStr=tagging) lineage_client.recordLineage({ "documentId": documentId, "callerId": callerId, "sourceBucketName": bucketName, "targetBucketName": textractBucketName, "sourceFileName": objectName, "targetFileName": objectName })

Exemplo n.º 2

0

Exibir arquivo

Arquivo: textract_processor.py Projeto: keshava/jarvis-be

def processRequest(request): output = "" status = request['jobStatus'] jobId = request['jobId'] jobTag = request['jobTag'] jobAPI = request['jobAPI'] bucketName = request['bucketName'] objectName = request['objectName'] pipeline_client.body = { "documentId": jobTag, "bucketName": bucketName, "objectName": objectName, "stage": PIPELINE_STAGE } if status == 'FAILED': pipeline_client.stageFailed( "Textract Analysis didn't complete successfully") raise Exception( "Textract job for document ID {}; bucketName {} fileName {}; failed during Textract analysis. Please double check the document quality" .format(jobTag, bucketName, objectName)) pipeline_client.stageInProgress() try: pages = getJobResults(jobAPI, jobId) except Exception as e: pipeline_client.stageFailed() raise (e) print("Result pages received: {}".format(len(pages))) detectForms = False detectTables = False if (jobAPI == "StartDocumentAnalysis"): detectForms = True detectTables = True try: opg = OutputGenerator(documentId=jobTag, response=pages, bucketName=textractBucketName, objectName=objectName, forms=detectForms, tables=detectTables) except Exception as e: pipeline_client.stageFailed( "Could not convert results from Textract into processable object. Try uploading again." ) raise (e) tagging = "documentId={}".format(jobTag) opg.writeTextractOutputs(taggingStr=tagging) lineage_client.recordLineage({ "documentId": jobTag, "callerId": request["callerId"], "sourceBucketName": bucketName, "targetBucketName": textractBucketName, "sourceFileName": objectName, "targetFileName": objectName }) output = "Processed -> Document: {}, Object: {}/{} processed.".format( jobTag, bucketName, objectName) pipeline_client.stageSucceeded() print(output) return {'statusCode': 200, 'body': output}