Пример #1
0
    def mapeia_texto(self, nome_arquivo_entrada):
       
        # exemplo:  nome_arquivo_entrada = 'IPDO-22-06-2016 - unlocked.pdf'
        nome_arquivo_saida = nome_arquivo_entrada + '-unlocked.pdf'
        
        # exemplo:  nome_arquivo_entrada = 'IPDO-22-06-2016.pdf'
        nome_arquivo_entrada = nome_arquivo_entrada + '.pdf'
    
        ferramenta = Ferramentas()
         
        self.log_arquivo_ipdo = {}          # log de ocorrências
        
        ferramenta.desbloqueia(nome_arquivo_entrada, nome_arquivo_saida)

# Imprime no começo da execução, antes de dar qlqr erro
        self.html_extraido = ferramenta.pdf_para_html(nome_arquivo_saida)  
        
        imprimir = ImprimeArquivosTexto()
        
        imprimir.texto_em_html(self.html_extraido, 'texto_extraido.html')
        
        self.objeto_bs = BeautifulSoup(self.html_extraido, 'html.parser')

        self.balanco_energetico_resumido = self.extrair_balanco_energetico_resumido()

        self.balanco_energetico_detalhado = self.extrair_balanco_energetico_detalhado()
        
        
        self.arquivo_ipdo = {}
        self.arquivo_ipdo["geral"] = self.balanco_energetico_resumido["geral"] 
        
        self.arquivo_ipdo["balanco_resumido"] = self.balanco_energetico_resumido["balanco_resumido"] 
        
        self.arquivo_ipdo["balanco_detalhado"] = self.balanco_energetico_detalhado