from datamining import gravar_dados_no_arquivo
from datamining import solicitar_utf8
from datamining import solicitar_dados_CC
from datamining import esperar

 
# Definição dos parâmetros de busca
Classe = "HC"
NumeroInicial = 175090
NumeroFinal = 175794
dominio = 'http://portal.stf.jus.br/processos/'

#iterador para buscar os processos
for vezes in range (NumeroFinal-NumeroInicial+1):
    
    esperar(4,5,vezes)
    esperar(60,700,vezes)
    
    NumProcesso = str(NumeroFinal-vezes)
    print (Classe+NumProcesso)
           
    # Extração das informações
    html = solicitar_dados_AP(Classe, NumProcesso)
    
    # extrai campo incidente do html
    incidente = extrair(html,'id="incidente" value="', '">')

    # extrai dados dos URLs
    
    partes          = solicitar_utf8(dominio,
                                     'abaPartes.asp?incidente=', 
Exemplo n.º 2
0
# from datamining import solicitar_dados_CC
from datamining import gravar_dados_no_arquivo
from datamining import esperar
# import requests
from datamining import solicitar_dados_Juris

# Definição dos parâmetros de busca
Classe = "ADI"
NumeroInicial = 6001
NumeroFinal = 6590

# realiza a extração dos dados e a gravação
for n in range(NumeroFinal - NumeroInicial + 1):

    esperar(2, 10, n)
    esperar(10, 100, n)

    # define número do processo a ser buscado
    NumProcesso = str(NumeroFinal - n)

    print(NumProcesso)

    # busca dados do processo definido por classe e número, no banco do CC
    dados = solicitar_dados_Juris(Classe, NumProcesso)

    # grava dados no arquivo definido
    gravar_dados_no_arquivo(Classe, NumProcesso, 'ADIjuris//', dados)
def solicitar_dados_Juris (classe, numero):
    url = ('http://www.stf.jus.br/portal/peticaoInicial/verPeticaoInicial.asp?base=' 
           + classe 
           + '&documento=&s1=1&numProcesso=' 
           + numero)
    print (url)
    # Módulo básico de extração
    string = requests.get(url).text
    inicio = string.find('processo/verProcessoAndamento.asp?')
    return (url + ">>>>> \n" + string[inicio:])

# Definição dos parâmetros de busca
Classe = "ADI"
NumeroInicial = 5000
NumeroFinal = 5050

# realiza a extração dos dados e a gravação    
for n in range (NumeroFinal-NumeroInicial+1):
    
    esperar(2,5,n)
    
    # define número do processo a ser buscado
    NumProcesso = str(NumeroFinal-n)
    
    # busca dados do processo definido por classe e número, no banco do CC
    dados = solicitar_dados_Juris (Classe, NumProcesso)
       
    # grava dados no arquivo definido
    gravar_dados_no_arquivo(Classe, NumProcesso,'ADIhtml//', dados)