from datamining import gravar_dados_no_arquivo from datamining import solicitar_utf8 from datamining import solicitar_dados_CC from datamining import esperar # Definição dos parâmetros de busca Classe = "HC" NumeroInicial = 175090 NumeroFinal = 175794 dominio = 'http://portal.stf.jus.br/processos/' #iterador para buscar os processos for vezes in range (NumeroFinal-NumeroInicial+1): esperar(4,5,vezes) esperar(60,700,vezes) NumProcesso = str(NumeroFinal-vezes) print (Classe+NumProcesso) # Extração das informações html = solicitar_dados_AP(Classe, NumProcesso) # extrai campo incidente do html incidente = extrair(html,'id="incidente" value="', '">') # extrai dados dos URLs partes = solicitar_utf8(dominio, 'abaPartes.asp?incidente=',
# from datamining import solicitar_dados_CC from datamining import gravar_dados_no_arquivo from datamining import esperar # import requests from datamining import solicitar_dados_Juris # Definição dos parâmetros de busca Classe = "ADI" NumeroInicial = 6001 NumeroFinal = 6590 # realiza a extração dos dados e a gravação for n in range(NumeroFinal - NumeroInicial + 1): esperar(2, 10, n) esperar(10, 100, n) # define número do processo a ser buscado NumProcesso = str(NumeroFinal - n) print(NumProcesso) # busca dados do processo definido por classe e número, no banco do CC dados = solicitar_dados_Juris(Classe, NumProcesso) # grava dados no arquivo definido gravar_dados_no_arquivo(Classe, NumProcesso, 'ADIjuris//', dados)
def solicitar_dados_Juris (classe, numero): url = ('http://www.stf.jus.br/portal/peticaoInicial/verPeticaoInicial.asp?base=' + classe + '&documento=&s1=1&numProcesso=' + numero) print (url) # Módulo básico de extração string = requests.get(url).text inicio = string.find('processo/verProcessoAndamento.asp?') return (url + ">>>>> \n" + string[inicio:]) # Definição dos parâmetros de busca Classe = "ADI" NumeroInicial = 5000 NumeroFinal = 5050 # realiza a extração dos dados e a gravação for n in range (NumeroFinal-NumeroInicial+1): esperar(2,5,n) # define número do processo a ser buscado NumProcesso = str(NumeroFinal-n) # busca dados do processo definido por classe e número, no banco do CC dados = solicitar_dados_Juris (Classe, NumProcesso) # grava dados no arquivo definido gravar_dados_no_arquivo(Classe, NumProcesso,'ADIhtml//', dados)