示例#1
0
# -*- coding:utf-8 -*-

import csv
from Parser import get_next_tag, get_text, cleaner

doc = cleaner("../etc/codigo_processo_civil.htm")
g = csv.writer(open("../../db_sen_grafo/etc/codigo_processo_civil.csv", "w"))

g.writerow(
    [
        "id",
        "ano",
        "lei_id",
        "situacao",
        "livro",
        "titulo",
        "capitulo",
        "secao",
        "subsecao",
        "artigo",
        "sub_artigo",
        "paragrafo",
        "inciso",
        "alinea",
        "texto",
    ]
)

situacao = "Vigente"
idt, ano, lei_id = 2901, 1973, 2
livro, titulo, capitulo, secao, subsecao = 0, 0, 0, 0, 0
示例#2
0
# -*- coding:utf-8 -*-

import csv
from Parser import get_next_tag, get_text, cleaner

doc = cleaner('../etc/previdencia_social.htm')
g = csv.writer(open('../../db_sen_grafo/etc/previdencia_social.csv', 'w'))

g.writerow(["id", "ano", "lei_id", "situacao", "livro", "titulo", "capitulo",
            "secao", "subsecao", "artigo", "sub_artigo", "paragrafo", "inciso",
            "alinea", "texto"])

situacao = 'Vigente'
idt, ano, lei_id = 6024, 1991, 4
livro, titulo, capitulo, secao, subsecao = 0, 0, 0, 0, 0
artigo, subartigo, paragrafo, inciso, alinea = 0, 0, 0, 0, 0

l = get_next_tag(doc)

while l != []:    
    tag, pos = l[0], l[1]
    
    if tag == 'LIVRO':
        livro += 1
        titulo = 0
        pos = doc.find('<p', pos)
    
    elif tag == 'TÍTULO':
        titulo += 1
        capitulo, secao, subsecao = 0, 0, 0
        pos = doc.find('<p', pos)
示例#3
0
# -*- coding:utf-8 -*-

import csv
from Parser import get_next_tag, get_text, cleaner

doc = cleaner('../etc/procedimentos_stf.htm')
g = csv.writer(open('../../db_sen_grafo/etc/procedimentos_stf.csv', 'w'))

g.writerow(["id", "ano", "lei_id", "situacao", "livro", "titulo", "capitulo",
            "secao", "subsecao", "artigo", "sub_artigo", "paragrafo", "inciso",
            "alinea", "texto"])
            
situacao = 'Vigente'
idt, ano, lei_id = 5923, 1990, 3
livro, titulo, capitulo, secao, subsecao = 0, 0, 0, 0, 0
artigo, subartigo, paragrafo, inciso, alinea = 0, 0, 0, 0, 0

l = get_next_tag(doc)

while l != []:    
    tag, pos = l[0], l[1]
    
    if tag == 'LIVRO':
        livro += 1
        titulo = 0
        pos = doc.find('<p', pos)
    
    elif tag == 'TÍTULO':
        titulo += 1
        capitulo, secao, subsecao = 0, 0, 0
        pos = doc.find('<p', pos)