def __procesarParrafo(soup): global ley_id, last_titulo_id, last_capitulo_id, last_seccion_id, last_subseccion_id, last_segmento_id, last_articulo_id, start_articles, end_of_code, last_titulo, last_capitulo, last_seccion, last_subseccion, last_articulo, articulo_completo, idnetificador_articulo, id_parent_articulo if (__isTitulo(soup)): if (__isTituloCompuesto(soup)): resp = __separarTituloCompuesto(soup) # resp es una lista de partes, cada parte es un tag print resp, '\n' for p in resp: __procesarParrafo(p) else : if articulo_completo != '': dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent_articulo, idnetificador_articulo) idnetificador_articulo = '' articulo_completo = '' numeracion = hard_code_util.getNumeroTitular1(soup.text) if hard_code_util.isTitulo(soup.text): last_titulo = last_capitulo = last_seccion = last_subseccion = '' last_titulo = numeracion last_segmento_id = last_titulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_TITULO, ley_id, ley_id, 'titulo' + last_titulo) elif hard_code_util.isCapitulo(soup.text): last_seccion = last_subseccion = '' last_capitulo = numeracion last_segmento_id = last_capitulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_CAPITULO, ley_id, last_titulo_id, 'titulo' + last_titulo + "_capitulo" + last_capitulo) elif hard_code_util.isSeccion(soup.text): last_subseccion = '' last_seccion = numeracion cad = 'titulo' + last_titulo id_parent = last_titulo_id if last_capitulo != '': cad += "_capitulo" + last_capitulo id_parent = last_capitulo_id cad += '_seccion' + last_seccion last_segmento_id = last_seccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SECCION, ley_id, id_parent, cad) elif hard_code_util.isSubSeccion(soup.text): last_subseccion = numeracion cad = 'titulo' + last_titulo id_parent = last_titulo_id if last_capitulo != '': cad += "_capitulo" + last_capitulo id_parent = last_capitulo_id if last_seccion != '': cad += '_seccion' + last_seccion id_parent = last_seccion_id cad += '_subseccion' + last_subseccion last_subseccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SUBSECCION, ley_id, id_parent, cad) last_segmento_id = last_subseccion_id else: if hard_code_util.isArticulo(soup.text): cad = 'titulo' + last_titulo id_parent = last_titulo_id if last_capitulo != '': cad += "_capitulo" + last_capitulo id_parent = last_capitulo_id if last_seccion != '': cad += '_seccion' + last_seccion id_parent = last_seccion_id if last_subseccion != '': cad += '_subseccion' + last_subseccion id_parent = last_subseccion_id cad += '_articulo' + hard_code_util.getNumeroArticulo(soup.text) if soup.find('strike') is not None: cad += '-' if articulo_completo != '': dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent, idnetificador_articulo) id_parent_articulo = id_parent idnetificador_articulo = cad articulo_completo = str(soup) start_articles = True elif start_articles: if hard_code_util.startEndConstitucion(soup.text) or len(end_of_code) > 0: end_of_code += str(soup) else: if not __isTitulo(soup): articulo_completo += str(soup)
def __procesarParrafo(soup): global ley_id, last_libro_id, last_titulo_id, last_subtitulo_id, last_capitulo_id, last_seccion_id, last_subseccion_id, last_segmento_id, start_articles, end_of_code, last_libro, last_titulo, last_subtitulo, last_capitulo, last_seccion, last_subseccion, articulo_completo, idnetificador_articulo, id_parent_articulo if (__isTitulo(soup)): if articulo_completo != '': dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent_articulo, idnetificador_articulo) idnetificador_articulo = '' articulo_completo = '' numeracion = hard_code_util.getNumeroTitular1(soup.text) if hard_code_util.isLibro(soup.text): last_titulo = last_subtitulo = last_capitulo = last_seccion = last_subseccion = '' last_libro = numeracion last_segmento_id = last_libro_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_LIBRO, ley_id, ley_id,'libro' + last_libro) elif hard_code_util.isSubTitulo(soup.text): last_capitulo = last_seccion = last_subseccion = '' last_subtitulo = numeracion last_segmento_id = last_subtitulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SUBTITULO, ley_id, last_titulo_id, 'libro' + last_libro + '_titulo' + last_titulo + '_subtitulo' + last_subtitulo) elif hard_code_util.isTitulo(soup.text): last_subtitulo = last_capitulo = last_seccion = last_subseccion = '' last_titulo = numeracion last_segmento_id = last_titulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_TITULO, ley_id, last_libro_id, 'libro' + last_libro + '_titulo' + last_titulo) elif hard_code_util.isCapitulo(soup.text): last_seccion = last_subseccion = '' last_capitulo = numeracion cad = 'libro' + last_libro + '_titulo' + last_titulo id_parent = last_titulo_id if last_subtitulo != '': cad += "_subtitulo" + last_subtitulo id_parent = last_subtitulo_id cad += '_capitulo' + last_capitulo last_segmento_id = last_capitulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_CAPITULO, ley_id, id_parent, cad) elif hard_code_util.isSeccion(soup.text): last_subseccion = '' last_seccion = numeracion cad = 'libro' + last_libro + '_titulo' + last_titulo id_parent = last_titulo_id if last_subtitulo != '': cad += "_subtitulo" + last_subtitulo id_parent = last_subtitulo_id if last_capitulo != '': cad += "_capitulo" + last_capitulo id_parent = last_capitulo_id cad += '_seccion' + last_seccion last_segmento_id = last_seccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SECCION, ley_id, id_parent, cad) elif hard_code_util.isSubSeccion(soup.text): last_subseccion = numeracion cad = 'libro' + last_libro + '_titulo' + last_titulo id_parent = last_titulo_id if last_subtitulo != '': cad += "_subtitulo" + last_subtitulo id_parent = last_subtitulo_id if last_capitulo != '': cad += "_capitulo" + last_capitulo id_parent = last_capitulo_id if last_seccion != '': cad += '_seccion' + last_seccion id_parent = last_seccion_id cad += '_subseccion' + last_subseccion last_segmento_id = last_subseccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SUBSECCION, ley_id, id_parent, cad) else: if hard_code_util.isArticulo(soup.text): cad = 'libro' + last_libro + '_titulo' + last_titulo id_parent = last_titulo_id if last_subtitulo != '': cad += "_subtitulo" + last_subtitulo id_parent = last_subtitulo_id if last_capitulo != '': cad += "_capitulo" + last_capitulo id_parent = last_capitulo_id if last_seccion != '': cad += '_seccion' + last_seccion id_parent = last_seccion_id if last_subseccion != '': cad += '_subseccion' + last_subseccion id_parent = last_subseccion_id cad = cad + '_articulo' + hard_code_util.getNumeroArticulo(soup.text) if soup.find('strike') is not None: cad += '-' if articulo_completo != '': dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent, idnetificador_articulo) id_parent_articulo = id_parent idnetificador_articulo = cad articulo_completo = str(soup) start_articles = True elif start_articles: if not __isTitulo(soup): articulo_completo += str(soup)