Exemplo n.º 1
0
def __procesarParrafo(soup):
	global ley_id, last_titulo_id, last_capitulo_id, last_seccion_id, last_subseccion_id, last_segmento_id, last_articulo_id, start_articles, end_of_code, last_titulo, last_capitulo, last_seccion, last_subseccion, last_articulo, articulo_completo, idnetificador_articulo, id_parent_articulo
	if (__isTitulo(soup)):
		if (__isTituloCompuesto(soup)):
			resp = __separarTituloCompuesto(soup) # resp es una lista de partes, cada parte es un tag
			print resp, '\n'
			for p in resp:
				__procesarParrafo(p)
		else :
			if articulo_completo != '':
				dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent_articulo, idnetificador_articulo)
				idnetificador_articulo = ''
				articulo_completo = ''
			numeracion = hard_code_util.getNumeroTitular1(soup.text)
			if hard_code_util.isTitulo(soup.text):
				last_titulo = last_capitulo = last_seccion = last_subseccion = ''
				last_titulo = numeracion
				last_segmento_id = last_titulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_TITULO, ley_id, ley_id, 'titulo' + last_titulo)
			elif hard_code_util.isCapitulo(soup.text):
				last_seccion = last_subseccion = ''
				last_capitulo = numeracion
				last_segmento_id = last_capitulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_CAPITULO, ley_id, last_titulo_id, 'titulo' + last_titulo + "_capitulo" + last_capitulo)
			elif hard_code_util.isSeccion(soup.text):
				last_subseccion = ''
				last_seccion = numeracion
				cad = 'titulo' + last_titulo
				id_parent = last_titulo_id
				if last_capitulo != '':
					cad += "_capitulo" + last_capitulo
					id_parent = last_capitulo_id
				cad += '_seccion' + last_seccion
				last_segmento_id = last_seccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SECCION, ley_id, id_parent, cad)
			elif hard_code_util.isSubSeccion(soup.text):
				last_subseccion = numeracion
				cad = 'titulo' + last_titulo
				id_parent = last_titulo_id
				if last_capitulo != '':
					cad += "_capitulo" + last_capitulo
					id_parent = last_capitulo_id
				if last_seccion != '':
					cad += '_seccion' + last_seccion
					id_parent = last_seccion_id
				cad += '_subseccion' + last_subseccion
				last_subseccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SUBSECCION, ley_id, id_parent, cad)
				last_segmento_id = last_subseccion_id
	else:
		if hard_code_util.isArticulo(soup.text):
			cad = 'titulo' + last_titulo
			id_parent = last_titulo_id
			if last_capitulo != '':
				cad += "_capitulo" + last_capitulo
				id_parent = last_capitulo_id
			if last_seccion != '':
				cad += '_seccion' + last_seccion
				id_parent = last_seccion_id
			if last_subseccion != '':
				cad += '_subseccion' + last_subseccion
				id_parent = last_subseccion_id
			cad += '_articulo' + hard_code_util.getNumeroArticulo(soup.text)
			if soup.find('strike') is not None:
				 cad += '-'
			if articulo_completo != '':
				dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent, idnetificador_articulo)
				id_parent_articulo = id_parent
			idnetificador_articulo = cad
			articulo_completo = str(soup)
			start_articles = True
		elif start_articles:
			if hard_code_util.startEndConstitucion(soup.text) or len(end_of_code) > 0:
				end_of_code += str(soup)
			else:
				if not __isTitulo(soup):
					articulo_completo += str(soup)
def __procesarParrafo(soup):
	global ley_id, last_libro_id, last_titulo_id, last_subtitulo_id, last_capitulo_id, last_seccion_id, last_subseccion_id, last_segmento_id, start_articles, end_of_code, last_libro, last_titulo, last_subtitulo, last_capitulo, last_seccion, last_subseccion, articulo_completo, idnetificador_articulo, id_parent_articulo
	if (__isTitulo(soup)):
		if articulo_completo != '':
			dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent_articulo, idnetificador_articulo)
			idnetificador_articulo = ''
			articulo_completo = ''
		numeracion = hard_code_util.getNumeroTitular1(soup.text)
		if hard_code_util.isLibro(soup.text):
			last_titulo = last_subtitulo = last_capitulo = last_seccion = last_subseccion = ''
			last_libro = numeracion
			last_segmento_id = last_libro_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_LIBRO, ley_id, ley_id,'libro' + last_libro)
		elif hard_code_util.isSubTitulo(soup.text):
			last_capitulo = last_seccion = last_subseccion = ''
			last_subtitulo = numeracion
			last_segmento_id = last_subtitulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SUBTITULO, ley_id, last_titulo_id, 'libro' + last_libro + '_titulo' + last_titulo + '_subtitulo' + last_subtitulo)
		elif hard_code_util.isTitulo(soup.text):
			last_subtitulo = last_capitulo = last_seccion = last_subseccion = ''
			last_titulo = numeracion
			last_segmento_id = last_titulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_TITULO, ley_id, last_libro_id, 'libro' + last_libro + '_titulo' + last_titulo)
		elif hard_code_util.isCapitulo(soup.text):
			last_seccion = last_subseccion = ''
			last_capitulo = numeracion
			cad = 'libro' + last_libro + '_titulo' + last_titulo
			id_parent = last_titulo_id
			if last_subtitulo != '':
				cad += "_subtitulo" + last_subtitulo
				id_parent = last_subtitulo_id
			cad += '_capitulo' + last_capitulo
			last_segmento_id = last_capitulo_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_CAPITULO, ley_id, id_parent, cad)
		elif hard_code_util.isSeccion(soup.text):
			last_subseccion = ''
			last_seccion = numeracion
			cad = 'libro' + last_libro + '_titulo' + last_titulo
			id_parent = last_titulo_id
			if last_subtitulo != '':
				cad += "_subtitulo" + last_subtitulo
				id_parent = last_subtitulo_id
			if last_capitulo != '':
				cad += "_capitulo" + last_capitulo
				id_parent = last_capitulo_id
			cad += '_seccion' + last_seccion
			last_segmento_id = last_seccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SECCION, ley_id, id_parent, cad)
		elif hard_code_util.isSubSeccion(soup.text):
			last_subseccion = numeracion
			cad = 'libro' + last_libro + '_titulo' + last_titulo
			id_parent = last_titulo_id
			if last_subtitulo != '':
				cad += "_subtitulo" + last_subtitulo
				id_parent = last_subtitulo_id
			if last_capitulo != '':
				cad += "_capitulo" + last_capitulo
				id_parent = last_capitulo_id
			if last_seccion != '':
				cad += '_seccion' + last_seccion
				id_parent = last_seccion_id
			cad += '_subseccion' + last_subseccion
			last_segmento_id = last_subseccion_id = dao.segmentoDAO.insert(str(soup), dao.segmentoDAO.TIPO_SUBSECCION, ley_id, id_parent, cad)
	else:
		if hard_code_util.isArticulo(soup.text):
			cad = 'libro' + last_libro + '_titulo' + last_titulo
			id_parent = last_titulo_id
			if last_subtitulo != '':
				cad += "_subtitulo" + last_subtitulo
				id_parent = last_subtitulo_id
			if last_capitulo != '':
				cad += "_capitulo" + last_capitulo
				id_parent = last_capitulo_id
			if last_seccion != '':
				cad += '_seccion' + last_seccion
				id_parent = last_seccion_id
			if last_subseccion != '':
				cad += '_subseccion' + last_subseccion
				id_parent = last_subseccion_id
			cad = cad + '_articulo' + hard_code_util.getNumeroArticulo(soup.text)
			if soup.find('strike') is not None:
				cad += '-'
			if articulo_completo != '':
				dao.segmentoDAO.insert(articulo_completo, dao.segmentoDAO.TIPO_ARTICULO, ley_id, id_parent, idnetificador_articulo)
				id_parent_articulo = id_parent
			idnetificador_articulo = cad
			articulo_completo = str(soup)
			start_articles = True
		elif start_articles:
			if not __isTitulo(soup):
				articulo_completo += str(soup)