def __init__(self, cfg, log, proveedor_datos): self.cfg = cfg self.log = log self.proveedor_datos = proveedor_datos self.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) self.coordinador = CoordinadorEvento(cfg, self.log) self.repo_variables = RepoVariables(self.cfg, self.cliente_mongo) self.repo_estaciones = RepoEstaciones(self.cfg, self.cliente_mongo)
def __init__(self, cfg, log): self.cfg = cfg self.log = log self.twitter = Twitter(self.cfg, self.log) self.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) self.repo_estaciones = RepoEstaciones(cfg, self.cliente_mongo) self.repo_eventos = RepoEventos(cfg, self.cliente_mongo) self.tipo_json = 'json' self.tipo_binario = 'octet-stream' self.campos_analisis_foto = 'Categories, Tags, Description, Faces, ImageType, Adult'
def __init__(self, cfg, log): self.cfg = cfg self.log = log self.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) self.repo_confederaciones = RepoConfederaciones( cfg, self.cliente_mongo) self.repo_estaciones = RepoEstaciones(cfg, self.cliente_mongo) self.repo_eventos = RepoEventos(cfg, self.cliente_mongo) self.repo_variables = RepoVariables(cfg, self.cliente_mongo) self.repo_tipo_evento = RepoTiposEvento(cfg, self.cliente_mongo) self.twitter = Twitter(self.cfg, self.log)
def setUpClass(cls): cls.log = LogSodin(cfg, cfg.FICHERO_LOG_GESTOR, LogSodin.LOGGER_MONITOR) cls.log.configurar_log() cls.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) cls.repo_eventos = RepoEventos(cfg, cls.cliente_mongo) cls.repo_tipos_evento = RepoTiposEvento(cfg, cls.cliente_mongo) cls.repo_estaciones = RepoEstaciones(cfg, cls.cliente_mongo) cls.analisis = Analisis(cfg, cls.log) cls.twitter = Twitter(cfg, cls.log)
def setUpClass(cls): cls.chc = CHCantabrico(cfg) cls.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) cls.repo_confederaciones = RepoConfederaciones(cfg, cls.cliente_mongo) cls.repo_estaciones = RepoEstaciones(cfg, cls.cliente_mongo) cls.repo_variables = RepoVariables(cfg, cls.cliente_mongo) cls.repo_eventos = RepoEventos(cfg, cls.cliente_mongo) cls.nombre_tipo_fluvial = 'Fluvial' cls.cod_tipo_fluvial = 1 cls.cod_chc = 1 #CHCantabrico
def setUpClass(cls): cls.log = LogSodin(cfg, cfg.FICHERO_LOG_MONITOR, LogSodin.LOGGER_MONITOR) cls.log.configurar_log() cls.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) cls.repo_confederaciones = RepoConfederaciones(cfg, cls.cliente_mongo) cls.repo_estaciones = RepoEstaciones(cfg, cls.cliente_mongo) cls.repo_variables = RepoVariables(cfg, cls.cliente_mongo) cls.repo_eventos = RepoEventos(cfg, cls.cliente_mongo) cls.repo_tipos_evento = RepoTiposEvento(cfg, cls.cliente_mongo)
def setUpClass(cls): cls.Chc = CHCantabrico(cfg) cls.log = LogSodin(cfg, cfg.FICHERO_LOG_MONITOR, LogSodin.LOGGER_MONITOR) cls.log.configurar_log() cls.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) cls.repo_variables = RepoVariables(cfg, cls.cliente_mongo) cls.repo_eventos = RepoEventos(cfg, cls.cliente_mongo) cls.repo_estaciones = RepoEstaciones(cfg, cls.cliente_mongo) cls.repo_tipos_evento = RepoTiposEvento(cfg, cls.cliente_mongo) cls.CODIGO_CONFEDERACION_CHC = 1
def setUpClass(cls): cls.log = LogSodin(cfg, cfg.FICHERO_LOG_MONITOR, LogSodin.LOGGER_MONITOR) cls.log.configurar_log() cls.twitter = Twitter(cfg, cls.log) cls.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) cls.repo_eventos = RepoEventos(cfg, cls.cliente_mongo) cls.repo_estaciones = RepoEstaciones(cfg, cls.cliente_mongo) cls.repo_nucleos = RepoNucleos(cfg, cls.cliente_mongo) cls.repo_tipos_evento = RepoTiposEvento(cfg, cls.cliente_mongo) cls.repo_confederaciones = RepoConfederaciones(cfg, cls.cliente_mongo) cls.gestion = Gestion(cfg, cls.log) cls.coordinador_evento = CoordinadorEvento(cfg, cls.log)
def setUpClass(cls): cls.log = LogSodin(cfg, cfg.FICHERO_LOG_GESTOR, LogSodin.LOGGER_MONITOR) cls.log.configurar_log() cls.gestion = Gestion(cfg, cls.log) cls.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) cls.repo_confederaciones = RepoConfederaciones(cfg, cls.cliente_mongo) cls.repo_variables = RepoVariables(cfg, cls.cliente_mongo) cls.repo_estaciones = RepoEstaciones(cfg, cls.cliente_mongo) cls.repo_eventos = RepoEventos(cfg, cls.cliente_mongo) cls.repo_tipos_evento = RepoTiposEvento(cfg, cls.cliente_mongo) cls.cod_tipo_evento_fluvial = 1 cls.Coordinador = CoordinadorEvento(cfg, cls.log) cls.id_estacion = 'N020' #Pontenova cls.cod_chc = 1 cls.nivel_rio = 2.14
class Gestion(object): """Clase para gestionar los eventos mientras permanecen activos""" def __init__(self, cfg, log): self.cfg = cfg self.log = log self.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) self.repo_confederaciones = RepoConfederaciones( cfg, self.cliente_mongo) self.repo_estaciones = RepoEstaciones(cfg, self.cliente_mongo) self.repo_eventos = RepoEventos(cfg, self.cliente_mongo) self.repo_variables = RepoVariables(cfg, self.cliente_mongo) self.repo_tipo_evento = RepoTiposEvento(cfg, self.cliente_mongo) self.twitter = Twitter(self.cfg, self.log) def actualizar_datos_eventos(self, eventos_activos): '''Obtiene los ultimos datos y los guarda en el evento''' for evento in eventos_activos: self.guardar_datos_en_evento(evento) self.repo_eventos.actualizar_evento(evento) self.log.escribir(u'OK - Evento actualizado con los últimos datos', self.log.INFO) def guardar_datos_en_evento(self, evento): estacion = self.repo_estaciones.obtener_estacion(evento['idEstacion']) tipo = self.repo_eventos.obtener_tipo_evento(evento['codigoTipo']) self.log.escribir( u'EVENTO {0} activo en {1}. Fecha: {2}'.format( tipo['nombre'], estacion['nombre'], evento['fechaInicio']), self.log.INFO) if tipo == self.repo_tipo_evento.obtener_tipo_evento_fluvial(): # datos de estaciones saih para eventos fluviales self.log.escribir( u'1) Obtener últimos datos de estaciones SAIH para el evento', self.log.INFO) self.guardar_datos_de_saih(evento, estacion) else: # datos de boyas de puertos del estado para eventos costeros self.log.escribir( u'1) Obtener últimos datos de boyas para el evento', self.log.INFO) self.guardar_datos_de_boyas(evento, estacion) # datos twitter self.log.escribir(u'2) Buscar nuevos tweets sobre el evento', self.log.INFO) self.guardar_nuevos_tweets_evento(evento, estacion) # datos aemet? def guardar_datos_de_saih(self, evento, estacion): confederacion = self.repo_confederaciones.obtener_confederacion( estacion['codigoConfederacion']) proveedor_confe = self.repo_confederaciones.obtener_proveedor_saih( confederacion) for variable_estacion in estacion['variables']: variable = self.repo_variables.obtener_variable( variable_estacion['codigo']) try: ultima_medida = proveedor_confe.ultima_medida_de_estacion( estacion, variable) Gestion._agregar_medida_a_evento(evento, 'datosConfederaciones', ultima_medida) self.log.escribir( u'Último dato de {0} añadido al evento'.format( variable['nombre']), self.log.INFO) except ValueError as verr: self.log.escribir( u'No se ha podido obtener la medida. {0}'.format( verr.message), self.log.WARNING) continue def guardar_datos_de_boyas(self, evento, estacion): proveedor_boyas = self.repo_confederaciones.obtener_proveedor_boyas() for variable_estacion in estacion['variables']: variable = self.repo_variables.obtener_variable( variable_estacion['codigo']) try: ultima_medida = proveedor_boyas.ultima_medida_de_estacion( estacion, variable) Gestion._agregar_medida_a_evento(evento, 'datosPuertos', ultima_medida) self.log.escribir( u'Último dato de {0} añadido al evento'.format( variable['nombre']), self.log.INFO) except ValueError as verr: self.log.escribir( u'No se ha podido obtener la medida. {0}'.format( verr.message), self.log.WARNING) continue def guardar_nuevos_tweets_evento(self, evento, estacion): '''Busca y guarda nuevos tweets relacionados con un evento concreto''' # Configurar peticion de busqueda en twitter props = self.propiedades_peticion_twitter(evento, estacion) # Buscar nuevos tweets por lotes tweets = self.twitter.busqueda_tweets_por_lotes( props, config_twitter.NUM_LOTES) self.log.escribir(u'Filtro avanzado de tweets', self.log.INFO) tweets_filtrados = self.twitter.filtro_avanzado_tweets_evento( tweets, evento) # Guardar nuevos tweets en evento de BD if not tweets_filtrados: self.log.escribir( u'No se han encontrado nuevos tweets sobre el evento', self.log.INFO) evento['datosTwitter'].extend(tweets_filtrados) self.log.escribir( u'{0} nuevos tweets agregados al evento'.format( str(len(tweets_filtrados))), self.log.INFO) @staticmethod def _agregar_medida_a_evento(evento, campo_datos, medida): '''Agrega una medida de una estación a un evento''' evento[campo_datos].append(medida.to_json_obj()) def propiedades_peticion_twitter(self, evento, estacion): tipo_fluvial = self.repo_tipo_evento.obtener_tipo_evento_fluvial() toponimos = evento['toponimos'] query_toponimos = u'"{0}"'.format(toponimos[0]) for toponimo in toponimos[1:]: query_toponimos += u' OR "{0}"'.format(toponimo) if evento['codigoTipo'] == tipo_fluvial['codigo']: query = self.twitter.crear_query_twitter( query_toponimos, config_twitter.PALABRAS_CLAVE_FLUVIAL, config_twitter.PALABRAS_EXCLUIDAS, config_twitter.CUENTAS_OFICIALES) else: query = self.twitter.crear_query_twitter( query_toponimos, config_twitter.PALABRAS_CLAVE_COSTERO, config_twitter.PALABRAS_EXCLUIDAS, config_twitter.CUENTAS_OFICIALES) #Activar para filtrar espacialmente la búsqueda de tweets #coords = Gestion.obtener_centroide_estacion(estacion) #query_geo = Twitter.crear_query_geo(coords[0], coords[1]) query_geo = '' id_ultimo_tweet = self.obtener_id_ultimo_tweet_evento(evento) return { 'query': query, 'query_geo': query_geo, 'id_ultimo': id_ultimo_tweet, 'next_max_id': None, 'max_num_tweets': config_twitter.MAX_TWEETS_PETICION } def obtener_id_ultimo_tweet_evento(self, evento): '''Obtiene la id del último tweet de un evento guardado en la BD''' id_ultimo_tweet = 0 try: id_ultimo_tweet = evento['datosTwitter'][0]['id'] except IndexError: self.log.escribir(u'Aun no hay tweets en el evento', self.log.DEBUG) finally: return id_ultimo_tweet @staticmethod def obtener_centroide_estacion(estacion_evento): try: return (estacion_evento['coordenadas']['lon'], estacion_evento['coordenadas']['lat']) except AttributeError as atterr: raise AttributeError( u'Error obteniendo centroide de un evento. {0}'.format( atterr.message))
class Analisis(object): """Clase encargada del analisis y postproceso de un evento de inundación""" def __init__(self, cfg, log): self.cfg = cfg self.log = log self.twitter = Twitter(self.cfg, self.log) self.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) self.repo_estaciones = RepoEstaciones(cfg, self.cliente_mongo) self.repo_eventos = RepoEventos(cfg, self.cliente_mongo) self.tipo_json = 'json' self.tipo_binario = 'octet-stream' self.campos_analisis_foto = 'Categories, Tags, Description, Faces, ImageType, Adult' def post_proceso_de_evento(self, evento): '''Analiza las fotos y textos, procesa las medidas de los sensores, extrae estadisticas y metadatos y guarda todo en un objeto PostEvento en la BD''' # Analisis ia de fotos y textos de los tweets self.log.escribir(u'2) Procesar tweets', self.log.INFO) tweets_post_procesados = self.analisis_tweets(evento['datosTwitter']) # Analizar datos del medio self.log.escribir(u'3) Procesar medidas de sensores', self.log.INFO) medidas_in_situ = evento['datosConfederaciones'] + evento[ 'datosPuertos'] medidas_post_procesadas = self.procesar_medidas(medidas_in_situ) # Guardar PostEvento en BD self.log.escribir(u'4) Insertar PostEvento en BD', self.log.INFO) post_evento = self.crear_post_evento(evento, tweets_post_procesados, medidas_post_procesadas) repo_eventos = RepoEventos(self.cfg, self.cliente_mongo) return repo_eventos.insertar_post_evento(post_evento) def analisis_tweets(self, tweets): tweets_postevento = [] for tweet in tweets: try: tweets_postevento.append(self.procesar_tweet(tweet)) except Exception as ex: self.log.escribir( u'Se ha producido un error analizando el tweet. {0}'. format(ex.message), self.log.WARNING) continue return tweets_postevento def procesar_tweet(self, tweet): self.log.escribir(u' Analizar tweet:', self.log.INFO) foto_procesada = self.analizar_foto_del_tweet(tweet) texto_procesado = self.analizar_texto_del_tweet(tweet) metadatos = self.extraer_metadatos_del_tweet(tweet) tweet_postevento = { 'id_tweet': str(tweet['id']), 'metadatos': metadatos, 'datos_foto': foto_procesada, 'datos_texto': texto_procesado } return tweet_postevento def analizar_foto_del_tweet(self, tweet): self.log.escribir(u' - Buscar fotos asociadas', self.log.INFO) try: foto = None url_foto = self.twitter.obtener_url_foto_de_tweet(tweet) if url_foto is not None: self.log.escribir( u' Ejecución de análisis i.a. de la foto', self.log.INFO) datos_analisis = self.analizar_foto_externa( self.campos_analisis_foto, url_foto) foto = self.crear_objeto_foto(self.campos_analisis_foto, datos_analisis, url_foto) else: self.log.escribir(u' Tweet sin foto asociada', self.log.INFO) except Exception as ex: self.log.escribir( u'No se ha podido hacer el análisis de imagen. {0}'.format( ex.message), self.log.WARNING) finally: return foto def analizar_foto_externa(self, campos_busqueda, url_foto): (cabeceras, parametros) = self.config_peticion_api_vision(campos_busqueda, self.tipo_json) datos_analisis = cpu_vision.process_request({'url': url_foto}, None, cabeceras, parametros) return datos_analisis def analizar_foto_en_disco(self, campos_busqueda, ruta_en_disco): with open(ruta_en_disco, 'rb') as fichero: datos = fichero.read() (cabeceras, parametros) = self.config_peticion_api_vision(campos_busqueda, self.tipo_binario) datos_analisis = cpu_vision.process_request(None, datos, cabeceras, parametros) return datos_analisis def config_peticion_api_vision(self, campos_busqueda, tipo): '''Genera las cabeceras y parametros necesarios para la peticion a la api''' cabeceras = dict() cabeceras[ 'Ocp-Apim-Subscription-Key'] = self.cfg.COMPUTER_VISION_API_KEY cabeceras['Content-Type'] = 'application/{0}'.format(tipo) parametros = { 'visualFeatures': campos_busqueda, 'language': 'en', 'details': 'Landmarks' } return (cabeceras, parametros) # pylint: disable=R0201 def crear_objeto_foto(self, campos, datos_analisis, url_foto): foto_procesada = {} for campo in campos.replace(' ', '').split(','): campo_camelcase = campo[:1].lower() + campo[1:] foto_procesada[campo] = datos_analisis[campo_camelcase] # Añadir la url original de la foto foto_procesada['url'] = url_foto return foto_procesada def analizar_texto_del_tweet(self, tweet): try: self.log.escribir(u' - Análisis semántico del texto', self.log.INFO) (palabras_clave, sentimiento) = text_analytics.analisis_texto( tweet['id'], tweet['text']) texto_procesado = { 'texto': tweet['text'], 'palabras_clave': palabras_clave, 'sentimiento': sentimiento } except Exception as ex: self.log.escribir( u'No se ha podido hacer el análisis del texto. {0}'.format( ex.message), self.log.WARNING) texto_procesado = { 'texto': tweet['text'], 'palabras_clave': [], 'sentimiento': 1 } finally: return texto_procesado def extraer_metadatos_del_tweet(self, tweet): self.log.escribir(u' - Extracción de metadatos del tweet', self.log.INFO) return { 'coordenadas': tweet.get('coordinates'), 'hashtags': tweet.get('entities').get('hashtags', []), 'n_retweets': tweet.get('retweet_count', 0), 'n_likes': tweet.get('favorite_count', 0), #'sensible': tweet['possibly_sensitive'], 'fecha_creacion': tweet.get('created_at'), 'verified': tweet.get('user').get('verified'), 'account': tweet.get('user').get('screen_name') #todo: guardar si tiene enlaces o no. links:true } def procesar_medidas(self, medidas): '''Estandarizacion de los datos de los sensores''' self.log.escribir(u' - Estandarización de datos', self.log.INFO) # Pasar las fechas internas de las medidas a cadena para poder insertar # en BD for medida in medidas: medida['fecha'] = util.convertir_fecha_a_cadena( medida['fecha'], self.cfg.FORMATO_FECHA) return medidas def crear_post_evento(self, evento, tweets_procesados, medidas_procesadas): tipo = self.repo_eventos.obtener_tipo_evento(evento['codigoTipo']) estacion = self.repo_estaciones.obtener_estacion(evento['idEstacion']) try: nuevo_post_evento = PostEvento({ 'idEvento': str(evento['_id']), 'tipo': tipo['nombre'], 'lugar': estacion['nombre'], 'idEstacion': evento['idEstacion'], 'coords': estacion['coordenadas'], 'medidas': medidas_procesadas, 'tweets': tweets_procesados, 'fechaInicio': util.convertir_fecha_a_cadena(evento['fechaInicio'], self.cfg.FORMATO_FECHA), 'fechaFin': util.convertir_fecha_a_cadena(evento['fechaFin'], self.cfg.FORMATO_FECHA) }) return nuevo_post_evento except AttributeError as aterr: raise AttributeError(u'Error creando post evento. {0}'.format( aterr.message))
class Deteccion(object): """Clase para la gestión de las alertas fluviales y costeras""" def __init__(self, cfg, log, proveedor_datos): self.cfg = cfg self.log = log self.proveedor_datos = proveedor_datos self.cliente_mongo = repo.inicializar_cliente(cfg.URI_MONGODB, cfg.NOMBRE_BD) self.coordinador = CoordinadorEvento(cfg, self.log) self.repo_variables = RepoVariables(self.cfg, self.cliente_mongo) self.repo_estaciones = RepoEstaciones(self.cfg, self.cliente_mongo) def buscar_alertas(self, confederacion, tipo): '''Comprobar posibles alertas de inundación fluvial o costera en una zona''' variable_deteccion = self.repo_variables.obtener_variable_por_nombre( self.proveedor_datos.cfg_proveedor.VARIABLE_DETECCION) estaciones = self.repo_estaciones.obtener_estaciones_de_tipo( confederacion['codigo'], tipo['codigo'], True) if not estaciones: self.log.escribir( u' No hay estaciones de tipo {0} en esta confederación'.format( tipo['nombre']), self.log.INFO) else: self.log.escribir( u' Comprobar {0} en estaciones: '.format( variable_deteccion['nombre'].upper()), self.log.INFO) self.comprobar_estado_estaciones(estaciones, variable_deteccion) def comprobar_estado_estaciones(self, estaciones, variable_deteccion): for estacion in estaciones: try: umbral = Deteccion.obtener_umbral( estacion, variable_deteccion['codigo'], self.proveedor_datos.cfg_proveedor.NIVEL_ALERTA) hay_alerta = self.evaluar_datos_actuales( estacion, variable_deteccion, umbral) self.coordinador.gestionar_alerta(estacion, variable_deteccion, hay_alerta) except Exception as ex: self.log.escribir( u' {0}: {1}'.format(estacion['nombre'], ex.message), self.log.WARNING) continue @staticmethod def obtener_umbral(estacion, cod_variable, nivel_alerta): variable_estacion = util.filtrar_lista(estacion['variables'], 'codigo', cod_variable) if not variable_estacion: raise ValueError(u' Variable de detección no disponible') if variable_estacion['umbrales'][nivel_alerta]: return variable_estacion['umbrales'][nivel_alerta] return None def evaluar_datos_actuales(self, estacion, variable_deteccion, umbral): '''Comprueba si los valores actuales de una variable superan los umbrales de la estación''' if umbral is None: raise ValueError(u' Umbral no definido.') medida = self.proveedor_datos.ultima_medida_de_estacion( estacion, variable_deteccion) self.log.escribir( u' {0}: {1}. Umbral: {2}'.format(estacion['nombre'], str(medida.valor), str(umbral)), self.log.INFO) hay_alerta = Deteccion.valores_superan_umbral(umbral, medida.valor) return hay_alerta @staticmethod def valores_superan_umbral(umbral, valor): if umbral is not None and valor > umbral: return True return False