Skip to content

Jonathan141999/proyecto-analisis-de-datos-JEGY

Repository files navigation

proyecto-analisis-de-datos-JEGY

ENLACE AL VIDEO DEL PROCEDIMINETO REALIZADO
https://www.youtube.com/watch?v=MNBEHrzU1Fo&feature=youtu.be
PULSO POLÍTICO EN 2O CIUDADES DEL ECUADOR

Se implementó la recepción de datos con respecto al tema del pulso político en ciudades de Ecuador, con respecto a la opinión de los usuaios acerca de los candidatos a presidencia y demás cargos gubernamentales, de esta forma se puede tener un concomiento más afondo sobre el pensamiento de los ciudadanos ante este tema.
La segunda parte del script "tweets ciudades.py" para la recolección de datos tanto con respecto a filtrados de búsqueda y geolocalización, esto se lo puede desarrollar también incorporando lo que es la ubicación de la ciduad en la que se requiere recopilar los datos.
Como punto siguiente se tiene los scripts 6 y 8 que permiten enviar los datos entre las bases de couch y mongo, de esta manera se incorpora la la base en couch para su posterior envío a ElasticSearch
Se hizo uso de logstash para enviar los datos de couch hacia Elasticsearch, esto se lo hizo por medio del input con el nombre "couch.conf", en donde se envía la id de la nube de elasticsearch y así registrar en los índices.
Los tweets tiene una estructura amplia de la cual nos interesa los hashtags, menciones, el texto y el lugar (país, ciudad).

Para usar elasticsearch primero, se procedió a crear cada indice y para cada indice se realizó la configuración de mapping detallada en el archivo "mapping indices elasticseach" donde se definen los formatos de fecha y geolocalización para los tweets.

Finalmente en kibana se realizaron las visualizaciones, ya que kibana tiene el benfecio de conectarse con elasticsearch, es aquí donde se realizaron visualizaciones concernientes a los datos almacenados.

VIDEO JUEGOS POR PAÍSES

Para el análisis de los videos juegos en los países se buscó bases de datos públicas de las siguientes fuentes que son:
Kaggle.com
Tableu Public Resource
UNdata.com
Las bases que contenían los datos que más se asemejaban a la petición del proyecto se recopilaron alrededor de 16638 datos los cuales se dividen en 3 bases.
Las principales datos se procesaron mediante Exel para limpiar datos innecesarios al momento que los datos fueron procesados se pudo realizar el respectivo análisis con las herramientas de POWER BI y de Tableu Public. Seleccionando los elementos más idóneos para obtener información relevante.
Para la utilización de bases relacionales se realizó la practica con MYsql DB Browser form SQlite y con la base relacional de Acces para enlazar las bases relacionales se utilizó la herramienta de Power BI que puede extraer directamente los datos de dichas bases.

EVENTO O NOTICIA MUNDIAL

Se tomo en cuenta el tema del COVID 19 como caso de noticia mundial para la recopilación de datos por medio de la plataforma Kaggle, en la cual fueron recopilados tres dataset: covid_mundial, covid_india, covid_japon. el propósito de la recopilación de datos es llevar un análisis de como va evolucionando la enfermedad alrededor del mundo, para ello se ha tomado datos mundiales y de dos paises que se encuentran entre los primeros en contagio de covid 19. Una vez obtenidos los dataset, se los sube a una base de datos,aqui se incorporo la base de datos MySql. El análisis Se realizo por medio de vistas realizadas en la aplicación de POWER BI, para ello se realizó la conexión entre My Sql y Power BI.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages