Skip to content

rmajasol/WikipediaStatistics

Repository files navigation

WikipediaStatistics

Fase I: Popular la BD a partir de los logs mediante tareas programadas

Cada día 1, 10 y 20 de cada mes se realizan las siguiente serie de tareas:

  1. Tansferir logs de días anteriores -> transfer_logs.py
  2. Ejecutar wikisquilter sobre ellos (durante 10 segundos por log para pruebas) -> run_wikisquilter_10sec.py
  3. Popular BD de analysis -> populate_analysis.py
  4. Vaciar la BD squidlogs -> clear_squidlogs.py

Fase II: Crear una aplicación web para consultas gráficas sobre la BD