Estudio de los parámetros que definen a un vino verde-tinto portugués como excelente
Iván Alía Suárez
- Este software es parte de la Práctica 2 de la asignatura: "Tipologia y ciclo de vida de los datos".
- Master de Data Science.
- Universitat Oberta of Catalunya.
- Consultora: Mireia Calvo Gonzalez
- pandas
- numpy
- matplotlib
- pylab
- scipy
- seaborn
El programa se ejecutará de la siguiente manera: python RedWineAnalysis.py
-
El archivo utilizado es "Wine Quality Data Set" obtenido de UCI - https://archive.ics.uci.edu/ml/datasets/wine+quality
-
Fuente del dataset
Paulo Cortez, University of Minho, Guimarães, Portugal, http://www3.dsi.uminho.pt/pcortez A. Cerdeira, F. Almeida, T. Matos and J. Reis, Viticulture Commission of the Vinho Verde Region(CVRVV), Porto, Portugal @2009
- Citación requerida por el uso del dataset
P. Cortez, A. Cerdeira, F. Almeida, T. Matos and J. Reis. Modeling wine preferences by data mining from physicochemical properties. In Decision Support Systems, Elsevier, 47(4):547-553, 2009.
- El programa crea un archivo de salida csv llamado winequality-red-analysis.csv
- Este archivo es generado en el paso de eliminación de los valores extremos y será usuado durante el resto de la práctica
- Los registros eliminados son aquellos que
- Residual Sugar es mayor o igual a 4.8
- Chlorides es mayor o igual a 0.152
- Los registros eliminados son aquellos que
- Este archivo es creado en el mismo directorio de donde se ejecuta el programa.