Práctica 2: Data cleaning

Descripción

Segunda práctica de la asignatura Tipología y ciclo de vida de los datos del máster de Data Science de la UOC (Universitat Oberta de Catalunya). El proyecto consiste en utilizar técnicas de data cleaning para preparar un dataset para poder resolver un problema, en este caso se ha realizado sobre el problema de Kaggle sobre los pasajeros del Titanic

Equipo

El proyecto se ha realizado de forma individual por Xavi Medina Torregrosa

Código fuente

El código se encuentra en la carpeta src:

App.py : Entry point del proyecto
DataCleaning.py : Funciones necesarias para la limpieza de datos del dataset
DataExploration.py : Funciones para explorar los datos del dataset
DataImport.py: Funciones para cargar los dataset
Prediction.py: Funciones para crear el modelo predictivo y ejecutarlo

Respuestas de la práctica

El documento con las respuestas de la práctica se ecuentra en la carpeta pdf

Dataset

El dataset se encuentra en la carpeta data

train.csv : Dataset para entrenar el modelo
test.csv : Dataset para probar el modelo
solution.csv : Dataset resultante del modelo para subir a Kaggle
cleaned_processed_data.csv : Dataset con los datos limpiados y normalizados

Licencia

Código y dataset bajo licencia CC BY-NC-SA 4.0

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commits
.idea		.idea
data		data
pdf		pdf
src		src
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.idea

.idea

data

data

pdf

pdf

src

src

readme.md

readme.md

Repository files navigation

Práctica 2: Data cleaning

Descripción

Equipo

Código fuente

Respuestas de la práctica

Dataset

Licencia

About

Releases

Packages

Languages

XaviMedina/UOCDataCleaning

Folders and files

Latest commit

History

Repository files navigation

Práctica 2: Data cleaning

Descripción

Equipo

Código fuente

Respuestas de la práctica

Dataset

Licencia

About

Resources

Stars

Watchers

Forks

Languages