supervised_ML_comp118a

Final Project for COGS 118A: An Empirical Comparison of Supervised ML Algorithms across various binary classification problems

Datasets

All taken from Kaggle

Income dataset
- https://www.kaggle.com/mastmustu/income?select=train.csv
- 14 features
- predictor: income_>50k
Phishing website detector
- https://www.kaggle.com/eswarchandt/phishing-website-detector?select=phishing.csv
- 31 features
- predictor: 1/-1 phishing website or not
Airline passenger satisfaction
- https://www.kaggle.com/teejmahal20/airline-passenger-satisfaction?select=test.csv
- 24 features
- predictor: neutral or dissatisfied / satisfied
Surgical Complications dataset
- https://www.kaggle.com/omnamahshivai/surgical-dataset-binary-classification
- 24 features
- predictor: complication / no complication

Models

Models I will use for hyperparameter search and classification

Logistic Regression
SVM
Random Forest
Artificial Neural Network

Performance Metrics

Accuracy
F1 score
AUC
Precision
Recall
Heatmap plots of hyperparameter search results for Logistic Regression, Random Forest, and ANN (SVM has too many hyperparameter combinations over 4 dimensions to show)

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
algorithm_search		algorithm_search
data		data
eda		eda
img_results		img_results
.gitignore		.gitignore
Final_Project.pdf		Final_Project.pdf
README.md		README.md
results_eval_forpaper.ipynb		results_eval_forpaper.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

algorithm_search

algorithm_search

data

data

eda

eda

img_results

img_results

.gitignore

.gitignore

Final_Project.pdf

Final_Project.pdf

README.md

README.md

results_eval_forpaper.ipynb

results_eval_forpaper.ipynb

Repository files navigation

supervised_ML_comp118a

Datasets

Models

Performance Metrics

About

Releases

Packages

Languages

luluricketts/supervised_ML_comp118a

Folders and files

Latest commit

History

Repository files navigation

supervised_ML_comp118a

Datasets

Models

Performance Metrics

About

Resources

Stars

Watchers

Forks

Languages