access

This is my code for 15th place in the Amazon Access competition on Kaggle.

features.py uses fileio.py to generate data and then run a classifier it also does feature selection

the final blend was 4 logistic regressions with C=2.3 and feature selection on tripsFractions.csv with seeds: 1337, 410, 622, 918

Miroslaw's naive bayes using the 410 features
SGD (parameters in submissions.csv)
GBM with conditional probabilities + raw data

There's also code for blending based on Caruana's blending paper. Always overfit.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
README.md		README.md
blend.R		blend.R
blendCaruana.R		blendCaruana.R
classifier.py		classifier.py
condprob.py		condprob.py
features.py		features.py
fileio.py		fileio.py
loadData.R		loadData.R
naive_bayes.py		naive_bayes.py
plotting.py		plotting.py
predict.py		predict.py
subList.csv		subList.csv
submissions.txt		submissions.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

blend.R

blend.R

blendCaruana.R

blendCaruana.R

classifier.py

classifier.py

condprob.py

condprob.py

features.py

features.py

fileio.py

fileio.py

loadData.R

loadData.R

naive_bayes.py

naive_bayes.py

plotting.py

plotting.py

predict.py

predict.py

subList.csv

subList.csv

submissions.txt

submissions.txt

Repository files navigation

access

About

Releases

Packages

Languages

nmkridler/access

Folders and files

Latest commit

History

Repository files navigation

access

About

Resources

Stars

Watchers

Forks

Languages