Ce projet est dédié à l'implémentation du problème du bandit manchot utilisé dans le cadre du principe d'Exploitation-Exploration de l'apprentissage par renforcement (Reinforcement Learning).
Le fichier tutorial.ipynb contient le principe de base d'utilisation des autres fichiers pour démarrer le jeu. Les vrais résultats des comparaison de différentes méthodes d'apprentissage par renforcement dans ce cas précis se trouvent dans le notebook main.ipynb. Ces algorithmes sont : ThompsonSamplingBernoulli, User Content Based, Epsilon N Greedy, etc...
Les autres fichiers python .py contiennent les classes et fonctions nécessaires au déroulement du jeu.