Apprentissage par Renforcement

Ce projet est dédié à l'implémentation du problème du bandit manchot utilisé dans le cadre du principe d'Exploitation-Exploration de l'apprentissage par renforcement (Reinforcement Learning).

Le fichier tutorial.ipynb contient le principe de base d'utilisation des autres fichiers pour démarrer le jeu. Les vrais résultats des comparaison de différentes méthodes d'apprentissage par renforcement dans ce cas précis se trouvent dans le notebook main.ipynb. Ces algorithmes sont : ThompsonSamplingBernoulli, User Content Based, Epsilon N Greedy, etc...

Les autres fichiers python .py contiennent les classes et fonctions nécessaires au déroulement du jeu.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
arm.py		arm.py
exp.py		exp.py
main.ipynb		main.ipynb
player.py		player.py
tp_tools.py		tp_tools.py
tutorial.ipynb		tutorial.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

arm.py

arm.py

exp.py

exp.py

main.ipynb

main.ipynb

player.py

player.py

tp_tools.py

tp_tools.py

tutorial.ipynb

tutorial.ipynb

Repository files navigation

Apprentissage par Renforcement

About

Releases

Packages

Languages

boulbi777/apprentissage-renforcement

Folders and files

Latest commit

History

Repository files navigation

Apprentissage par Renforcement

About

Resources

Stars

Watchers

Forks

Languages