Reinforcement Learning example for a presentation

I implemented Q-Learning, Policy-Iteration and Value-Iteration for a MDP Environment. The Algorithms are as suggested by the book "Reinforcement Learning: An Introduction" by Sutton and Barto.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
README.md		README.md
mdp.py		mdp.py
q_learning.py		q_learning.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.gitignore

.gitignore

README.md

README.md

mdp.py

mdp.py

q_learning.py

q_learning.py

requirements.txt

requirements.txt

Repository files navigation

Reinforcement Learning example for a presentation

About

Languages

w1nte/reinforcement-learning-presentation

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning example for a presentation

About

Topics

Resources

Stars

Watchers

Forks

Languages