AI181

PacmanDQN

Deep Reinforcement Learning in Pac-man

Example usage

Run a model on smallGrid layout for 6000 episodes, of which 5000 episodes are used for training.

$ python3 pacman.py -p PacmanDQN -n 6000 -x 5000 -l smallGrid

Layouts

Different layouts can be found and created in the layouts directory

Parameters

Parameters can be found in the params dictionary in pacmanDQN_Agents.py.

Models are saved as "checkpoint" files in the /saves directory.
Load and save filenames can be set using the load_file and save_file parameters.

Episodes before training starts: train_start
Size of replay memory batch size: batch_size
Amount of experience tuples in replay memory: mem_size
Discount rate (gamma value): discount
Learning rate: lr

Exploration/Exploitation (ε-greedy):
Epsilon start value: eps
Epsilon final value: eps_final
Number of steps between start and final epsilon value (linear): eps_step

Requirements

python==3.5
tensorflow==0.8rc

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
p2_logic/p2_logic		p2_logic/p2_logic
p3_bayes_nets		p3_bayes_nets
p4_tracking		p4_tracking
p5_reinforcement/reinforcement		p5_reinforcement/reinforcement
README.md		README.md
Shared bike management report.pdf		Shared bike management report.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

p2_logic/p2_logic

p2_logic/p2_logic

p3_bayes_nets

p3_bayes_nets

p4_tracking

p4_tracking

p5_reinforcement/reinforcement

p5_reinforcement/reinforcement

README.md

README.md

Shared bike management report.pdf

Shared bike management report.pdf

Repository files navigation

AI181

PacmanDQN

Example usage

Layouts

Parameters

Requirements

About

Releases

Packages

Languages

gemiracle/CS181

Folders and files

Latest commit

History

Repository files navigation

AI181

PacmanDQN

Example usage

Layouts

Parameters

Requirements

About

Resources

Stars

Watchers

Forks

Languages