Description

This project implement some reinforcement learning algorithms, including DQN, Double DQN, C51, etc. It contains subset of algorithms from dopamine. It's for self study.

Requirement

python == 3.6, other version may work as well.
tensorflow >= 1.6.0
retro, video game emulator for RL.
ffmpeg (optional), for record video.

Result

Using C51, After training 48 hour on my GTX 960M.

Tensorboard

Usage

# train the model
python train.py

# record actions
# python eval.py --record_dir <path to store record file>
python eval.py --record_dir record

# make video. Need to have ffmpeg in the path.
# python -m retro.scripts.playback_movie <record file>...
python -m retro.scripts.playback_movie .\record\Breakout-Atari2600-Start-000000.bk2

Note

Using a memory pool with 100 million elements will consume about 7 GB memory.
C51 has faster convergence speed.

TODO

Implement store and restore for memory pool.
Add more algorithms.

Reference Project

dopamine, a research framework for fast prototyping of reinforcement learning algorithms.
baseline, OpenAI Baselines: high-quality implementations of reinforcement learning algorithms.
DQN-tensorflow, Tensorflow implementation of Human-Level Control through Deep Reinforcement Learning.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
models		models
.gitignore		.gitignore
README.md		README.md
custom_ops.py		custom_ops.py
demo.gif		demo.gif
eval.py		eval.py
memory_pool.py		memory_pool.py
rl_env.py		rl_env.py
tensorboard.png		tensorboard.png
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Description

Requirement

Result

Tensorboard

Usage

Note

TODO

Reference Project

About

Releases

Packages

Languages

blaueck/tf-exp-dqn

Folders and files

Latest commit

History

Repository files navigation

Description

Requirement

Result

Tensorboard

Usage

Note

TODO

Reference Project

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages