TRPO-Tensorflow2

Trust Region Policy Optimization (TRPO) algorithm implementation with TensorFlow 2 framework. Project developed for Reinforcement Learning exam of professor R. Capobianco.

Requirements

Install anaconda
Create the environment: $ conda create --name trpo python==3.7
Activate the environment: $ conda activate trpo
Install requirements: pip install gym[all]

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
models		models
report		report
LICENSE		LICENSE
README.md		README.md
lunar.mp4		lunar.mp4
mountain.mp4		mountain.mp4
policy.py		policy.py
test.py		test.py
train.py		train.py
utils.py		utils.py
value.py		value.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TRPO-Tensorflow2

Requirements

About

Releases

Packages

Languages

License

pietro-nardelli/TRPO

Folders and files

Latest commit

History

Repository files navigation

TRPO-Tensorflow2

Requirements

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages