用Jax实现的深度强化学习算法
使用Jax实施深度强化学习。 在OpenAI健身房CartPole环境中进行测试。
演算法
DQN-
具有目标网络的DQN-
用法
# Install deps
pip install -r requirements.text
训练模式
# Using launch script, by default set up to run multiple seeds
./launch.sh
# Using python
python3 run.py --agent dqn --train_eps 100 --n_layers 3 --seed 1 --test_eps 30 --lr 0.03 --batch_size 256 --warm_up_steps 500 --epsilon_hlife 1500 --save_dir out/CartPole-
评论0
最新资源