本代码库基本停止维护了,请移步最新的代码库:
文件命名示例:
sac_sp.py:凡是带下划线sp的文件,都是spinup中的封装形式,即把强化算法封装成函数;
sac_class.py 凡是带class的文件,都是封装成类的形式,便于大家直接调用;
sac_auto_per_class 凡是带per的文件,都是可以选择是否调用优先经验回放的class,但是有时候优先经验回放并不一定好使,谨慎使用。
另外关于sac_auto,也被称作sac2,或者自适应sac,因为alpha超参数是放到网络中进行学习,一般来说要比sac更容易调用。
--
2020-12-09
发现这是我获得star最多的一个项目了。
刚才过了一遍所有的文件,发现优先经验回放PER没有单独抽取出来,还是和DDPG打包在一起的,这样会导致不能和TD3,SAC兼容。
另外sac-auto也没有提交。
事后经验回放HER没有实现
评论0
最新资源