根据《Reinforcement Learning An Introduction》里的策略梯度方法,控制open AI gym库里的倒立摆。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~