本文分析了强化学习在交易农业 ETF 中的应用。 本文的第一部分检查了使用天真的交易策略的性能,以便稍后与强化学习策略进行比较。 在这里,回报非常不稳定,代理商的表现都严重低于和高于指数基准。 本文的第二部分考察了蒙特卡洛策略梯度算法在交易中的使用。 最后,展示了执行动态时间扭曲的结果,用于在幼稚交易和使用强化学习算法的交易之间进行并排比较。 总体而言,与朴素交易相比,强化学习产生更不稳定的结果,夏普比率为正,平均回报为负。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~