股票买卖最佳时机leetcode
股票市场是一个极其复杂的动态系统。
大量文献致力于了解股票市场和制定有效的交易策略。
在
Xiong
等人的题为《股票交易的实用深度强化学习方法》的论文中,作者研究了股票交易问题并应用深度强化学习方法来解决这个具有挑战性的问题。
特别是,作者应用深度确定性策略梯度
(DDPG)来优化有效的股票交易策略。
该项目的目的是理解本文,复制其方法并进一步探索超出本文范围的股票交易问题。
我们将首先描述制定为马尔可夫决策过程模型的感兴趣的问题,然后讨论模型改进。
然后我们将讨论本文提出的方法,并将其与现有的替代方法进行对比。
我们将重点介绍
DDPG
及其替代方案,即我们在本文之外探讨的近端策略优化
(PPO)
。
接下来,我们将描述用于训练和测试的数据,并解释如何处理这些数据。
我们包括实现细节和代码执行说明。
我们总结了实验结果,方法评估和一些结束语。
以下是对后续讨论的概述。
概述
问题描述
在上述论文中,作者旨在开发一种高利润的股票交易策略。
假设有一个我们有兴趣投资的D股票池。
交易策略包括在每个时间步对每只D股票的买入、卖出和持有决策,以响应股票市场
评论0
最新资源