强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为 输入、通过学习选择能达到其目标的最优动作
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
- 1
- 2
- 3
前往页