强化学习(Reinforcement Learning,RL)灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~