强化学习: Q网络。 简介:在迷宫中漫步 这是尝试探索q网络的简单示例的尝试。 1.简介 该应用程序是一个简单的网格。 每个网格都跟踪其自身的状态和q值。 它不了解环境,边界和障碍。 它通过与环境的交互(奖励)来学习。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~