没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
















新智元报道
来源:DeepMind
作者:赵以文
【新智元导读】DeepMind与来自普林斯顿、NYU、达特茅斯学院、UCL和哈佛大学的研究人员合作,探索了人类行为中
的强化学习,为开发智能体强化学习提供了新的策略。研究人员具体探讨了一种存在于无模型和基于模型的学习算法之间
的方法,基于后继表示(successorrepresentation,SR),将长期状态预测存入缓存中。作者预计,这些发现将为计算
科学、电生理学和神经影像学研究开辟新的途径去研究评估机制的神经基础。相关论文《Thesuccessorrepresentation
inhumanreinforcementlearning》日前在Nature子刊《自然-人类行为》上发表。
2017-09-04 新智元
【DeepMind最新Nature论文】探索人类行为中的强化学习机制 https://mp.weixin.qq.com/s/zWo2iSiJBEBwnFF478xxfQ
第1页 共6页 2017/10/1 15:07
资源评论

- nickw2018-01-26非常好的文章,对于人工智能的学习有帮助。

qq_38277863
- 粉丝: 0
- 资源: 8
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制
