learning-from-human-preferences:复制了OpenAI和DeepMind的“从人类偏好中进行深度强化...

preview
共107个文件
py:32个
gpu-0:12个
eu-c7-012-01:6个
需积分: 27 2 下载量 148 浏览量 2021-05-02 19:28:10 上传 评论 收藏 148.12MB ZIP 举报