没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
18页
问答是一种从知识库(KB)获取信息的有效方法。 在本文中,我们提出了NS-CQA,这是一种仅使用少量训练样本即可用于复杂问题解答的数据有效强化学习框架。 我们的框架由神经生成器和符号执行器组成,它们分别将自然语言问题转换为一系列原始动作,并在知识库中执行它们以计算答案。 我们精心制定了一组原始的符号动作,这些动作不仅使我们可以简化神经网络设计,而且可以加快模型收敛。 为了减少搜索空间,我们在编码器-解码器体系结构中采用了复制和屏蔽机制来大大减少解码器输出的词汇量并提高模型的通用性。 我们为模型配备了存储高回报有前途程序的内存缓冲区。 此外,我们提出了一种自适应奖励函数。 通过将生成的试验与存储在内存缓冲区中的试验进行比较,我们得出了课程指导的奖励奖金,即接近性和新颖性。 为了缓解稀疏奖励问题,我们将自适应奖励和奖励奖金结合起来,将稀疏奖励重塑为密集的反馈。 另外,我们鼓励模型生成新的试验,以避免模仿假试验,同时使模型记住过去的高奖励试验,以提高数据效率。 我们的NS-CQA模型在两个数据集上进行了评估:CQA(一个最近的大型复杂问题回答数据集)和WebQuestionsSP(一个多跳问题回答数据集)。 在这两个数据集上,我们的模型都优于最新模型。 值得注意的是,在CQA上,NS-CQA在复杂性较高的问题上表现良好,而仅使用了总数约1%的训练样本。
资源推荐
资源评论
资源评论
weixin_38731239
- 粉丝: 5
- 资源: 895
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功