RuBQ:俄罗斯知识库问答和机器阅读理解数据集
在2020年5,我们提出RuBQ的第一个版本(发音['魔方]) -茹ssian知识乙酶Q uestions,一个KBQA数据集包括1500点与他们的英语翻译机沿着复杂程度不同,相应的SPARQL查询俄罗斯的问题,答案,以及Wikidata的子集,其中包含带有俄罗斯标签的实体。 据我们所知,这是第一个俄语KBQA和语义解析数据集。 该数据集被认为是跨语言传输,少量学习或使用合成数据场景进行学习时的开发和测试集。
2020年12月,我们构建了RuBQ的第二个版本。 数据集扩展基于通过搜索引擎查询建议服务获得的问题。 数据集的大小增加了一倍: RuBQ 2.0包含2,910个问题以及答案和SPARQL查询。 我们还使用机器阅读理解功能扩展了数据集:RuBQ 2.0结合了Wikipedia中大多数问题的带有答案的段落。 因此,该数据集现在不仅适用
评论0
最新资源