篇章级事件抽取
篇章级事件抽取任务采用DuEE-fin数据集,包含13个事件类型的1.17万个篇章。数据集分为以下5个部分:
事件类型约束:共定义了13个事件类型及其对应的92个论元角色类别。
训练集:约7000个篇章,包含其中对应的事件类型、论元及其角色,用于竞赛模型训练。
验证集:约1200个篇章,包含其中对应的事件类型、论元及其角色,用于竞赛模型训练和参数调试。
测试集:约3500个篇章,不包含篇章对应的事件类型、论元及其角色。该数据用于作为最终的系统效果评估。
注:另外为了防止针对测试集的调试,数据中将会额外加入混淆数据。