【免费】基于BERT的多模型融合的事件主体抽取模型1_融合BERT和其他模型进行关系抽取资源-CSDN文库

需积分: 0 156 浏览量更新于2022-08-04 收藏 330KB PDF 举报

【事件主体抽取】是自然语言处理中的一个重要任务，它的目的是从文本中提取出特定事件的主体，例如在金融领域，可能需要找出涉及交易违规、投诉维权等事件的公司或机构。这项任务对于构建知识图谱、自动问答和信息检索等应用至关重要。在【基于BERT的多模型融合的事件主体抽取模型】中，研究团队采用了【模型融合】策略来提高模型性能。他们遵循“从简单到复杂”的设计理念，构建了一系列学习器，每个学习器基于【编码-解码】架构，其中编码器用于理解文本信息，解码器则用于生成事件主体的预测。他们使用BERT模型作为基础，加上一层【self-attention】，形成BERT+FC模型。随后，为了进一步增强模型的表达能力，他们在原有的基础上添加了两个1维卷积层，并利用【残差连接】防止过拟合，构建了BERT+Cov.+self-attention+FC模型。【BERT】全称为Bidirectional Encoder Representations from Transformers，是一种预训练语言模型，它通过在大规模无标注文本上学习通用的语义表示，然后在特定任务上进行微调，能有效捕捉上下文信息。【自我注意力（Self-Attention）】机制允许模型在不同位置的单词之间建立联系，增强了模型对全局信息的理解。而【1维卷积层】则可以捕获局部特征，与self-attention结合，有助于模型对复杂事件模式的识别。【模型融合】是将多个独立或者相关但不完全相同的模型的预测结果进行综合，通常基于【集成学习】理论。这种策略能有效提高系统的稳定性和泛化能力，尤其当单一模型的预测能力有限时，通过集成多个模型的预测，可以得到更准确的结果。在文中，简单模型和复杂模型的融合提升了事件主体抽取的F1值，表明这种方法在金融领域的事件主体抽取任务中取得了良好的效果。这个研究展示了如何利用深度学习和预训练模型（如BERT）来解决特定领域的事件主体抽取问题，通过设计和融合不同的模型，实现了性能的提升。这种方法不仅对于金融领域，也对于其他领域有潜在的应用价值，特别是在需要理解和抽取复杂文本信息的场景中。

CCKS 2019

面向金融领域的事件主体抽取比赛

task4:

基于

BERT

的多模型融合的事件主体抽取模型

李振

, 刘恒

, 赵兴莹

, 李毓瑞

, 秦培歌

民生科技有限责任公司，北京 101300，中国

lizhen, liuheng, zhaoxingying, liyurui, qinpeige@mskj.com

摘要

. 本文报告了本团队在CCKS 2019面向金融领域的事件主体抽取任务

的提交。本文遵循从简单到复杂的思想设计多个学习器，并基于集成学习

的思想将多个学习器进行融合，其中每个学习器采用编码-解码的思路进

行设计。最终，模型在A榜最高成绩达到0.92620，排名第11位，在B榜最

高成绩达到0.82816，排名第17位。

Keywords: 模型融合,编码-解码, BERT

引言

事件抽取是从描述事件信息的文本中抽取出用户感兴趣的事件信息并以结构化

的形式呈现出来。它不仅是构建知识图谱的关键任务，也是自然语言处理的难

点和热点问题之一，在自动文摘、自动问答、信息检索等领域有着广泛的应

用。本文所研究的面向金融领域的事件主体抽取任务，是事件抽取任务中的限

定域事件抽取。任务的目标是从一段金融事件文本中抽取出发生特定事件类型

的主体，主体范围限定为：公司和机构，事件类型共有21种，包括交易违规、

投诉维权、涉嫌欺诈和财务造假等。

限定域事件抽取是在进行抽取之前，预先定义好目标事件的类型。限定域

事件抽取是信息抽取和知识图谱构建的重要环节之一，受到了学术界和产业界

的广泛关注，研究者针对该任务进行了大量的研究。目前，对于限定域事件抽

取主要有两种方法：基于模式匹配的方法和基于机器学习的方法。基于模式匹

配的方法是在一些模式的指导下进行某种类型的事件的识别和抽取。由于基于

模式匹配的方法依赖于文本的具体形式（语言、领域和文档格式等），且制定

的模式很难覆盖所有的事件类型，当语料发生变化时，需要重新获取模式，因

此基于机器学习的事件主体抽取成为主流方法。基于机器学习的事件抽取方法

中最具有代表性的是基于有监督学习的事件抽取，即将事件抽取建模成一个多

分类问题，提取特征向量后再使用有监督的分类器进行事件抽取。本文采用基

于有监督学习的方法从金融事件文本中抽取事件主体。

模型的整体设计思路是设计从简单到复杂的多个学习器，基于集成学习的

思想将多个学习器结合起来，从而获得更好的性能。首先，以BERT+FC作为基

准模型，添加一层self-attention作为编码器，构建BERT+self-attention+FC模型。

其次，在上述模型中添加两个1维卷积层，另外为了避免过拟合，增加了残差连

接，构建 BERT+Cov.+ self-attention+FC模型。通过对上述模型进行融合来得到

最终的模型，这样既避免了直接建模的复杂性，又能提升整体系统的性能。经

过模型的训练和调参，单模的F1值最高达到0.8949，进行模型融合之后，F1值

提升到了0.9262。

综上所述，本文的贡献总结如下：

本文采用从简单到复杂的思路设计多个模型，并进行融合以提升模型效

果；

本文采用编码-解码的设计思路来构建单个模型，从而使每个模型独立而结

构类似，可以很好的适应模型融合。

本文其余内容组织如下：第二章介绍方法描述，第三章展示实验结果，第

四章总结本文。

系统描述

2.1

设计思路

从简单到复杂设计整体系统。法国科学家笛卡尔从逻辑学、几何学和代数学中

发现的4条规则之一就是：思想必须从简单到复杂。这条规则不仅适用于以上学

科，也适用于本文的方法设计。因此，本文依循简单到复杂的原则来设计解决

事件主体抽取的方法。事件主体抽取的任务是非平凡的，面向金融领域的限定

域事件主体抽取亦然。根据奥卡姆剃刀原理，若能用简单的方式解决复杂的问

题，就没有必要去设计复杂的方案。

单个模型的设计思路是编码+解码。事件识别的复杂性在于对事件类型和事

件主体的判断。事件类型多种多样，相应的事件主体也各不相同。因此，本文

采用编码-解码的思路来设计深度学习模型，即由编码器自行学习复杂的规则，

由解码器解析学到的规则。

简单和复杂模型的融合。模型融合是解决复杂建模问题的有效方法，本文

采用集成学习的思路来融合简单和复杂的模型。集成方法来源于下述观察：如

果模型之间近似相互独立，则多个模型联合的性能要优于单个模型的。如果一

个分类器以55% 的概率可以给出正确的结果，这样的分类器只能说是中等水

平，但是如果拥有100 个这样的分类器，则大多数分类器的结果都正确的概率

可以上升到82%。通过集成学习的方式将简单和复杂的模型结果进行融合，可

以显著提升最终效果。

2.2

系统设计

Word2Vec和Glove等词向量模型的出现使预训练技术得到了一定的发展，但其

优势并不突出。直到BERT（Pre-training of Deep Bidirectional Transformers for

Language Understanding）出现，它进一步增强了词向量模型的泛化能力，充分

描述字符级、词级、句子级甚至句间关系特征，刷新了11项NLP任务的最优结

果。因此，本文在设计模型时均采用了BERT作为模型的最底层。

剩余7页未读，继续阅读

资源推荐

资源评论

东方捕

粉丝: 22
资源: 310

基于BERT的多模型融合的事件主体抽取模型1

pytorch实现基于BERT的中文新闻事件抽取项目源码.zip

CCKS2020-Entity-Linking:2020年CCKS

关于模型融合方法1

基于bert 的关系抽取

一种基于多信息融合的事件检测算法..pdf

实现了一下multi-head-selection联合关系实体抽取

基于BERT+Biaffine结构的关系抽取模型源码+文档说明.zip

基于BERT多层网络的医疗实体抽取模型研究.pdf

基于 Bert 的信息抽取(information extraction)，关系提取 (relation extraction)

基于BERT事件抽取构建活动知识图谱python源码+项目说明.zip

基于BERT模型的科技政策文本分类研究.pdf

基于多任务深度学习的实体和事件联合抽取模型.docx

CCKS2019金融领域篇章级事件主体抽取数据集.zip

基于BERT+Biaffine结构的关系抽取模型.zip

基于bert+BiLSTM+CRF的法律文书命名实体识别（python源码+项目说明）（进行交通肇事案的事件要素抽取）.zip

基于bert实现关系三元组抽取python源码+数据集+项目说明.zip

基于BERT嵌入BiLSTM_CRF模型的中文专业术语抽取研究_吴俊1

基于BERT的机器翻译模型开发详解.pdf

基于bert的文本情感分析

基于bert，cnn，lstm的联合神经网络进行三元组抽取

Python自然语言处理-BERT实战

Python实现基于BERT模型的中文文本情感分类项目源码+操作过程.zip文件

基于Bert+TextCNN模型的文本分类项目源码.zip

基于BERT阅读理解框架的司法要素抽取方法.docx

毕业设计-Python实现基于BERT模型的中文文本情感分类项目源码+操作过程.zip文件

基于pytorch+bert的中文事件抽取项目源码+全部数据（课程设计）.zip

基于BERT模型的增强混合神经网络的谣言检测.pdf

基于Bert+TextCNN模型的文本分类项目源码（下载即用）.zip

BERT模型实战1

最新资源