# 事件抽取模型(基于paddlehub)
本模型在官方PaddleHub版本上进行修改得到
官方原版地址:https://github.com/PaddlePaddle/Research/tree/master/KG/DuEE_baseline/DuEE-PaddleHub
本方案github地址:https://github.com/onewaymyway/DuEE_2020
本方案在官方baseline的基础上的改动
1.在网络结构上在CRF层前面增加了双向GRU层(代码见sequence_label.py中SequenceLabelTaskSP类)
2.将trigger预测结果拼接到text前面进行第二阶段的role预测(代码见data_process.py的data_process函数中model=role1的情况),这个改动可以解决同一个句子不同event之间role重叠的问题
3.在训练上,本方案先只用train进行训练,然后再将dev放入train进行最后的训练
4.增加了简单的最终结果剔除机制(代码见datachecker.py)
建议使用AIStudio环境跑这个项目,最好是直接Fork本人分享的项目,
项目地址:https://aistudio.baidu.com/aistudio/projectdetail/545914
### 环境准备
- python适用版本 2.7.x(本代码测试时使用依赖见 ./requirements.txt )
- paddlepaddle-gpu >= 1.7.0、paddlehub >= 1.6.1
- 请转至paddlepaddle官网按需求安装对应版本的paddlepaddle
#### 依赖安装
> pip install -r ./requirements.txt
### 模型训练
各个步骤在notebook文件里(project.ipynb)都有详细说明
按照notebook的顺序执行就可以了,这里就不详细说明了
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 2020语言与智能技术竞赛-事件抽取任务方案源码+学习说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
2020语言与智能技术竞赛-事件抽取任务方案源码+学习说明.zip (16个子文件)
code_20105
run_role1_gru_mix.sh 665B
nlputils.py 2KB
run_role1_gru.sh 645B
sequence_label.py 17KB
run_trigger_gru_predict.sh 709B
run_role1_gru_eval.sh 667B
requirements.txt 91B
fileutils.py 1KB
run_role1_gru_predict.sh 733B
run_trigger_gru_predict_withmodel.sh 733B
datachecker.py 10KB
run_trigger_gru.sh 691B
README.md 1KB
run_trigger_gru_mix.sh 713B
data_process.py 17KB
project.ipynb 24KB
共 16 条
- 1
资源评论
土豆片片
- 粉丝: 1516
- 资源: 5642
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功