# kg-baseline-pytorch
2019百度的关系抽取比赛,使用Pytorch实现LSTM模型在dev集可达到F1=74.7%,联合关系抽取(Joint Relation Extraction).
如果用BERT,RoBERT或Ernie,分数会更高。
## 步骤
1.语料预处理
preprocess.py
2.训练2个模型
bash train.sh wzk # 请自行理解脚本,并根据自己情况修改
## 模型
先用一个模型识别subject,再用另一个模型识别object,relation
## 数据
用同样的模型支持2019和2020年的百度的关系抽取比赛;
由于2者的语料存在一定差异,在预处理阶段(preprocess.py的process_spo函数中)会根据corpus_folder选择不同的预处理方式。
## 结果
在2020年的百度的关系抽取比赛的测试语料上,5个epoch后F1即高于73%,最高能到74.68%。
## 环境
Python 3.5+ python3.5~3.7版本下亲测可用,其他版本不清楚
Pytorch 1.3+ Pyorch1.x应该都可以
tqdm
both cpu or gpu is ok!
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
基于Pytorch的端到端信息抽取,语料为百度竞赛的数据集。.zip (9个子文件)
information-extraction-pytorch-master
preprocess.py 2KB
curLine_file.py 337B
main.py 13KB
LICENSE 11KB
model.py 6KB
requirements.txt 23B
train.sh 1KB
.gitignore 2KB
README.md 955B
共 9 条
- 1
资源评论
天天501
- 粉丝: 591
- 资源: 4666
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功