# 项目说明:
百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分Pytorch版baseline
比赛链接:https://aistudio.baidu.com/aistudio/competition/detail/65?isFromLuge=true
> 官方的baseline版本是基于paddlepaddle框架的,我把它改写成了Pytorch框架,其中大部分代码沿用的是官方提供的代码(如评测代码、保存预测文件代码等)
>,只是对数据读取部分(感觉原代码这部分写得稍微复杂了一点,这里进行了简化)和框架部分进行了修改,习惯用Pytorch版本的可以基于此进行优化.
# 环境
- python=3.6
- torch=1.7
- transformers=4.5.0
# 训练示例
训练
```
python run.py
--max_len=150
--model_name_or_path=下载的预训练模型路径
--per_gpu_train_batch_size=200
--per_gpu_eval_batch_size=500
--learning_rate=1e-5
--linear_learning_rate=1e-2
--num_train_epochs=100
--output_dir="./output"
--weight_decay=0.01
--early_stop=2
```
预测
```
python predict.py
--max_len=150
--model_name_or_path=下载的预训练模型路径
--per_gpu_eval_batch_size=500
--output_dir="./output"
--fine_tunning_model=微调后的模型路径
```
# 实验结果
用的baseline模型是三层的roBERTa(具体请看https://github.com/ymcui/Chinese-BERT-wwm)
在官方提供的dev集上的表现如下:
![image-20210412144557325](https://raw.githubusercontent.com/zhoujx4/PicGo/main/img/image-20210412144557325.png)
# 后续优化策略
由于数据量比较充足,可以往模型架构进行优化,做关系抽取的有几种模型架构形式,最后进行集合一下应该能显著提供效果。
没有合适的资源?快使用搜索试试~ 我知道了~
百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip
共25个文件
py:8个
json:7个
xml:6个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 182 浏览量
2024-01-23
23:01:10
上传
评论
收藏 32.36MB ZIP 举报
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip 百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
百度2021年语言与智能技术竞赛多形态信息抽取赛道关系抽取部分torch版源码+项目说明.zip (25个子文件)
code_20105
re_official_evaluation.py 10KB
data
duie_train.json 82.88MB
duie_schema.json 4KB
duie_test1.json 11.1MB
duie_dev.json 10.05MB
predicate2id.json 971B
id2spo.json 2KB
predict.py 2KB
utils
utils.py 10KB
finetuning_argparse.py 2KB
adversarial.py 4KB
output
eval_predictions.json 10MB
dataset
dataset.py 7KB
.idea
DuIE.iml 411B
vcs.xml 180B
misc.xml 382B
inspectionProfiles
Project_Default.xml 266B
profiles_settings.xml 174B
modules.xml 260B
deployment.xml 483B
.gitignore 176B
run.py 9KB
models
model.py 866B
.gitignore 29B
README.md 2KB
共 25 条
- 1
资源评论
土豆片片
- 粉丝: 1518
- 资源: 5643
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功