# 项目说明:
百度2021年语言与智能技术竞赛机器阅读理解Pytorch版baseline
比赛链接:https://aistudio.baidu.com/aistudio/competition/detail/66?isFromLuge=true
> 官方的baseline版本是基于paddlepaddle框架的,我把它改写成了Pytorch框架,其中大部分代码沿用的是官方提供的代码,只是有一些框架部分进行了修改,另外增加了早停策略/对抗训练等优化措施,习惯用Pytorch版本的可以基于此进行优化.
# 环境
- python=3.6
- torch=1.7
- transformers=4.5.0
# 训练示例
训练
```
python run.py
--max_len=256
--model_name_or_path=下载的预训练模型路径
--per_gpu_train_batch_size=7
--per_gpu_eval_batch_size=40
--learning_rate=1e-5
--linear_learning_rate=1e-4
--num_train_epochs=100
--output_dir="./output"
--weight_decay=0.01
--early_stop=2
```
预测
```
python predict.py
--max_len=400
--model_name_or_path=下载的预训练模型路径
--per_gpu_eval_batch_size=120
--output_dir="./output"
--fine_tunning_model=微调后的模型路径
```
# 实验结果
用的baseline模型是base版MacBERT(具体请看https://github.com/ymcui/MacBERT)
![image-20210410231128986](https://raw.githubusercontent.com/zhoujx4/PicGo/main/img/image-20210410231128986.png)
# 后续优化策略
- 数据清洗,据官方工作人员讲解到,训练集的准确率只能确保92%以上
- 更多的数据
- 更细粒度的数据增强
- 模型结构的优化
百度2021年语言与智能技术竞赛机器阅读理解torch版baseline.zip
需积分: 5 35 浏览量
2024-01-15
16:46:15
上传
评论
收藏 17.3MB ZIP 举报
普通的一个普通猿
- 粉丝: 1465
- 资源: 1761
最新资源
- 蒋拖车-2402041820.awb
- 网络安全-木马隐藏技术-实验分析-教学与研究-木马隐藏技术深度解析与实验分析:核心技术剖析与VMware网络模式指南.zip
- 水墨风格PPT模板:优雅设计,适合艺术与文化演示、 艺术与设计PPT模
- 蓝桥杯介绍例题相关练习.zip
- 基于JavaScript、Vue、HTML、CSS和Shell的无偿献血系统接口api设计源码
- 基于Vue实现的你画我猜网页版小游戏源代码
- java+vue+uinapp彩票系统多端多商家应用源码分享
- tensorflow-2.9.2-cp38-cp38-win-amd64.whl
- tensorflow-gpu-2.9.3-cp39-cp39-win-amd64.whl
- tensorflow-gpu-2.9.3-cp37-cp37m-win-amd64.whl
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈