没有合适的资源?快使用搜索试试~ 我知道了~
deep-learning-Pre-training-Chinese-data-set:深度学习中文语料
共1个文件
md:1个
需积分: 9 1 下载量 17 浏览量
2021-04-16
10:30:37
上传
评论
收藏 2KB ZIP 举报
温馨提示
深度学习预训练中文数据集 国内公开的中文语料太少了,可以说是寥寥无几,大厂和机构缺少语料共享精神。 训练语料的缺失给学习研究深度网络模型从业者带来困扰,获取预训练语料带来额外成本。 这份语料可以降低训练模型的成本,让学习研究者只需要关注模型结构的研究,加速我国AI进展。 该项目为国内最大的公开深度网络模型预训练中文语料,该语料可以用来训练bert模型。 该语料由多个文本语料组成,大约22G。每个文本文件中每篇文章由\r\n分开,每篇文章中每段文本由\n分开。 数据均来源于网络,仅供研究学习使用,请勿做商业用途。 语料1: (访问密码:5129) 语料2: (访问密码:5129) 语料3: (访问密码:5129) 语料4: (访问密码:5129) 语料5: (访问密码:5129) 语料6: (访问密码:5129) 语料7: (访问密码:5129) 语料8: (访问密码:5129) 语料9:
资源推荐
资源详情
资源评论
收起资源包目录
deep-learning-Pre-training-Chinese-data-set-main.zip (1个子文件)
deep-learning-Pre-training-Chinese-data-set-main
README.md 9KB
共 1 条
- 1
资源评论
亲爱的薄荷绿
- 粉丝: 32
- 资源: 4663
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功