# BERT文本分类
#### 数据集
[aclImdb](http://ai.stanford.edu/~amaas/data/sentiment/)
#### 词向量
使用glove预训练的embedding进行初始化
# 模型图
<div align=center><img src="https://github.com/renhongjie/NLP_process/blob/main/images/bert.png"/></div>
<p align="center">图1</p>
### bert使用的bert-base-uncased
#### 准确率
可以在测试集上达到准确率92.8%+(未调参数,bert!nb!随便允许一下就92%+)
#### 注意事项
代码需要修改数据集路径和词向量路径
(数据集和pytorch_model.bin未提供,请自行下载)
### 项目结构描述
```
├── README.md // 描述文件
├── main.py // 主函数文件/运行文件
├── data_process.py // 数据处理函数集合
├── model // 后续打算写其他bert分类模型
│ ├── bert_line.py // bert+全连接,最基本的bert分类模型
├── train.py // 训练函数
├── bert-base-uncased // bert三件套
│ ├── config.json // bert的配置文件
│ ├── vocab.txt // bert的词表
│ ├── pytorch_model.bin // bert的预训练模型
└── utils.py //工具函数集合
```
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
NLP_nlp练手小项目之BERT分类.zip (9个子文件)
NLP_nlp练手小项目之BERT分类
utils.py 2KB
main.py 2KB
bert-base-uncased
config.json 361B
vocab.txt 226KB
ceshi.py 2KB
models
bert_line.py 866B
train.py 3KB
README.md 1KB
data_process.py 3KB
共 9 条
- 1
资源评论
__AtYou__
- 粉丝: 1523
- 资源: 389
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功