# bert-chinese-classifier
本项目包含大约20000条新闻的训练和测试集。
训练生成fine-tuning模型后即可运行`test.py`进行单句分类测试,也可以运行`server.py`启动flask服务器测试。
预训练模型:https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip
## JupyterNotebook使用
找到`前面的全部一梭子运行`这一个cell,运行前面的全部cell。
然后下面的cell依次运行即可。
## 开始训练
```bash
python train.py
```
## 测试
```bash
python test.py
```
## 测试服务器
```bash
python server.py
```
请求方式为:`http://127.0.0.1:8000?text=现在值得购买的中端手机,都有着出色的配置,性能强劲`
## config文件配置
* model_name:模型名称
* epochs:迭代epoch的数量
* checkpoint_every:间隔多少步保存一次模型
* eval_every:间隔多少步验证一次模型
* learning_rate:学习速率,推荐2e-5, 5e-5, 1e-4
* sequence_length:序列长度,单GPU时不要超过128
* batch_size:单GPU时不要超过32
* num_classes:文本分类的类别数量,若是二分类设置为1
* warmup_rate:训练时的预热比例,建议0.05, 0.1
* output_path:输出文件夹,用来存储label_to_index等文件
* bert_model_path:预训练模型文件夹路径
* train_data:训练数据路径
* eval_data:验证数据路径
* ckpt_model_path:checkpoint模型文件保存路径
abments
- 粉丝: 2198
- 资源: 3098
最新资源
- 帐篷铝座弯管设备(sw20可编辑+工程图)全套技术资料100%好用.zip
- Comsol 模拟 仿真 模型 热-流-固四场耦合增透瓦斯抽采,包括动态渗透率、孔隙率变化模型,涉及pde模块等四个物理场
- 中央空调管道清洁机器人sw10可编辑全套技术资料100%好用.zip
- 重力牵引式供料机sw18可编辑全套技术资料100%好用.zip
- 锥形螺母垫片压合机sw20可编辑全套技术资料100%好用.zip
- C++开发的智能电表读数程序,可用485和计算机读取电量并存
- 自动喷码机sw18可编辑全套技术资料100%好用.zip
- SSA-CNN-SVM分类,基于麻雀算法(SSA)优化卷积神经网络(CNN)-支持向量机(SVM)的数据分类预测 SSA优化参数为:学习率,批量处理大小,正则化参数 1、运行环境要求MATLAB版本
- 基于spring boot的二手交易平台.zip
- 基于spring boot的的小区物业管理系统.zip
- az500-3.pdf
- 基于spring boot的毕业生信息招聘平台.zip
- 基于spring boot的旧物置换网站.zip
- 基于spring boot的旅游管理系统.zip
- UPFC统一潮流控制器,基于matlabsimulink搭建,
- 基于spring boot的人职匹配推荐系统.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈