## 环境搭建
**如果本项目对你学习构建一个 文本分类模型 + 部署模型 有帮助, 欢迎 Start...**
在当前环境安装本项目使用的环境
`pip install -r ./requirements.txt `
我尝试将项目克隆下来之后安装了requirements里的包,发现始终缺少依赖.
所以我将重要的包版本罗列出来, 建议使用conda安装以下列表的依赖和对应的版本...
```
jieba==0.39
numpy==1.17.3
requests==2.22.0
keras==2.3.0
pandas==0.25.1
tqdm==4.31.0
tensorflow==1.14.0
```
## 快速开始测试
下载**wiki.zh.vec**至项目文件夹下 **./data/** [下载地址](https://fasttext.cc/docs/en/pretrained-vectors.html)
找到或者直接点击Chinese: bin+text, [text](https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.zh.vec)下载
```
python train.py # 运行train.py文件进行训练demo数据
```
## 训练自定义数据集
#### 1. 准备你的数据集**csv格式 由 , 分隔**如下:
一列为class用于存储每个类别的标签, 一列为data用于存储每条文本数据
![data_example](./example_pic/data_example.png)
| class | data |
| ------- | ------------- |
| phone | 苹果 |
| phone | 华为 |
| phone | 小米 |
| phone | 传音 |
| bank | 中国建设 银行 |
| bank | 中国 银行 |
| bank | 中国工商银行 |
| bank | 中国农业银行 |
| country | 中国 |
| country | 美国 |
| country | 俄罗斯 |
| country | 加拿大 |
#### 2. 修改config.py文件
1. train_data_path 为自定义数据的文件路径,也可覆盖demo数据.**默认为: "./data/train_data.csv"**
2. embedded_matrix_size 为嵌入矩阵大小, 根据词频保留的词数,用于构建嵌入矩阵.**默认为: 10240**
3. validation_ratio 为划分测试数据集占总数据集比例. **默认为: 0.2**
4. epochs 为整个数据集迭代次数. **默认为: 512**
5. batch_size 为优化模型每个批次的数据条数. **默认为: 2 注意:当前2为特殊情况(因为测试数据集较小)一定记得修改**
6. learning_rate 为优化模型的学习速率. **默认为: 0.01**
7. learning_rate_decay 为学习速率每个epochs进行衰减的比率. **默认为: 0.95**
#### 3. 运行 train.py 文件对数据进行训练
1. 运行过程中会在`./save_model/save/`下生成`model.h5`模型文件,运行结束会生成`final_model.h5`
2. 运行过程中会在`./save_model/logs/`下生成并不断更新一个日志文件,在项目根目录执行 `tensorboard --logdir=save_model/logs`即可监控模型训练过程
3. 运行成功后会在`./save_model/deploy/`下生成`可用于服务器部署的 pb 格式文件`:
```
.
└── 0
├── saved_model.pb
└── variables
├── variables.data-00000-of-00001
└── variables.index
```
#### 4. 部署成功后使用 client.py 进行模型的使用
记得修改`class_dict = {0: "phone", 1: "bank", 2: "country"}`模型输出对应的值,即可得到对应的类别名称
程序员柳
- 粉丝: 8381
- 资源: 1469
最新资源
- springboot246老年一站式服务平台.zip
- springboot244基于SpringBoot和VUE技术的智慧生活商城系统设计与实现.zip
- 关键词:冷热电联供;CHP机组;热泵;冰储冷空调;需求响应 参考文献:《基于综合需求响应和奖惩阶梯型碳交易的综合能源系统优化调度》《计及需求响应和阶梯型碳交易机制的区域综合能源系统优化运行》碳交易机
- springboot248校园资产管理.zip
- springboot247人事管理系统.zip
- springboot249在线互动学习网站设计.zip
- 蒙特卡洛模拟电动汽车有序充放电(matlab),适合优化调度,微电网,综合能源、储能、新能源方向的基础入门学习
- springboot251基于springboot-vue的毕业论文管理系统.zip
- springboot252基于Springboot和vue的餐饮管理系统的设计与实现.zip
- springboot250智慧校园之家长子系统.zip
- springboot254小区团购管理.zip
- springboot253社区养老服务系统.zip
- springboot255基于spring boot的疫情信息管理系统.zip
- 半桥LLC谐振变器,Matlab simulink仿真,电压闭环PI pi控制,输出电压12V,实现软开关运行
- springboot259交通管理在线服务系统的开发.zip
- springboot256基于springboot+vue的游戏交易系统.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈