# 几种主流模型在商品金融短文本精细化分类上的表现
写在前面:这是一个存档。并且我承认这些模型都很古典/ww
运行环境:cuda:12 on RTX3090
## 1.数据集
这个项目并没有使用公共数据集,数据集的内容主要是微博上李佳琦带货的商品评价区的评价。
**下面是一些数据的示例**
| 文本 | 分类 | 情感 | 编号 |
| ------------------------------------------------------------ | ---------- | -------- | ---- |
| 李佳琦争气很好很优秀,衣服也更符合大家的眼光。 | 主播品质 | positive | 1 |
| 说什么比李佳琦好,李佳琦直播间时尚沙漠,李佳琦老头眼光。 | 选品 | positive | 2 |
| 人家都说了,李佳琦直播间没办法上网红店衣服,只能选质量好一点的舒服的。 | 服饰类质量 | positive | 3 |
| 李佳琦直播间的产品选品就这? | 选品 | negative | 4 |
| 咱好歹是钻粉5,买的东西也不少,太失望了,品控太差了 | 选品 | negative | 5 |
| 李佳琦直播间现在选品是真的有问题啊,以前生活品都闭眼买质量绝对没问题、现在真的是. | 选品 | negative | 6 |
| 他怎么能做到闭眼吹这个品好的?? | 主播信任度 | negative | 7 |
| 我之前真的是随便点进去就选几样现在这种信任渐渐崩塌了我已经开始害怕 | 主播信任度 | negative | 8 |
**下面目标类别**
| 类簇 | 类 |
| ------ | ------------------------------------------------------------ |
| 主播 | 主播专业度、主播信任度、主播支持度、主播语速、主播品质、主播责任感、主播话术、主播公益事业 |
| 价格 | 优惠、促销活动、福利、折扣、性价比、赠品、红包、满减活动、赠品、积分兑换 |
| 直播间 | 直播间氛围、直播间预告、直播设备、直播间画质 |
| 物流 | 快递、发货、包装 |
| 售后 | 服务态度、客服、退款、退货 |
| 选品 | 美妆类质量、日用品质量、生活用品质量、母婴品质量、电器质量、食品质量、饮品质量、服饰类质量、饰品质量、家具质量 |
| 系统 | 系统定价、系统问题、链接数量 |
总体而言类别很多。同时还进行情感分类。
## 2.模型结构
### 2.1word2vec
如果有人想在本地再跑一遍我的代码的话(应该没有)除了需要配置一下cuda和那些python库还需要下面的预训练的word2vec
[GitHub - Embedding/Chinese-Word-Vectors: 100+ Chinese Word Vectors 上百种预训练中文词向量](https://github.com/Embedding/Chinese-Word-Vectors)
使用了他们提供的 微博专门 预训练word2vec模型(也就是[SGNS的weibo的Word + Character + Ngram](https://pan.baidu.com/s/1FHl_bQkYucvVk-j2KG4dxA))
### 2.2 模型结构
#### TextClassificationModel_CNN_MHA
| 参数 | 值 |
| ---------------- | ------------------------------- |
| 模型名称 | TextClassificationModel_CNN_MHA |
| 嵌入维度 | 300 |
| 卷积核大小 | 3 |
| 卷积层滤波器数量 | 64 |
| 注意力头数 | 8 |
| 输出情感类别数量 | 2 |
| 输出特征类别数量 | 10 |
| 使用预训练嵌入 | 是 |
该模型包括一个嵌入层、卷积层、多头自注意力层和多个全连接层,用于同时处理文本序列和特征序列。它具有多个输出,用于情感分类和特征分类。
#### TextClassificationModel_BiLSTM_CNN_MHA
| 参数 | 值 |
| ---------------- | -------------------------------------- |
| 模型名称 | TextClassificationModel_BiLSTM_CNN_MHA |
| 嵌入维度 | 300 |
| LSTM隐藏维度 | 128 |
| 卷积核大小 | 3 |
| 卷积层滤波器数量 | 64 |
| 注意力头数 | 8 |
| 输出情感类别数量 | 2 |
| 输出特征类别数量 | 10 |
| 使用预训练嵌入 | 是 |
该模型包括一个嵌入层、双向LSTM层、卷积层、多头自注意力层和多个全连接层,用于同时处理文本序列和特征序列。它具有多个输出,用于情感分类和特征分类。
#### TextClassificationModel_BiGRU
| 参数 | 值 |
| ---------------- | ----------------------------- |
| 模型名称 | TextClassificationModel_BiGRU |
| 嵌入维度 | 300 |
| GRU隐藏维度 | 32 |
| 注意力头数 | 8 |
| 输出情感类别数量 | 2 |
| 输出特征类别数量 | 10 |
| 使用预训练嵌入 | 是 |
该模型包括一个嵌入层、双向GRU层和多头自注意力层,用于同时处理文本序列和特征序列。它具有多个输出,用于情感分类和特征分类。
#### TextClassificationModel_BiLSTM_MHA
| 参数 | 值 |
| ---------------- | ---------------------------------- |
| 模型名称 | TextClassificationModel_BiLSTM_MHA |
| 嵌入维度 | 300 |
| LSTM隐藏维度 | 128 |
| 注意力头数 | 8 |
| 输出情感类别数量 | 2 |
| 输出特征类别数量 | 10 |
| 使用预训练嵌入 | 是 |
该模型包括一个嵌入层、双向LSTM层、多头自注意力层和多个全连接层,用于同时处理文本序列和特征序列。它具有多个输出,用于情感分类和特征分类。
#### TextClassificationModel_GRU_MHA
| 参数 | 值 |
| ---------------- | ------------------------------- |
| 模型名称 | TextClassificationModel_GRU_MHA |
| 嵌入维度 | 300 |
| GRU隐藏维度 | 128 |
| 注意力头数 | 8 |
| 输出情感类别数量 | 2 |
| 输出特征类别数量 | 10 |
| 使用预训练嵌入 | 是 |
该模型包括一个嵌入层、GRU层、多头自注意力层和多个全连接层,用于同时处理文本序列和特征序列。它具有多个输出,用于情感分类和特征分类。
#### TextClassificationModel_BiGRU_MHA
| 参数 | 值 |
| ---------------- | --------------------------------- |
| 模型名称 | TextClassificationModel_BiGRU_MHA |
| 嵌入维度 | 300 |
| GRU隐藏维度 | 128 |
| 注意力头数 | 8 |
| 输出情感类别数量 | 2 |
| 输出特征类别数量
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip 【资源说明】 1、该资源内项目代码都是经过测试运行成功,功能正常的情况下才上传的,请放心下载使用。 2、适用人群:主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用,具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习,也可作为大作业、课程设计、毕设项目、初期项目立项演示等,欢迎下载,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于多种主流文本深度学习模型进行中文商品金融文本的精细化分类+情感分类(可用于对商品评价进行量化分析).zip (24个子文件)
projectcode30312
main.py 7KB
slurm-788571.out 30KB
dataset.py 2KB
model.py 11KB
datasets
processed_data.csv 880KB
sources
Figure_4.png 82KB
Figure_2.png 76KB
Figure_5.png 78KB
Figure_6.png 80KB
Figure_3.png 73KB
Figure_1.png 85KB
best_models
best_modelTextClassificationModel_BiGRU.pt 14.61MB
best_modelTextClassificationModel_CNN_MHA.pt 14.78MB
best_modelTextClassificationModel_GRU_MHA.pt 15.33MB
best_modelTextClassificationModel_BiLSTM_CNN_MHA.pt 16.34MB
best_modelTextClassificationModel_BiGRU_MHA.pt 16.77MB
best_modelTextClassificationModel_BiLSTM_MHA.pt 17.19MB
model_outputs
TextClassificationModel_BiGRU_MHA.txt 291KB
TextClassificationModel_GRU_MHA.txt 292KB
TextClassificationModel_BiGRU.txt 291KB
TextClassificationModel_BiLSTM_CNN_MHA.txt 292KB
TextClassificationModel_BiLSTM_MHA.txt 291KB
TextClassificationModel_CNN_MHA.txt 291KB
README.md 10KB
共 24 条
- 1
资源评论
龙年行大运
- 粉丝: 1006
- 资源: 3852
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功