# 2022年手游市场满意度调研
本项目基于国内最大的移动手机游戏论坛TapTap,爬取手游用户评论,使用多种方法分析2022年手游市场的满意度。
## 目录
- [一、快速开始](#一快速开始)
- [二、项目结构](#二项目结构)
- [三、数据集说明](#三数据集说明)
- [四、模型选择](#四模型选择)
- [五、实验结果](#五实验结果)
- [六、版权声明](#六版权声明)
## 一、快速开始
1. 克隆项目到本地
```
git clone https://github.com/anglee2002/SentimentAnalysis.git
```
2. 配置python环境并安装相关依赖(建议使用conda环境)
```
# 在项目根目录下执行:
# 创建conda环境,并指定python版本为3.8及以上
conda create -n sentimentanalysis python=3.8
# 激活环境
conda activate sentimentanalysis
# 安装依赖
pip install -r requirements.txt
```
3. 运行程序
```
请更改src目录下的python程序中的数据集路径,然后在项目根目录下执行:
python src/*/*.py
```
4. 附加说明
```
1. 本实验设备为MacBook Pro 2020(m1 Apple silicon),系统为macOS Ventura 13.2 (22D49)。
由于硬件兼容问题,没有测试Windows系统,但理论上可以运行。
2. 本实验的tensorflow为ARM版本,由于tensorflow的原因,可能会出现一些警告,但是不影响运行。
3. 本实验的bert模型为中文版,由于模型文件过大,没有上传,请自行下载。
4. 若运行出现问题,请在issue中提出。
```
## 二、项目结构
```
Sentiment Analysis
├── LICENSE //开源许可
├── README.md //README文档
├── requirements.txt //依赖说明
├── dataset //数据集
│ └── taptap_review //TapTap评论数据集
└── src //源代码
└── sentiment_dictionary //情感字典
└── sentiment_dictionary.py //情感字典python程序
└── 情感极性词典
└── 中文停用词.txt
└── 否定词.txt
└── 程度副词.txt
└── BosonNLP //boson情感词典
└── BosonNLP_sentiment_score.txt
└── license.txt
└── README.txt
└── 词典来源说明.txt
└── machine_learning //机器学习
└── svm.py //支持向量机
└── naive_bayes.py //朴素贝叶斯
└── adaboost.py //集成学习
└── deep_learning //深度学习
└── bi_lstm.py //Bi-LSTM模型
└── attention_lstm.py //LSTM模型+Attention机制
└── transfer Learning //迁移学习
└── finetune_bert.py //bert模型微调
```
## 三、数据集说明
本次实验数据集来自[PP飞桨公开数据集](https://aistudio.baidu.com/aistudio/datasetdetail/183272)。
数据集包含手游网站 TapTap 上约 300 款游戏的标签评论,共4888个数据示例。
该数据集以csv格式存储,每一行含有`review`和`sentiment`两个参数,其中`review`为用户的评论文本,`sentiment`的值为 1 和 0
> 用户评论低于 3星(最多5星)被视为 0(不满意),其他为 1(满意)。两个类别的比例大致为 1:1
```
【数据集结构】
taptap_review # 4888条数据,按照7:3划分训练集和测试集
├── train.csv #3422条数据
└── test.csv #1466条数据
【数据注释】
review:评论文本
sentiment:0代表不满意,1代表满意
```
## 四、模型选择
1.基于情感词典的情感极性分析
(1)基于BosonNLP的情感分析
2.基于机器学习的情感极性分析
(1)Svm #支持向量机
(2)Naive_bayes #朴素贝叶斯
(3)Adaboost #集成学习
3.基于深度学习的情感极性分析
(1)Bi-LSTM模型
(2)LSTM模型+Attention机制
4.基于迁移学习的情感极性分析
(1)bert模型微调
## 五、实验结果
![](https://raw.githubusercontent.com/anglee2002/Picbed/main/screenshot2023-06-30%2003.32.35.png)
## 六、版权声明
BosonNLP情感词典由[玻森数据](https://bosonnlp.com/)授权使用。
Bert模型版权由[谷歌公司](https://www.google.com/)所有。
其他部分根据[MIT License](LICENSE)开源。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源内项目代码都是经过测试运行成功,功能正常的情况下才上传的,请放心下载使用。 2、适用人群:主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用,具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习,也可作为大作业、课程设计、毕设项目、初期项目立项演示等,欢迎下载,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于Taptap评价数据集分析手游用户对中国移动游戏产业的满意程度(源码+项目说明).zip (26个子文件)
code_30312
src
deep_learning
attention_lstm.py 3KB
bi_lstm.py 2KB
sentiment_dictionary
情感极性词典
程度副词.txt 2KB
词典来源说明.txt 331B
否定词.txt 482B
BosonNLP
license.txt 2KB
BosonNLP_sentiment_score.txt 2.41MB
readme.txt 805B
中文停用词.txt 5KB
sentiment_dictionary.py 6KB
machine_learning
svm.py 1KB
adaboost.py 1KB
naive_bayes.py 1KB
transfer_learning
finetune_bert.py 4KB
dataset
taptap_review.csv 3.6MB
.idea
SentimentAnalysis.iml 322B
other.xml 186B
vcs.xml 167B
misc.xml 190B
inspectionProfiles
Project_Default.xml 2KB
profiles_settings.xml 174B
modules.xml 286B
.gitignore 105B
encodings.xml 446B
requirements.txt 1KB
README.md 4KB
共 26 条
- 1
资源评论
龙年行大运
- 粉丝: 1003
- 资源: 3854
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 抽取地下水对加州约塞米蒂国家公园山地湿地复合体可持续性的影响
- C++vector介绍及详细使用示例(源代码)
- java基于GUI的简单记事本
- 指纹识别-基于OpenCV实现的指纹识别算法-附项目源码.zip
- 206693250008_R01C02_Grn.idat
- 瞳孔跟踪-基于OpenCV+网络摄像头的瞳孔跟踪算法实现-附项目源码+流程教程-优质项目分享.zip
- ModStartCMS v8.4.0 框架稳定性持续迭代,修复部分已知问题
- bleder 教室学校学生教育室办公室考试
- 人脸检测-使用OpenCV实现的动漫+漫画人脸检测算法-附项目源码-优质项目实战.zip
- 道路贴图,材质材料免费
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功