# Tutorial for Chinese Sentiment analysis with hotel review data
The repo contains the trainig data located in the data folder and a jupyter notebook for the tutorial.
You may also read my [write up](https://www.dlology.com/blog/tutorial-chinese-sentiment-analysis-with-hotel-review-data/) including the key difference compared to processing english data and final results.
## Dependencies
Python 3.5, numpy, pickle, keras, tensorflow, [jieba](https://github.com/fxsjy/jieba)
### Optional Dependencies for plotting
pylab, scipy
### How to Run
Run the python notebook by cd into the directory in command line then run
```
jupyter notebook
```
choose this in the browser
**chinese_sentiment_analysis.ipynb**
Enjoy, leave a comment in my [blog](https://www.dlology.com/blog/tutorial-chinese-sentiment-analysis-with-hotel-review-data/) if you have any question.
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
数据收集和准备:首先需要收集酒店评论的数据集。可以通过网络爬虫获取网站上的评论数据,或使用公开可用的数据集。然后,对数据进行预处理,包括文本清洗、分词、去除停用词等。常用的Python库有NLTK(Natural Language Toolkit)和spaCy,可用于文本处理和预处理。 特征提取:将文本数据转换成适合机器学习算法处理的向量表示。常用的方法是使用词袋模型(Bag of Words)或TF-IDF(Term Frequency-Inverse Document Frequency)向量化文本数据。这些方法可以通过Python库如scikit-learn实现。 模型训练:选择合适的机器学习算法或深度学习模型进行情感分类。常用的机器学习算法包括朴素贝叶斯、支持向量机(SVM)和随机森林等。常用的深度学习模型包括循环神经网络(RNN)、长短时记忆网络(LSTM)和卷积神经网络(CNN)。在Python中,可以使用TensorFlow、Keras、scikit-learn等库来训练和构建这些模型。 模型评估和优化:使用评估指标(如准确率、精确率、召回率、F1分数)评估模型的性
资源推荐
资源详情
资源评论
收起资源包目录
基于Python的酒店评论情感分析源码+使用说明文档(毕业设计).zip (2000个子文件)
README.md 864B
zh_wiki.py 140KB
langconv.py 8KB
chinese_stop_words.txt 15KB
pos.719.txt 2KB
pos.709.txt 2KB
pos.554.txt 2KB
pos.545.txt 2KB
pos.318.txt 2KB
pos.2125.txt 2KB
pos.2351.txt 2KB
pos.1749.txt 2KB
pos.195.txt 1KB
pos.2683.txt 1KB
pos.2134.txt 1KB
pos.888.txt 1KB
pos.1767.txt 1KB
pos.721.txt 1KB
pos.716.txt 1KB
pos.706.txt 1KB
pos.723.txt 1KB
pos.713.txt 1KB
pos.2501.txt 1KB
pos.1087.txt 1KB
pos.2707.txt 1KB
pos.782.txt 1KB
pos.2562.txt 1KB
pos.1953.txt 1KB
pos.894.txt 1KB
pos.886.txt 1KB
pos.981.txt 1019B
pos.1053.txt 995B
pos.1318.txt 993B
pos.1891.txt 986B
pos.1884.txt 986B
pos.1847.txt 961B
pos.1422.txt 959B
pos.893.txt 945B
pos.885.txt 945B
pos.1770.txt 942B
pos.1004.txt 937B
pos.1807.txt 913B
pos.672.txt 909B
pos.1716.txt 905B
pos.280.txt 900B
pos.319.txt 880B
pos.841.txt 863B
pos.930.txt 850B
pos.2514.txt 850B
pos.1934.txt 832B
pos.1056.txt 828B
pos.108.txt 807B
pos.1994.txt 788B
pos.1513.txt 743B
pos.390.txt 741B
pos.315.txt 739B
pos.1367.txt 733B
pos.884.txt 732B
pos.813.txt 723B
pos.1578.txt 721B
pos.2575.txt 713B
pos.2571.txt 708B
pos.669.txt 699B
pos.1577.txt 697B
pos.900.txt 693B
pos.720.txt 691B
pos.2074.txt 691B
pos.1471.txt 687B
pos.2792.txt 674B
pos.2015.txt 671B
pos.2732.txt 666B
pos.2388.txt 665B
pos.2480.txt 655B
pos.15.txt 654B
pos.1689.txt 652B
pos.90.txt 649B
pos.2081.txt 644B
pos.2088.txt 644B
pos.627.txt 624B
pos.530.txt 620B
pos.102.txt 620B
pos.521.txt 620B
pos.1948.txt 620B
pos.2048.txt 617B
pos.161.txt 617B
pos.166.txt 617B
pos.2041.txt 617B
pos.528.txt 613B
pos.519.txt 613B
pos.2712.txt 612B
pos.2017.txt 611B
pos.51.txt 607B
pos.2801.txt 605B
pos.895.txt 594B
pos.668.txt 593B
pos.673.txt 592B
pos.2382.txt 591B
pos.1576.txt 591B
pos.1123.txt 590B
pos.1130.txt 590B
共 2000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20
资源评论
荒野大飞
- 粉丝: 9418
- 资源: 426
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Screenshot_2024-05-28-11-40-58-177_com.tencent.mm.jpg
- 基于Dart的Flutter小提琴调音器APP设计源码 - violinhelper
- 基于JavaScript和CSS的随寻订购网页设计源码 - web-order
- 基于MATLAB的声纹识别系统设计源码 - VoiceprintRecognition
- 基于Java的微服务插件集合设计源码 - wsy-plugins
- 基于Vue和微信小程序的监理日志系统设计源码 - supervisionLog
- 基于Java和LCN分布式事务框架的设计源码 - tx-lcn
- 基于Java和JavaScript的茶叶评级管理系统设计源码 - tea
- IMG_5680.JPG
- IMG_0437.jpg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功