# 基于机器学习的商品评论情感分析
[![FOSSA Status](https://app.fossa.com/api/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview.svg?type=shield)](https://app.fossa.com/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview?ref=badge_shield)
## 从淘宝爬取评论
使用Selenium模拟真实登录行为,并爬取数据。
## 数据清理
如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。
## 分词
使用jieba精确模式进行分词,构造词典
## 将词汇向量化
创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引
## 分类模型对比
SVM vs LSTM
## License
[![FOSSA Status](https://app.fossa.com/api/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview.svg?type=large)](https://app.fossa.com/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview?ref=badge_large)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
特征提取:将评论文本转换为机器学习模型可以处理的数值特征。常用的特征提取方法包括词袋模型(Bag of Words)、TF-IDF(词频-逆文档频率)、词嵌入(Word Embeddings)等。这些特征表示了评论中的词汇频率、重要性等信息。 模型训练:选择合适的机器学习模型进行训练,常用的包括朴素贝叶斯(Naive Bayes)、支持向量机(Support Vector Machine)、逻辑回归(Logistic Regression)、决策树(Decision Tree)、随机森林(Random Forest)等。训练过程中使用标记好情感的评论数据来调整模型参数,使其能够准确地预测评论的情感倾向。 模型评估:使用独立的测试数据集对训练好的模型进行评估,常用的评估指标包括准确率、精确率、召回率、F1 分数等。这些指标可以帮助评估模型的性能和泛化能力。 模型应用:将训练好的模型部署到实际应用中,用于分析新的商品评论。通过模型预测评论的情感倾向,可以为企业提供及时的反馈和决策支持,比如调整产品设计、改进营销策略、 提高客户满意度等。
资源推荐
资源详情
资源评论
收起资源包目录
SYS.zip (43个子文件)
kwan0203
svm_model
model.pkl 7.35MB
w2v_model.pkl 8.58MB
lstm
draw.py 2KB
lstm_test.py 3KB
train_lstm.py 6KB
draw_plot.py 1KB
comment_text.model 7.07MB
data
pos.xls 2.12MB
neg.csv 2.49MB
test_set.csv 58KB
neutral.csv 2.12MB
neg.xls 1.76MB
pos.csv 3.39MB
res_comment.csv 14KB
.idea
vcs.xml 180B
misc.xml 288B
demo.jpg 161KB
inspectionProfiles
profiles_settings.xml 174B
graduation_project.iml 317B
modules.xml 288B
.gitignore 38B
demo.jpg 161KB
review_treatment
review_pretreatment.py 2KB
chromedriver 13.77MB
GUI
main_page.py 2KB
demo.jpg 161KB
model
lstm_three.h5 4.18MB
lstm.yml 3KB
Word2vec_model.pkl 18.94MB
lstm_new.h5 3.3MB
review_crawler
review.csv 879KB
restaurant_crawler.py 2KB
crawler.py 2KB
test
model_test.py 1KB
svm
data
test_vecs.npy 3.22MB
y_test.npy 33KB
train_vecs.npy 12.88MB
y_train.npy 132KB
train_svm.py 4KB
draw_plot.py 413B
train_cut.csv 395KB
comment_text.vector 7.17MB
README.md 986B
共 43 条
- 1
资源评论
荒野大飞
- 粉丝: 9418
- 资源: 426
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功