# 基于机器学习的商品评论情感分析
[![FOSSA Status](https://app.fossa.com/api/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview.svg?type=shield)](https://app.fossa.com/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview?ref=badge_shield)
## 从淘宝爬取评论
使用Selenium模拟真实登录行为,并爬取数据。
## 数据清理
如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。
## 分词
使用jieba精确模式进行分词,构造词典
## 将词汇向量化
创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引
## 分类模型对比
SVM vs LSTM
## License
[![FOSSA Status](https://app.fossa.com/api/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview.svg?type=large)](https://app.fossa.com/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview?ref=badge_large)
没有合适的资源?快使用搜索试试~ 我知道了~
基于机器学习的商品评论情感分析
共43个文件
py:14个
csv:7个
npy:4个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 13 浏览量
2024-05-08
09:14:32
上传
评论
收藏 66.66MB ZIP 举报
温馨提示
基于机器学习的商品评论情感分析是一种利用机器学习算法对商品评论进行情感倾向判断的技术。这种技术可以帮助电商平台、消费者和商家更好地理解商品评价,从而做出更明智的购买和销售决策。 在基于机器学习的商品评论情感分析中,主要涉及以下几个步骤: 数据收集与预处理:收集大量的商品评论数据,并进行必要的预处理,如去除无关信息、分词、去除停用词等。预处理后的数据将作为机器学习模型的输入。 特征提取:从预处理后的文本中提取出能够代表情感倾向的特征。这些特征可以是基于词汇的(如词频、TF-IDF等),也可以是基于句法的(如词性标注、依存关系等),还可以是基于语义的(如词向量、主题模型等)。 机器学习模型选择与训练:选择合适的机器学习模型进行训练。常用的情感分析模型包括朴素贝叶斯、支持向量机(SVM)、深度学习模型(如循环神经网络RNN、长短期记忆网络LSTM、卷积神经网络CNN等)。使用带有情感标签的训练数据来训练模型,使模型能够学习到文本特征与情感标签之间的映射关系。 模型评估与优化:使用测试集来评估模型的性能,常用的评估指标包括准确率、召回率、F1值等。根据评估结果来调整模型参数或尝试不同的模型
资源推荐
资源详情
资源评论
收起资源包目录
基于机器学习的商品评论情感分析.zip (43个子文件)
content
svm_model
model.pkl 7.35MB
w2v_model.pkl 8.58MB
lstm
__init__.py 0B
draw.py 2KB
lstm_test.py 3KB
train_lstm.py 6KB
draw_plot.py 1KB
comment_text.model 7.07MB
data
pos.xls 2.12MB
neg.csv 2.49MB
test_set.csv 58KB
neutral.csv 2.12MB
neg.xls 1.76MB
pos.csv 3.39MB
res_comment.csv 14KB
.idea
vcs.xml 180B
misc.xml 288B
inspectionProfiles
profiles_settings.xml 174B
graduation_project.iml 317B
modules.xml 288B
.gitignore 38B
review_treatment
__init__.py 0B
review_pretreatment.py 2KB
chromedriver 13.77MB
GUI
main_page.py 2KB
model
lstm_three.h5 4.18MB
lstm.yml 3KB
Word2vec_model.pkl 18.94MB
lstm_new.h5 3.3MB
review_crawler
review.csv 879KB
restaurant_crawler.py 2KB
crawler.py 2KB
test
__init__.py 0B
model_test.py 1KB
svm
data
test_vecs.npy 3.22MB
y_test.npy 33KB
train_vecs.npy 12.88MB
y_train.npy 132KB
train_svm.py 4KB
draw_plot.py 413B
train_cut.csv 395KB
comment_text.vector 7.17MB
README.md 986B
共 43 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3924
- 资源: 7441
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 该模型采用龙贝格观测器进行无传感器控制 其利用 PMSM 数学模型构造观测器模型,根据输出的偏差反馈信号来修正状态变量 当观测的电流实现与实际电流跟随时, 可以从观测的反电势计算得到电机的转子位置信
- ccceeeeee,ukytkyk/liyihm
- 考虑新能源消纳的火电机组深度调峰策略 摘要:本代码主要做的是考虑新能源消纳的火电机组深度调峰策略,以常规调峰、不投油深度调峰、投油深度调峰三个阶段,建立了火电机组深度调峰成本模型,并以风电全额消纳为前
- PROGPPCNEXUS读写烧录刷写软件 飞思卡尔MPC55xx 56xx 57xx 58xx 没有次数限制
- 含光伏的储能选址定容模型 14节点 程序采用改进粒子群算法,对分析14节点配网系统中的储能选址定容方案,并得到储能的出力情况,有相关参考资料 这段程序是一个粒子群算法(Particle Swarm O
- P6ProfessionalSetup R24.12 安装包
- SQLServer2012数据库配置及网络连接设置WORD文档doc格式最新版本
- 中大型三相异步电机电磁设计软件
- DSP28335 PMSM电机控制程序
- 四足机器人技术发展及其应用场景概述
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功