# 基于机器学习的商品评论情感分析
[![FOSSA Status](https://app.fossa.com/api/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview.svg?type=shield)](https://app.fossa.com/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview?ref=badge_shield)
## 从淘宝爬取评论
使用Selenium模拟真实登录行为,并爬取数据。
## 数据清理
如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。
## 分词
使用jieba精确模式进行分词,构造词典
## 将词汇向量化
创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引
## 分类模型对比
SVM vs LSTM
## License
[![FOSSA Status](https://app.fossa.com/api/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview.svg?type=large)](https://app.fossa.com/projects/git%2Bgithub.com%2FvirgoC0der%2FSentimentAnalysisOfProductReview?ref=badge_large)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
数据收集与处理: 收集商品评论数据,可以从电商平台、社交媒体、论坛等渠道获取。 对评论数据进行清洗和预处理,包括去除特殊字符、标点符号,转换为小写字母,去除停用词,进行词干提取或词形归并等操作。 特征工程: 将文本数据转换为可供机器学习算法使用的特征表示形式。常用的特征提取方法包括词袋模型(Bag of Words)、TF-IDF(词频-逆文档频率)、词嵌入(Word Embeddings)等。 建立模型: 选择合适的机器学习算法或深度学习模型进行情感分析。常用的机器学习算法包括朴素贝叶斯、支持向量机、逻辑回归、随机森林等;深度学习模型包括循环神经网络(RNN)、长短时记忆网络(LSTM)、卷积神经网络(CNN)等。 在选择模型时,需要考虑数据规模、特征维度、训练时间和模型性能等因素。 模型训练与调优: 使用标记好情感的评论数据集对模型进行训练,并通过交叉验证等技术来调整模型参数,以提高模型的性能和泛化能力。 可以尝试不同的特征表示方法、模型结构和超参数来优化模型性能。 模型评估: 使用独立的测试数据集对训练好的模型进行评估,通常使用准确率、精确率、召回率、F1 分数等指标来
资源推荐
资源详情
资源评论
收起资源包目录
SYS.zip (42个子文件)
kwan0203
svm_model
model.pkl 7.35MB
w2v_model.pkl 8.58MB
lstm
draw.py 2KB
lstm_test.py 3KB
train_lstm.py 6KB
draw_plot.py 1KB
comment_text.model 7.07MB
data
pos.xls 2.12MB
neg.csv 2.49MB
test_set.csv 58KB
neutral.csv 2.12MB
neg.xls 1.76MB
pos.csv 3.39MB
res_comment.csv 14KB
.idea
vcs.xml 180B
misc.xml 288B
demo.jpg 161KB
inspectionProfiles
profiles_settings.xml 174B
graduation_project.iml 317B
modules.xml 288B
.gitignore 38B
demo.jpg 161KB
review_treatment
review_pretreatment.py 2KB
chromedriver 13.77MB
GUI
main_page.py 2KB
model
lstm_three.h5 4.18MB
lstm.yml 3KB
Word2vec_model.pkl 18.94MB
lstm_new.h5 3.3MB
review_crawler
review.csv 879KB
restaurant_crawler.py 2KB
crawler.py 2KB
test
model_test.py 1KB
svm
data
test_vecs.npy 3.22MB
y_test.npy 33KB
train_vecs.npy 12.88MB
y_train.npy 132KB
train_svm.py 4KB
draw_plot.py 413B
train_cut.csv 395KB
comment_text.vector 7.17MB
README.md 986B
共 42 条
- 1
资源评论
荒野大飞
- 粉丝: 9418
- 资源: 426
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功