# Sentiment-Analysis
基于英文文本通过机器学习算法(LR、Random Forest、GBDT)和深度学习算法(BiLSTM)预测情感标签
### 项目介绍
(1) 数据集isear.txt来自于国外社会学和心理学的问卷调查结果,主要由英文文本短句和七类情感标签组成。
(2) 对数据进行初步的预处理,包括去除停用词和特殊符号。将英文文本转化为结构化数据,分别用到tf-idf编码和GloVe词向量两种方式。
(3) 将英文文本短句转化为tf-idf矩阵后,用逻辑回归(最大熵模型)、随机森林和提升树等算法进行多分类预测。
(4) 通过GloVe词向量将英文文本短句转化为分布式表示后,用双向LSTM网络进行多分类预测(嵌入层+BiLSTM层+Dropout层+全连接层)。
(5) 通过precision、recall、F1-Score等性能指标评价训练的机器学习和深度学习模型在测试集上的效果。
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
毕设&课程作业_基于英文文本通过机器学习算法(LR、Random Forest、GBDT)和深度学习算法(LSTM)预测情感标签.zip (9个子文件)
Graduation Design
data
y_train 144KB
y_test 62KB
isear.txt 1.65MB
x_train 616KB
x_test 264KB
help 258B
README.md 917B
code
emotion detector.ipynb 91KB
help 1B
共 9 条
- 1
资源评论
学术菜鸟小晨
- 粉丝: 1w+
- 资源: 5001
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功