# 广告广告
字节跳动广告系统下的穿山甲平台大量招人,有兴趣的直接发简历到我邮箱:xiongyijie.monkjay@bytedance.com。
也可以直接加我 QQ:2263509062
![ddd](https://user-gold-cdn.xitu.io/2020/6/9/17296d23354015c8?w=1202&h=655&f=png&s=811332)
# 基于LSTM的中文情绪识别
> 基于keras深度学习库,搭建LSTM网络,来对数据集进行情绪识别,分成六类情绪。
## 数据集
- 下载地址: https://biendata.com/ccf_tcci2018/datasets/emotion/
- 数据概览: 4万多条句子,分为其他(Null), 喜好(Like),悲伤(Sad),厌恶(Disgust),愤怒(Anger),高兴(Happiness)六类
- 数据来源:数据分别来源于NLPCC Emotion Classification Challenge(训练数据中17113条,测试数据中2242条)和微博数据筛选后人工标注(训练数据中23000条,测试数据中2500条)。
- 数据提供方: 清华大学计算机系黄民烈副教授
## 项目结构
```
|——data
| |——train.json 原数据集
| |——stopWords.txt 中文停用词
|——model
| |——my_model.h5 keras训练后保存的模型
| |——work_dict.pickle 经过预处理分词生成的词频字典
|——predict.py 使用训练好的模型进行预测
|——train.py 基于keras搭建LSTM网络进行训练
|——pretreatment.py 对数据集进行预处理以及分词,并生成字典保存
|——requirements.txt 项目所需依赖
```
## 情绪识别api
https://github.com/jie12366/sentiment_analysis_api
## 相关博客
[中文情绪识别api](http://jie12366.xyz:8081/#/users/11/articles/46)
[基于LSTM的中文多分类情感分析](http://jie12366.xyz:8081/#/users/11/articles/35)
没有合适的资源?快使用搜索试试~ 我知道了~
基于LSTM的中文情绪识别.zip
共12个文件
py:5个
txt:4个
gitignore:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 185 浏览量
2024-05-22
18:48:51
上传
评论
收藏 35.01MB ZIP 举报
温馨提示
基于LSTM的中文情绪识别LSTM (Long Short-Term Memory) 是一种特殊的循环神经网络(RNN)架构,用于处理具有长期依赖关系的序列数据。传统的RNN在处理长序列时往往会遇到梯度消失或梯度爆炸的问题,导致无法有效地捕捉长期依赖。LSTM通过引入门控机制(Gating Mechanism)和记忆单元(Memory Cell)来克服这些问题。 以下是LSTM的基本结构和主要组件: 记忆单元(Memory Cell):记忆单元是LSTM的核心,用于存储长期信息。它像一个传送带一样,在整个链上运行,只有一些小的线性交互。信息很容易地在其上保持不变。 输入门(Input Gate):输入门决定了哪些新的信息会被加入到记忆单元中。它由当前时刻的输入和上一时刻的隐藏状态共同决定。 遗忘门(Forget Gate):遗忘门决定了哪些信息会从记忆单元中被丢弃或遗忘。它也由当前时刻的输入和上一时刻的隐藏状态共同决定。 输出门(Output Gate):输出门决定了哪些信息会从记忆单元中输出到当前时刻的隐藏状态中。同样地,它也由当前时刻的输入和上一时刻的隐藏状态共同决定。 LSTM的计算过程可以大致描述为: 通过遗忘门决定从记忆单元中丢弃哪些信息。 通过输入门决定哪些新的信息会被加入到记忆单元中。 更新记忆单元的状态。 通过输出门决定哪些信息会从记忆单元中输出到当前时刻的隐藏状态中。 由于LSTM能够有效地处理长期依赖关系,它在许多序列建模任务中都取得了很好的效果,如语音识别、文本生成、机器翻译、时序预测等。
资源推荐
资源详情
资源评论
收起资源包目录
基于LSTM的中文情绪识别.zip (12个子文件)
content
data
train.json 3.31MB
weibo_train.txt 46.54MB
stopWords.txt 5KB
small_train.txt 5.83MB
sampling.py 438B
predict.py 2KB
requirements.txt 691B
pretreatment.py 2KB
.gitignore 17B
train.py 3KB
test.py 205B
README.md 2KB
共 12 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3828
- 资源: 5775
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功