# README
## 项目简介
文本情感分析又称意见挖掘, 是对包含用户观点、 喜好、 情感等主观性文本进行挖掘、 分析及判别它是一个多学科交叉的研究领域, 涉及概率论、 数据统计分析、 计算机语言学、 自然语言处理、 机器学习、 信息检索、 本体学 ( Ontology) 等多个学科及其相关技术 。
目前, 情感分类大致涌现出两种研究思路:基于情感知识和基于特征。前者主要是基于已有的情感词典或情感知识库 对文本中带有情感或极性的词( 或词语单元) 进行加权求和,而后者主要是对文本提取具有类别表征意义的 特征, 再基于这些特征使用机器学习算法进行分类。
本项目运用情感词典与机器学习两种方法分别进行文本情感分析,并提供结果对比。
## 项目构建方法
### 环境准备
- Windows/MacOS/Linux
- Python3.6
- PyCharm or other IDEs
### 获取项目
- get the code from gitlab/github
> git clone git@github.com:Charon0622/Software-Engineering-Course-Design.git
### 导入项目
Open the file named"Chinese-emotion-anlysis" with IDE
## 项目运行方法
### 本地运行
```
cd [project folder]
python3 manager.py runserver [port]
```
### 直接访问
[http://115.28.245.233:8080](http://115.28.245.233:8080)
## 项目基本功能
机器学习方法的接口,接受一个中文文本, 可得到一个正向情感极性的概率和负向情感
的概率。
基于情感词典的方法的接口, 输入一段中文文本, 可得到文本的情感极性分值 。
可对 篇章级、段落级、句子级 的中文文本进行情感极性判断。
基于情感词典的方法的接口,可以使用不同的情感词典对中文文本进行情感分析。
基于机器学习的方法的接口,可以导入一个训练好的模型来对中文文本进行情感分析。
分析算法以及修复程序中的bug。
## 代码结构说明
> Chinese_Emotion_Anakysis
>
> > settings.py web的总配置文件
> >
> > url.py web的路由配置
>
> Emotion_Manager
>
> > CEA_LIB NLP分析库
> >
> > > pkl_data 处理之后的数据
> > >
> > > raw_data 未处理之前的数据
> > >
> > > chinese_emotion_analysis.py NLP方法的接口
> > >
> > > classifier.pkl 训练好的分类器模型
> >
> > Modules 词典方法分析库
> >
> > > res字典存放处
> > >
> > > main.py 接口
> >
> > migrations 数据连接层
> >
> > static 静态资源文件
> >
> > templates 网页模板
> >
> > models.py 模型构建
> >
> > views.py web逻辑
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
文本情感分析又称意见挖掘, 是对包含用户观点、 喜好、 情感等主观性文本进行挖掘、 分析及判别它是一个多学科交叉的研究领域, 涉及概率论、 数据统计分析、 计算机语言学、 自然语言处理、 机器学习、 信息检索、 本体学 ( Ontology) 等多个学科及其相关技术 。 目前, 情感分类大致涌现出两种研究思路:基于情感知识和基于特征。前者主要是基于已有的情感词典或情感知识库 对文本中带有情感或极性的词( 或词语单元) 进行加权求和,而后者主要是对文本提取具有类别表征意义的 特征, 再基于这些特征使用机器学习算法进行分类。 本项目运用情感词典与机器学习两种方法分别进行文本情感分析,并提供结果对比。
资源推荐
资源详情
资源评论
收起资源包目录
基于词典方法和机基于器学习方法的中文情感倾向分析系统.zip (2000个子文件)
bootstrap.min.css 114KB
animate.min.css 45KB
font-awesome.min.css 23KB
templatemo-style.css 11KB
default.css 6KB
情感词汇本体库说明文档.doc 54KB
index.html 11KB
jquery.js 91KB
jquery-2.1.1.min.js 82KB
bootstrap.min.js 35KB
underscore-min.js 16KB
typed.js 14KB
wow.min.js 7KB
jquery.progress.js 4KB
jquery.singlePageNav.min.js 2KB
custom.js 2KB
Detailed Design.md 31KB
Requirement Specification.md 21KB
High-Level Design.md 19KB
README.md 3KB
README.md 3KB
readme.md 399B
README.md 100B
highlevel_design.pdf 1.48MB
High-Level Design.pdf 1.47MB
Detailed Design.pdf 1.03MB
Requirement Specification.pdf 852KB
README.pdf 70KB
main.py 21KB
extract_word_pair.py 7KB
use_dalianligong_dic.py 6KB
load_dic.py 4KB
settings.py 3KB
read_file.py 3KB
process_text.py 2KB
chinese_emotion_analysis.py 1KB
views.py 1KB
urls.py 1KB
transcode.py 660B
manage.py 556B
wsgi.py 425B
apps.py 104B
admin.py 63B
tests.py 60B
models.py 57B
__init__.py 0B
__init__.py 0B
__init__.py 0B
SenDic.txt 1.43MB
ignored_word.txt 945KB
neg_all.txt 457KB
extreme.txt 422KB
pos_all.txt 324KB
wrongScore.txt 168KB
NTUSD_negative_simplified.txt 79KB
ntusd-negative.txt 79KB
tsinghua.positive.gb.txt 41KB
pos_comment.txt 35KB
tsinghua.negative.gb.txt 34KB
neg_sentiment.txt 30KB
ntusd-positive.txt 26KB
NTUSD_positive_simplified.txt 26KB
正面评价词语(中文)1.txt 19KB
正面评价词语(中文)2.txt 17KB
neg_comment.txt 12KB
neg.2358.txt 8KB
neg.2356.txt 8KB
pos_sentiment.txt 7KB
neg.1434.txt 6KB
neg.1432.txt 6KB
neg.2358.txt 6KB
neg.2356.txt 6KB
pos.6012.txt 4KB
neg.1841.txt 4KB
neg.1851.txt 4KB
neg.1434.txt 4KB
neg.1432.txt 4KB
neg.1434.txt 4KB
neg.1432.txt 4KB
pos.5424.txt 4KB
pos.5418.txt 4KB
neg.2838.txt 4KB
neg.1548.txt 3KB
neg.1547.txt 3KB
neg.1252.txt 3KB
pos.4508.txt 3KB
neg.670.txt 3KB
neg.670.txt 3KB
neg.670.txt 3KB
pos.719.txt 3KB
pos.709.txt 3KB
pos.719.txt 3KB
pos.709.txt 3KB
neg.2210.txt 3KB
neg.2280.txt 3KB
neg.2992.txt 3KB
neg.2986.txt 3KB
neg.1506.txt 3KB
pos.2949.txt 3KB
pos.6250.txt 3KB
共 2000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20
资源评论
Python极客之家
- 粉丝: 6465
- 资源: 80
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功