没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
资源说明 【1】资源属于对应项目写的论文,写作规范、逻辑紧密、用语专业严谨,内容丰富饱满,可读性强,很适合对该领域的初学者、工程师、在校师生、毕业生等下载使用。 【2】论文适合学习借鉴参考,为您的类似项目开发或写作提供专业知识介绍及思路。 【3】资源非项目源码,如需项目源码,请私信沟通,不Free。 【4】可用于毕业设计、课程设计,切记完全照抄! 【5】鼓励大家下载后仔细研读,多看、多思考!搞懂里面的知识点及实验内容。欢迎交流学习!
资源推荐
资源详情
资源评论
— 71 —
基于机器学习的微博评论情感分析
摘 要:微博是现下热门的短文本社交软件之一,笔者以疫情相关的微博内容评论作为研究切入点,将机器学习运
用在情感分析构建分类器的过程中,对比不同条件下分类器的准确率,得出在特征维度为 2 500 时,运用结巴分词和多
项式朴素贝叶斯方法的组合构建分类器,分类效果最优,对舆情检测与控制提供了参考意义。
关键词: 文本情感分析;机器学习;朴素贝叶斯;支持向量机;逻辑回归
Emotional Analysis of Weibo Comments Based on Machine Learning
Abstract: Weibo is
one
of
the essay
our pay
now
popular
software,
based
on
the
epidemic
situation
of related weibo
content
comments as a
research
starting point,
applying machine
learning
in
sentiment analysis in the process of constructing classifier,
compared
the
accuracy in
classifier
under different
conditions, it is
concluded
that
when
the characteristic
dimension for
2 500, using
the
stuttering
participle and polynomial naive bayesian method
is a combination of
constructing
classifier, the
optimal
classification
effect, provides reference to
inspect
and
control
the
public opinion.
Key words: text
emotion
analysis;
machine learning;
naive bayes;
support
vector machine; logistic
regression
0 引言
近年来,社交媒体全面渗透到广大人民群众的生活中,
微博作为当下发展态势良好、用户基础庞大的网络媒体之一,
用户可以自主发表时事新闻、人生感受、生活趣事等内容,
其他用户可进行评论。曹林指出微博传播信息时围观氛围浓
厚,是段子化的传播,有字数限制所以语言必须精炼,用户
评论时带有浓烈的情绪色彩,清晰直观地表达自己对某事件
的好恶
[1]
。在这样的平台上挖掘出的文本,有字数限制且情
感分明,更适合进行情感分析。
1 情感分析与机器学习研究现状
文本情感分析(Text
Sentiment
Analysis)较为简单地被
定义为是对一个或多个用户对实体产生的偏向积极或消极态
度、看法、评价等的分析、归纳的过程。情感分类是情感分
析中最常见也是研究最广泛的一个课题,假设可以简单地将
评论或意见分为两个相反情感中的一个,即消极或积极二者
之一
[2]
。文本情感分析可依据处理的文本类型,分为新闻评
论和产品评论,为了更好地进行舆情监控,本文采集的是新
闻评论数据集。
自然语言处理的技术已经有了质的飞跃,目前已经有很
多前沿技术可以用来进行文本的情感分析,Medhat 等对情感
分析的技术做了较为全面的分析和总结,分为情感词典方法
与机器学习方法。情感词典方法依赖于情感词典,是一个已
经标注好各词性的集合。机器学习方法从不同角度而言,与
情感分析是相辅相成的状态
[3]
。
2 机器学习相关理论
2.1 支持向量机
支持向量机( Support
Vector
Machine)在机器学习中的
地位举足轻重,是一种监督式的分类学习算法。Vapnik 等在
1922 年首次提出相关理论
[4]
,发展时间距今已超过 30 多年,
在很多研究上应用广泛,理论上而言,SVM 可以解决任何一
种二分类问题。
2.2 朴素贝叶斯
朴素贝叶斯整体思想基于概率模型,首先于 1960 年被
Maron 和 Kuhns 提出
[5 ]
。贝叶斯分类方法通过计算给定样本
在每种类型上的后验概率,将样本与最大后验概率对应的类
资源评论
Scikit-learn
- 粉丝: 4280
- 资源: 1868
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功