没有合适的资源?快使用搜索试试~ 我知道了~
基于聚类的网络舆情热点发现及分析1
需积分: 0 1 下载量 198 浏览量
2022-08-03
21:10:05
上传
评论
收藏 405KB PDF 举报
温馨提示
试读
6页
【摘要】根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTI CS算法获取网页热点
资源详情
资源评论
资源推荐
基于聚类的网
络舆情热点 发现及分析
王伟许鑫
(华东师范大学信息学系上海200241)
【摘要】根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的
特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从
而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量,
使网络舆情分析更为准确可靠。
【关键词】网络舆情热点发现舆情分析文本聚类
【分类号】G353.1
Online
Public
Opinion
Hotspot
Detection
and
Analysis
Based
on
Document
Clustering
Wang
Wei
Xu
Xin
(Department
of
Informatics,East
China
Normal
University,Shanghai
200241,China)
【Abstract】According
to
the
requirement
of
online
public
opinion
analysis,this
paper
builds
an
online
public
opinion
hotspot
detection
and
analysis
system
based
on
document
clustering.It
builds
vector
space
model
by
abstracting
document
features
from
sample
Web
pages,and
get
the
hot—spot
cluster
by
OPTICS
algorithm.According
the
vector
of
hot—spot
cluster,the
Web
pages
are
clustered
for
the
second
time.At
last,it
gets
the
time
evolution
mode
about
the
public
opinion
to
afford
decision
support
for
specific
field,and
improves
the
quality
of
page
correlation
and
analyze
the
public
opinion
more
accurately.
【Keywords】Online
public
opinion Hotspot
detection Public
opinion
analysis
Document
clustering
1
引
言
随着互联网的日益普及,中国互联网络信息中心(CNNIC)2008年6月发布《第22次中国互联网络发展状况
统计报告》数据显示:截至2008年6月底,中国网民数量达到2.53亿,网民规模跃居世界第一…。网络越来越成
为人们获取与发布信息的主要渠道,网络舆情信息的导向作用愈来愈大。网络信息庞杂多样,虽然对社会的发展
起了积极作用,但同时也产生了随之而来的信息内容安全问题,反动、淫秽、迷信等有害信息在网络中的传播,严
重危害了国家的安全和社会的稳定。另一方面,十六届四中全会做出的《中共中央关于加强党的执政能力建设的
决定》中提出,“建立舆情汇集和分析机制,畅通社情民意反映渠道”,反映了党对舆情研究重要性的认识。如何
在网络舆情信息采集的基础上进行舆情汇集,发现热点,并对关注热点加以跟踪分析,保障信息安全,引起了广泛
关注。
收稿日期:2009一Ol一12
收修改稿刚稠:2009一02一02
·本文系教育部人文社会科学研究项目“互联网舆情信息分析与管理机制研究”(项目编号:08JC870003)的研究成果之一。
国疆现代图书情报技术
万方数据
滕扬Lance
- 粉丝: 20
- 资源: 304
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0