毕业设计(论文)基本内容和要求:
微博作为迅速崛起的新兴社会媒体,在网络舆情领域日益引起研究者
的关注。面对互联网上海量的数据信息,我们无法想象仅仅通过人工的
方式来对互联网舆情进行全面监控的难度。因此,结合网络信息采集技
术和文本信息自动处理等技术研发一个网络舆情自动监控系统将有利于
社会管理者们及时了解网络舆情的状态和趋势,因而可以对发现的热点
舆情及时进行干预,引导疏通民众情绪和心理,避免矛盾的进一步恶化
而造成更大的社会损失。现有舆情监测系统在采集、检索和分析模块中
都是采用基于统计和特征关键词的方法,由于忽略了文本中的语义信息
往往会导致分析结果的不精确。本毕业设计主要针对当前微博中用户身
份定位、热点信息挖掘以及负面信息的发现与及时处理等机制进行设计
与实现,主要分为数据采集、数据挖掘分析和结果呈现三个部分。主要
的工作分工如下:
1. 数据采集(微博爬虫程序)功能的实现,抓取微博文本信息。