没有合适的资源?快使用搜索试试~ 我知道了~
1前言社交网络在维基百科的定义是“由许多节点构成的一种社会结构。节点通常是指个人或组织,而社交网络代表着各种社会关系。”在互联网诞生前,社交网络分析是社会学和人
资源详情
资源评论
资源推荐
社交网络分析综述报告
摘 要 社交网络是社会个体成员之间通过社会关系结成的网络体系。个体也
称为节点,可以是组织、个人、网络 ID 等不同含义的实体或虚拟个体;而个
体间的相互关系可以是亲友、动作行为、收发消息等多种关系。而社交网络分
析、是指基于信息学、数学、社会学、管理学、心理学等多学科的融合理论和
方法,为理解人类各种社交关系的形成、行为特点分析以及信息传播的规律提
供的一种可计算的分析方法。本文将从社交网络的结构特性与演化机理、社交
网络群体行为形成与互动规律、社交网络信息传播与演化机理、社交网络分析
的应用这 4 个方面,较为详细的阐述社交网络的各个领域研究方向。第一部分
社交网络的结构特性与演化机理主要描述了社交网络的结构分析与建模、虚拟
社区及其发现技术、虚拟社区演化分析;第二部分社交网络群体行为形成与互
动规律主要描述了用户行为分析、社交网络情感分析、个体影响力分析、群体
聚集及影响机制分析;第三部分社交网络信息传播与演化机理主要描述了在线
社交网络信息检索、社交网络信息传播规律、话题发现与演化、影响力最大
化;第四部分社交网络分析的应用主要描述了用户画像、舆情分析、社交推
荐、可是化、语言检测、隐私保护。
关键词 社交网络; 情感分析; 信息检索; 社交推荐
Abstract Social networks are network systems formed by social relationships among
individual members of society. An individual is also called a node, and can be an entity
or a virtual individual with different meanings such as an organization, an individual,
or a network ID; and the mutual relationship between the individuals can be a
relationship between friends and relatives, action behaviors, and sending and receiving
messages. Social network analysis refers to multi-disciplinary fusion theories and
methods based on informatics, mathematics, sociology, management, psychology, etc.,
which provide for understanding the formation of human social relationships, the
analysis of behavior characteristics, and the law of information dissemination. A
computable analytical method. This paper will elaborate on the research directions of
various fields of social networks from four aspects: the structural characteristics and
evolution mechanism of social networks, the formation and interaction rules of social
network group behavior, the mechanism of social network information dissemination
and evolution, and the application of social network analysis. The first part of the social
network's structural characteristics and evolution mechanism mainly describes the
social network structure analysis and modeling, virtual community and its discovery
technology, virtual community evolution analysis; the second part of the social network
group behavior formation and interaction law mainly describes the user behavior
Analysis, social network sentiment analysis, individual influence analysis, group
aggregation and impact mechanism analysis. The third part of social network
information dissemination and evolution mechanism mainly describes online social
network information retrieval, social network information dissemination law, topic
discovery and evolution, impact Maximization of power; The fourth part of the
application of social network analysis mainly describes user portraits, public opinion
analysis, social recommendation, customization, language detection, privacy protection.
Key words Social network;emotion analysis;Information retrieval;Social reco-
mmendation
章节分工 钱云冲负责第一章内容,范德宝负责第二章内容,蔡静轩负责第三章
内容,陈凌负责第四章内容。
1 前言
社交网络在维基百科的定义是“由许多节点构成的一种社会结构。节点通常
是指个人或组织,而社交网络代表着各种社会关系。”在互联网诞生前,社交网
络分析是社会学和人类学重要的研究分支。早期的社交网络的主要指通过合作关
系建立起来的职业网络,如科研合作网络、演员合作网络等。
本文所指的社交网络分析专指在线社交网络分析(Online Social Network
Analysis),该门科学的发展是随着在线社交服务(Social Network Service, SNS)
的出现而诞生。在线社交服务的种类大致可分为四种:即时消息类应用(QQ、
微信、WhatsApp 、Skype 等),在线社交类应用(QQ 空间、人人网、Facebook、
Google+ 等),微博类应用(新浪微博、腾讯微博、Twitter 等),共享空间类
应用(论坛、博客、视频分享、评价分享等)。
在线社交网络(下文统称社交网络)有着迅捷性、蔓延性、平等性与自组织
性等四大特点。正因为这些特性,其在互联网出现的短短数十年内已经拥有数十
亿用户并对现实社会的方方面面产生着影响。在 2016 年的美国总统大选中,当
选总统特朗普就很好地利用了推特作为宣传工具;而在国内,从魏则西事件到和
颐酒店事---件再到最近的“刺死辱母者”事件,无一不是在社交网络上迅速发酵,
并最终对现实社会产生影响。而且这种线上影响线下的趋势越来越明显。
除了社交网络给社会和经济带来许多正面影响之外,也带来了不少负面影响。
从 Facebook 和 YouTube 上的暴力恐怖信息传播到微博微信上大量谣言和假新
闻,这些有害信息借助社交网络的特点迅速传播并且往往产生不可控的后果。
为了利用好社交网络的特性,产生价值,消除危害,所以产生了社交网络分
析这门科学。它是一种基于信息学、数学、社会学、管理学和心理学等科学的交
叉科学。根据社交网络的特性,其主要研究三大内容:结构与演化,群体与互动,
信息与传播。
2 社交网络的结构特性与演化机理
2.1 社交网络结构分析与建模
2.1.1 统计特性
社交网络模型许多概念来自于图论,因为社交网络模型本质上是一个由节点
(人)和边(社交关系)组成的图。而图模型中有一些非常重要的和社交网络息
息相关的概念,例如度数、网络密度等,可以用来具体细节的刻画社交网络的数
学特性。
1)度(Degree)
节点的度定义为与该节点相连的边的数目。在有向图中,所有指向某节点的
边的数量叫作该节点的入度,所有从该节点出发指向别的节点的边的数量叫作该
节点的出度。网络平均度反应了网络的疏密程度,而通过度分布则可以刻画不同
节点的重要性。
2)网络密度(Density)
网络密度可以用于刻画节点间相互连边的密集程度,定义为网络中实际存在
边数与可容纳边数上限的比值,常用来测量社交网络中社交关系的密集程度及演
化趋势。
3)聚类系数(Clustering Coefficient)
用于描述网络中与同一节点相连的节点间也互为相邻节点的程度。其用于刻
画社交网络中一个人朋友们之间也互相是朋友的概率,反应了社交网络中的聚集
性。
4)介数(Betweeness)
为图中某节点承载整个图所有最短路径的数量,通常用来评价节点的重要程
度,比如在连接不同社群之间的中介节点的介数相对于其他节点来说会非常大,
也体现了其在社交网络信息传递中的重要程度。
2.1.2 网络特性
社交网络的网络特性主要有以下 2 点——小世界现象与无标度特性。
1)小世界现象
小世界现象是指地理位置相距遥远的人可能具有较短的社会关系间隔。早在
1967 年,哈佛大学心理学教授 Stanley Milgram 通过一个信件投递实验,归纳并
提出了“六度分割理论(Six Degrees of Separation)”, 即任意两个都可通过平均五
个人熟人相关联起来。1998 年,Duncan Watts 和 Steven Strogatz 在《自然》杂
志上发表了里程碑式的文章《Collective Dynamics of “Small-World” Networks》,
该文章正式提出了小世界网络的概念并建立了小世界模型。
小世界现象在在线社交网络中得到了很好地验证,根据 2011 年 Facebook
数据分析小组的报告, Facebook 约 7.2 亿用户中任意两个用户间的平均路径长
度仅为 4.74,而这一指标在推特中为 4.67。可以说,在五步之内,任何两个网络
上的个体都可以互相连接。米尔格伦实验、凯文贝肯游戏、埃尔德什数以及一些
类似的实验证明了,在现实世界里的一些网络中,尽管节点数量庞大,但从一点
出发,其实只需要经过仅仅几步转折,就能到达任一个节点。1998 年,美国康
奈尔大学的博士生邓肯·瓦茨(Duncan Watts)和他的导师斯蒂文·斯特罗加茨
(Steven Strogatz)发表了一篇名为《小世界网络的集体动力学》(Collective
dynamics of the 'Small World' networks)的论文。他们把这种现象归类为某一类复
杂网络的特性。他们注意到复杂网络可以按两个独立的结构特性分类,就是集聚
系数和节点间的平均路径长度。
平均路径长度也称为特征路径长度或平均最短路径长度,指的是一个网络中
两点之间最短路径长度(或称距离)的平均值。从一个节点 s
j
出发,经过与它相
连的节点,逐步“走”到另一个节点 s
j
所经过的路途,称为两点间的路径。其中最
短的路径也称为两点间的距离,记作 dist(i, j)。而平均路径长度定义为:
集聚系数(也称群聚系数、集群系数)是用来描述图或网络中的顶点(节点)
之间结集成团的程度的系数。具体来说,是一个点的邻接点之间相互连接的程度。
2)无标度特性
大多数真实的大规模社交网络都存在着大多数节点有少量边,少数节点有大
量边的特点,其网络缺乏一个统一的衡量尺度而呈现出异质性,我们将这种节点
度分布不存在有限衡量分布范围的性质称为无标度。无标度网络表现出来的度分
布特征为幂律分布,这就是此类网络的无标度特性。
剩余38页未读,继续阅读
莉雯Liwen
- 粉丝: 22
- 资源: 306
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0