图是复杂系统中常用的信息载体,可以表示现实中许多复杂关系,如社交网
络
[1]
、犯罪网络
[2]
、交通网络
[3]
等。图结构作为一种非欧几里德数据,很难直接应
用 卷 积 神 经 网 络 ( convolutional neural network,CNN )
[4]
和 循 环 神 经 网 络
(recurrent neural network,RNN)
[5]
等深度学习方法
[6]
。为了构造用于图数据
挖掘的特征表示,图嵌入将节点映射到低维空间,生成保留原始图中某些重要信
息的低维向量。目前,图嵌入不仅在节点分类
[7]
、链接预测
[8]
、节点聚类
[9]
、可视
化
[10]
等复杂网络上的机器学习任务中获得成功,还广泛用于社交影响力建模
[11]
、
内容推荐
[12]
等现实任务。
早期的图嵌入算法主要用于数据降维,通过邻域关系构建相似度图,将节点
嵌入低维向量空间,并保持相连节点向量的相似性。这类方法通常时间复杂度
高,很难扩展到大型图上。近年来,图嵌入算法转向扩展性强的方法。例如,矩阵
分解方法
[13]
使用邻接矩阵的近似分解作为嵌入;随机游走法
[14]
将游走序列输入
到 Skip-Gram
[15]
生成嵌入。这些方法利用图的稀疏性降低了时间复杂度。当前,
很多综述
[16,17,18,19,20,21]
对图嵌入方法进行了归纳与总结,但存在两大局限:一是部
分综述仅涉及传统方法介绍,许多新模型没有纳入研究;二是这些综述只关注静
态图嵌入或动态图嵌入,忽略了二者之间的关联性。
本文对图嵌入方法进行全面系统性综述,有以下三方面的贡献:(1)提出
一种新的图嵌入分类法,同时对静态图和动态图方法进行分类;(2)对现有模型
进行系统性分析,为理解现有方法提供新视角;(3)提出了四个图嵌入的潜在研
究方向。
1 图嵌 入相关 定义及 符号表 示
1.1 问题 定 义
定义 1(图) 图通常表示为 G=(V,E),其中 V 表示节点集, E 表示边集。
定义 2(静态图) 给定图 G=(V,E),如果节点和边的状态不随时间变化,图
G 为静态图。
定 义 3 ( 动 态 图 ) 动 态 图 可 以 按 时 间 分 成 一 系 列 演 化 图 G=(G1,G2,
⋯,GT),T 表示演化图的数量。每个演化图 Gt=(Vt,Et)表示节点和边在 t 时刻的
状态。动态图包含快照型和连续时间型(见图 1)。快照型动态图按时间序列
评论0
最新资源