首先证明了快速核密度估计(Fast kernel density estimate, FKDE) 定理: 基于抽样子集的高斯核密度估计(KDE)
与原数据集的KDE 间的误差与抽样容量和核参数相关, 而与总样本容量无关. 接着本文揭示了基于高斯核形式的图论松弛聚
类(Graph-based relaxed clustering, GRC) 算法的目标表达式可分解成\Parzen 窗加权和+ 平方熵" 的形式, 即此时GRC
可视作一个核密度估计问题, 这样基于KDE 近似策略, 本文提出了大规模图论松弛聚类方法(Scaling up GRC by KDE
approximation, SUGRC-KDEA). 较之先前的工作, 这一方法的优势在于为GRC 作用于大规模数据集提供了更简单和易于
实现的方案.