第 28 卷 第 12 期
2005 年 12 月
计 算 机 学 报
CHINESE JOURNAL OF COMPU TERS
Vol. 28 No. 12
Dec. 2005
收稿日期:2004210215 ;修改稿收到日期 :2005207203. 本课题得到 IIPL2042014 、国家杰出青年科学基金
(
60325207
)
和国家自然科学基金
重大项目
(
60496320
)
资助. 何 力 ,男 ,1983 年生 ,博士研究生 ,研究方向为模式识别、统计学习、机器学习. E2mail : demonstrate @163.
com. 张军平 ,男 ,1970 年生 ,博士 ,研究方向包括模式识别、机器学习、数据挖掘、图像处理等. 周志华 ,男 ,1973 年生 ,博士 ,教授 ,博士生
导师 ,主要研究领域为机器学习、数据挖掘、模式识别、信息检索、神经计算、进化计算.
基于放大因子和延伸方向研究流形学习算法
何 力
1
)
,3
)
张军平
1
)
,2
)
周志华
4
)
1
)
(
复旦大学计算机科学与工程系上海市智能信息处理重点实验室 上海 200433
)
2
)
(
中国科学院复杂系统与智能科学重点实验室 上海 200433
)
3
)
(
复旦大学数学科学学院计算机科学与工程系 上海 200433
)
4
)
(
南京大学软件新技术国家重点实验室 南京 210093
)
摘 要 流形学习是一种新的非监督学习方法 ,可以有效地发现高维非线性数据集的内在维数和进行维数约简 ,
近年来越来越受到机器学习和认知科学领域研究者的重视. 虽然目前已经出现了很多有效的流形学习算法 ,如等
度规映射
(
ISOMAP
)
、局部线性嵌套
(
Locally Linear Embedding ,LL E
)
等 ,然而 ,对观测空间的高维数据与降维后的
低维数据之间的定量关系 ,尚难以直观地进行分析. 这一方面不利于对数据内在规律的深入探察 ,一方面也不利于对
不同流形学习算法的降维效果进行直观比较. 文中提出了一种方法 ,可以从放大因子和延伸方向这两个方面显示出
观测空间的高维数据与降维后的低维数据之间的联系 ;比较了两种著名的流形学习算法
(
ISOMAP 和 LL E
)
的性能 ,
得出了一些有意义的结论 ;提出了相应的算法从而实现了以上理论. 对几组数据的实验表明了研究的有效性和意义.
关键词 流形学习 ;放大因子 ;主延伸方向 ;局部线性嵌套 ;等度规映射
中图法分类号 TP18
Investigating Manifold Learning Algorithms Based on
Magnification Factors and Principal Spread Directions
HE Li
1
)
,3
)
ZHAN GJ un2Ping
1
)
,2
)
ZHOU Zhi2Hua
4
)
1
)
(
Shanghai Key Laboratory of Intelligent Information Processing , Department of Computer Science and Engineering ,
Fudan University , Shanghai 200433
)
2
)
(
Key Laboratory of Complex Systems and Intelligence Science , Chinese Academy of Sciences , Shanghai 200433
)
3
)
(
Department of Computer Science and Engineering , School of Mathematical Sciences , Fudan University , Shanghai 200433
)
4
)
(
National Laboratory for Novel Software Technology , Nanjing University , Nanjing 210093
)
Abstract As a new unsupervised learning technique , manifold learning has captured the atten2
tion of many researchers in the field of machine learning and cognitive sciences. The major algo2
rithms include Isometric mapping
(
ISOMAP
)
and Locally Linear Embedding
(
LL E
)
. The ap2
proaches can be used for discovering the intrinsic dimensions of nonlinear high2dimensional data
effectively and aim researchers to analyze the data better. How to quantitatively analyze the rela2
tionship between the intrinsic dimensions and the observation space , however , has fewer report s.
And thus further works in manifold learning may have suffered some difficulties. The paper focu2
ses on two kinds of manifold learning algorithms
(
ISOMAP , LL E
)
, and discusses magnification
factors and principal spread directions from the observation space to the intrinsic low2dimensional
space. Also the corresponding algorithm is proposed. Experiments show the effectiveness and ad2
vantages of the research.
Keywords manifold learning ; magnification factors ; principal spread directions ; locally linear
embedding ; isometric mapping
- 1
- 2
- 3
前往页