投影寻踪方法及其应用
金 菊 良
合肥工业大学土木建筑工程学院水利系
(邮编 230009,电话 0551-2903357,JINJL66@126.com)
报告内容
1 投影寻踪方法的基本原理与建模步骤
4 总结与讨论
3 基于加速遗传算法的投影寻踪等级评价模型
2 基于加速遗传算法的投影寻踪聚类模型
1 投影寻踪方法的基本原理与建模型步骤
1.1 投影寻踪方法的基本原理
投影寻踪(projection pursuit,PP)方法属于直接由
样本数据驱动的探索性数据分析方法。它把高维数据
{x(i,j)}通过某种组合投影到低维子空间上{z(i)},对于
投影到的构形,采用投影指标函数Q(z(i))来描述投影
暴露原系统某种分类排序结构的可能性大小,寻找出
使投影指标函数达到最优(即能反映高维数据结构或
特征)的投影值z(i),然后根据该投影值来分析高维数
据的分类结构特征(如投影寻踪聚类评价模型),或
根据该投影值与研究系统的实际输出值之间的散点图
构造适当的数学模型以模拟系统输出(如投影寻踪等
级评价模型)。
1 投影寻踪方法的基本原理与建模步骤
1.2 投影寻踪方法的建模步骤
步骤1:高维样本数据的预处理
,确定系统输入。
步骤2:构造投影指标函数。
步骤3:优化投影指标函数。
步骤4:建立系统模型。
2 基于加速遗传算法的投影寻踪聚类模型AGA-PPCE
2.1 基于加速遗传算法的投影寻踪聚类模型的建立
步骤1:评价指标值的归一化处理。设样本集为
{x*(i,j)| i =1~n, j=1~p}。其中x*(i,j)为第i个样本第j个
指标值。为消除各指标值的量纲和统一各指标值的变
化范围,可采用下式进行极值归一化处理:
式中,x
min
(j)、x
max
(j)分别为样本集中第j个指标值的
最小值和最大值。