实际的曲面分解为趋势面和剩余面两部分,前者反映指标的宏观分布规律,属于确定性因素作用的结果;
判别分析的目的是在已知类别的样本上建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。
判别分析是在已知聚类分析的基础上进行的;
原则:特低值可以直接舍弃,特高值处理以服从正态分布或近正态分布的数据母体为依据。
可以分解数据的区域性变化、局部性变化和随机性变化;
趋势面分析的基本要求,就是所选择的趋势面模型应该是剩余值最小,而趋势值最大。
分层聚类(不确定分类数)
可以利用剩余值来圈定局部异常;
偏相关:在多变量相互关联的系统中,不考虑其他变量的影响而单独研究指定两个变量的相关性;
②修改方法,适应数据
伽玛分布或卡方分布:由高异常值造成的密度函数拖尾现象。
其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。
① 计算原始数据的均值(X1)和标准偏差(Sd1);
rxy的绝对值越接近于1,两变量的关系越密切;
偏相关:在多变量相互关联的系统中,不考虑其他变量的影响而单独研究指定两个变量的相关性;
随着次数的增高,求系数的方程组的阶次k以趋势面的次数p按下式增大:
背景值和异常下限值的统计方法
迭代法
稳健估计法
趋势面分析
评论0
最新资源