面板数据主成分分析 Stata 代码完整版详解
(含主成分分析详细操作代码及过程说明)
附件数据的步骤
第一步,对原来的 p 个指标进行标准化,以消除变量在数量级或量纲上的影响。
第二步,根据标准化的数据矩阵求出协方差或相关矩阵。
通过以下命令运行(结合 do 文档看)
global xlist "tenure vari insider mgshder lndn"
foreach x of global xlist{
egen std`x' =std(`x' )
}
第三步,求出协方差矩阵的特征根和特征向量。
pca std*,mineigen(1)
图 1
第四步,通过生成的表格信息,进行筛选是预测几个指标。如何筛选,根据以下特征根和
累计贡献率。具体如下:
*1.上条命令会出现两个表,第一个表是带有"Eigenvalue(特征根)"、"Cumulative(累积贡献率)",
以下对此进行讲解(张文彤等,2017):
(1)特征根(Eigenvalue):
可以被看成是主成分影响力度的指标,代表引入该主成分后可以解释多少个原始变量的信息。
如果特征根小于 1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大。
因此一般可以用特征根大于 1 作为纳入标准。
*基于(1)特征根(Eigenvalue)的标准,我们发现,只有图 1 的前两行特征根大于 1(分别为
特征根
累积贡献率