任务#3主成分分析[主题:应用计量经济学]主成分分析,简称PCA,是应用计量经济学中广泛使用的方法。令随机向量具有协方差矩阵为正定的多元正态分布。多元正态分布是单变量正态分布的自然延伸。它对应的概率密度函数(p.d.f.)是对任意的,请注意当时,p.d.f.是的谱分解写为。这里,的列是对应于构成矩阵主对角线的特征值的特征向量。不失一般性地假设特征值正在减少;即.Define一个新的随机向量作为.由一个重要的定理instatistics1给出,我们知道有一个分布。因此,组件是独立的随机变量,并且对于,具有分布。随机向量称为主协向量分量。你需要完成以下问题。随机向量的总变差()是其分量的方差之和。对于随机向量,证明,其中的第一个分量,由给出。这是的分量与属性的线性组合,因为是正交的。考虑的任何其他线性组合,例如。证明存在标量使得定理的确切表述参考格林所著的著名计量经济学教科书《计量经济学分析》中的定理B.10。?和。尝试编写一个MATLAB脚本来查找任何给定随机向量的主成分。将你的结果与MATLAB官方函数pca进行比较。PCA的一个重要特征是降维。例如,某家公司的首席执行官可能具有多种特征,例如教育程度、信心和社会关系。学者更倾向于用一个指标来衡量C的整体性环氧乙烷。PCA可以通过利用第一个(也是最大的)主成分来完成这项任务。让我们使用中国上市公司用PCA构建一个管理质量因子度量。使用CSMAR的CEO数据,构建CEO质量的衡量指标。WX:codehelp
