主成分分析法
书籍:质量工作者手册
出处:按学科分类—经济 中山大学出版社《质量工作者手册》第324页(690字)
又叫矩阵数据分析法,是新七种工具中唯一属于数理统计方法应用的工具。它是对含有许多个的并有相关关系的变量的系统,收集大量数据之后,用数理统计中的多元统计分析方法进行处理,寻找出若干个数目较少的新变量(它们是原始变量的线性组合),又能较多地反映出原系统的信息,而进行的多指标综合处理。这种方法由于变量多,数据量大,计算繁杂,多采用计算机进行。实施步骤是:
(1)收集足够数据(上千个),列出数据表;
(2)计算各组数据的均值、方差(或标准差)和进行数据标准化;
(3)列出标准化数据矩阵;
(4)求出相关系数,列出相关矩阵(是对阵矩阵,对角线上元素为1);
(5)求出相关矩阵的特征根与特征向量。这里,特征根表示主成分的数值,数值越大,代表性越强;特征向量表示各观测值(数据)与主成分的关系,可以呈现某种规律性;
(6)求出各个主成分,如第一主成分是第一个(从大到小排列的最大数值)特征根对应的特征向量与标准化矩阵列向量的数积;
(7)各主成分的方差贡献率,即各个特征根与全部特征根总和之比。再求第二、三个主成分的累积方差贡献率,若达到85%(或90%)以上,即可用前二、三个主成分来实施对策了。