首页 > 代码库 > ML | PCA

ML | PCA

what‘s xxx

PCA principal components analysis is for dimensionality reduction.

主要是通过对协方差矩阵Covariance matrix进行特征分解,以得出数据的主成分(即特征向量eigenvector)与它们的权值(即特征值eigenvalue)。

PCA是最简单的以特征量分析多元统计分布的方法。其结果可以理解为对原数据中的方差variance做出解释:哪一个方向上的数据值对方差的影响最大?换而言之,PCA提供了一种降低数据维度的有效办法;如果分析者在原数据中除掉最小的特征值所对应的成分,那么所得的低维度数据必定是最优化的(也即,这样降低维度必定是失去讯息最少的方法)。

Algorithm

  1. 计算协方差矩阵;
  2. 计算最大的k个特征向量,组成转换矩阵;
  3. 降维;
  4. 聚类;