一组数据的**Principal components(主成分)**是一组数据在一个p维空间里的p个方向向量,对于这些方向向量的第i个向量:

这些主成分构成了原数据的一个基底,这些数据在这个基底下各个分量是线性无关的。

**Principal component analysis (PCA)**就是计算这些主成分,并用主成分做为新的基底对数据进行变换的过程。(有时候只取主成分的一部分作为基底)

可以证明,满足上述定义的主成分就是数据协方差矩阵的特征向量。