主成分しゅせいぶん分析ぶんせき

在ざい多元たげん变量分析ぶんせき中なか，主成分しゅせいぶん分析ぶんせき（英えい语：Principal components analysis，缩写：PCA）是ぜ一いち种统计分析ぶんせき、简化数すう据すえ集しゅう的てき方法ほうほう。它利用りよう正せい交变换来らい对一系列可能相关的变量的观测值进行线性变换，从而投影とうえい为一系列线性不相关变量的值，这些不ふ相あい关变量りょう称しょう为主成分しゅせいぶん（Principal Components）。具体ぐたい地ち，主成分しゅせいぶん可か以看做一个线性方かた程ほど，其包含ほうがん一系列线性系数来指示投影方向。PCA对原始げんし数すう据すえ的てき正せい则化或ある预处理り敏感びんかん（相あい对缩放）。

基本きほん思想しそう：

将はた坐すわ标轴中心ちゅうしん移うつり到いた数かず据すえ的てき中心ちゅうしん，然しか后きさき旋转坐标轴，使つかい得とく数すう据すえ在ざいC1轴上的てき方かた差さ最大さいだい，即そく全部ぜんぶn个数据すえ个体在ざい该方向上こうじょう的てき投影とうえい最さい为分散ぶんさん。意味いみ着ぎ更さら多た的てき信しん息いき被ひ保留ほりゅう下か来らい。C1成なり为第だい一いち主成分しゅせいぶん。
C2第だい二に主成分しゅせいぶん：找一个C2，使つかい得とくC2与あずかC1的てき协方差さ（相あい关系数すう）为0，以免与あずかC1信しん息いき重じゅう叠，并且使し数すう据すえ在ざい该方向ほうこう的てき方かた差さ尽つき量りょう最大さいだい。
以此类推，找到第だい三さん主成分しゅせいぶん，第だい四よん主成分しゅせいぶん……第だいp个主成分しゅせいぶん。p个随机つくえ变量可か以有p个主成分しゅせいぶん^[1]。

主成分しゅせいぶん分ぶん析经常用じょうよう于减少数しょうすう据すえ集しゅう的てき维数，同どう时保留ほりゅう数すう据すえ集しゅう当とう中ちゅう对方かた差さ贡献最大さいだい的てき特とく征せい。这是通どおり过保留ほりゅう低てい维主成分しゅせいぶん，忽ゆるがせ略りゃく高だか维主成分しゅせいぶん做到的てき。这样低てい维成分ぶん往往おうおう能のう够保留ほりゅう住じゅう数すう据すえ的てき最さい重要じゅうよう部分ぶぶん。但ただし是ぜ，这也不ふ是ぜ一定いってい的てき，要よう视具体ぐたい应用而定。由よし于主成分しゅせいぶん分ぶん析依赖所给数据すえ，所以ゆえん数すう据すえ的てき准じゅん确性对分析ぶんせき结果影かげ响很大だい。

主成分しゅせいぶん分析ぶんせき由よし卡尔·皮がわ尔逊于1901年ねん发明^[2]，用よう于分析ぶんせき数すう据すえ及建立こんりゅう数理すうり模型もけい，在ざい原理げんり上じょう与あずか主しゅ轴定理ていり（英えい语：Principal axis theorem）相似そうじ。之これ后きさき在ざい1930年ねん左右さゆう由よし哈罗德とく·霍特林りん独立どくりつ发展并命名めいめい。依よ据すえ应用领域的てき不同ふどう，在ざい信号しんごう处理中ちゅう它也叫さけべ做离散K-L 转换（discrete Karhunen–Loève transform (KLT)）。其方法ほう主要しゅよう是ぜ通どおり过对协方差さ矩のり阵进行特とく征せい分解ぶんかい^[3]，以得出で数すう据すえ的てき主成分しゅせいぶん（即そく特とく征せい向こう量りょう）与あずか它们的てき权值（即そく特とく征せい值^[4]）。PCA是ぜ最さい简单的てき以特征せい量りょう分析ぶんせき多元たげん统计分布ぶんぷ的てき方法ほうほう。其结果はて可か以理解りかい为对原ばら数すう据すえ中ちゅう的てき方かた差さ做出解かい释：哪一个方向上的数据值对方差的影响最大？换而言ごと之の，PCA提供ていきょう了りょう一种降低数据维度的てき有效ゆうこう办法；如果分析ぶんせき者しゃ在原ありはら数すう据すえ中ちゅう除じょ掉最小さいしょう的てき特とく征せい值所ところ对应的てき成分せいぶん，那な么所得しょとく的てき低てい维度数すう据すえ必定ひつじょう是ぜ最さい优化的てき（也即，这样降くだ低てい维度必定ひつじょう是ぜ失しつ去さ讯息最少さいしょう的てき方法ほうほう）。主成分しゅせいぶん分析ぶんせき在ざい分析ぶんせき复杂数すう据すえ时尤为有用よう，比ひ如人ひと脸识别。

PCA是ぜ最さい简单的てき以特征せい量りょう分析ぶんせき多元たげん统计分布ぶんぷ的てき方法ほうほう。通常つうじょう，这种运算可か以被看み作さく是ぜ揭露数すう据すえ的てき内部ないぶ结构，从而更さら好地こうち展てん现数据すえ的てき变异度ど。如果一个多元数据集是用高维数据空间之坐标系来表示的，那な么PCA能のう提供ていきょう一幅较低维度的图像，相当そうとう于数据すえ集しゅう在ざい讯息量りょう最多さいた之の角度かくど上じょう的てき一いち个投影とうえい。这样就可以利用りよう少量しょうりょう的てき主成分しゅせいぶん让数据すえ的てき维度降くだ低てい了りょう。

PCA 跟因子いんし分析ぶんせき密みつ切きり相しょう关。因子いんし分析ぶんせき通常つうじょう包含ほうがん更さら多た特定とくてい领域底そこ层结构的假かり设，并且求もとめ解かい稍やや微ほろ不同ふどう矩のり阵的特とく征せい向こう量りょう。

PCA 也跟典型てんけい相しょう关分析ぶんせき（CCA）有ゆう关。CCA定てい义的坐すわ标系可か以最佳けい地ち描述两个数すう据すえ集しゅう之の间的互协方かた差さ，而PCA定てい义了新しん的てき正せい交坐标系，能のう最さい佳けい地ち描述单个数すう据すえ集しゅう当とう中なか的てき方かた差さ。

数学すうがく定てい义

PCA的てき数学すうがく定てい义是：一いち个正せい交化线性变换，把わ数すう据すえ变换到一いち个新的てき坐すわ标系统中なか，使つかい得とく这一数すう据すえ的てき任にん何なに投影とうえい的てき第だい一大いちだい方かた差さ在ざい第だい一いち个坐标（称しょう为第一いち主成分しゅせいぶん）上じょう，第だい二大方差在第二个坐标（第だい二に主成分しゅせいぶん）上じょう，依よ次じ类推^[5]。

定てい义一个 $n\times m$ 的てき矩のり阵, $X^{T}$ 为去平均へいきん值（以平いたいら均ひとし值为中心ちゅうしん移うつり动至原点げんてん）的てき数すう据すえ，其行为数据すえ样本，列れつ为数据すえ类别（注意ちゅうい，这里定てい义的是ぜ $X^{T}$ 而不是ぜ $X$ ）。则 $X$ 的てき奇き异值分解ぶんかい为 $X=W\Sigma V^{T}$ ，其中 $W\in \mathbf {R} ^{m\times m}$ 是これ $XX^{T}$ 的てき特とく征せい向こう量りょう矩のり阵， $\Sigma \in \mathbf {R} ^{m\times n}$ 是ぜ奇き异值矩のり阵， $V\in \mathbf {R} ^{n\times n}$ 是これ $X^{T}X$ 的てき特とく征せい向こう量りょう矩のり阵。据すえ此，

{\begin{aligned}{\boldsymbol {Y}}^{\top }&={\boldsymbol {X}}^{\top }{\boldsymbol {W}}\\&={\boldsymbol {V}}{\boldsymbol {\Sigma }}^{\top }{\boldsymbol {W}}^{\top }{\boldsymbol {W}}\\&={\boldsymbol {V}}{\boldsymbol {\Sigma }}^{\top }\end{aligned}}

当とう m < n − 1时，V 在ざい通常つうじょう情じょう况下不ふ是ぜ唯ただ一定いってい义的，而Y 则是唯ただ一定いってい义的。W 是ぜ一いち个正せい交矩阵，Y^TW^T=X^T，且Y^T的てき第だい一列由第一主成分组成，第だい二列由第二主成分组成，依よ此类推。

为了得え到いた一种降低数据维度的有效办法，我わが们可以利用りようW_L把わ X 映うつ射い到いた一いち个只应用前面ぜんめんL个向量的りょうてき低てい维空间中去さ：

\mathbf {Y} =\mathbf {W_{L}} ^{\top }\mathbf {X} =\mathbf {\Sigma _{L}} \mathbf {V} ^{\top }

其中 $\mathbf {\Sigma _{L}} =\mathbf {I} _{L\times m}\mathbf {\Sigma }$ ，且 $\mathbf {I} _{L\times m}$ 为 $L\times m$ 的てき单位矩のり阵。

X 的てき单向量りょう矩のり阵W相当そうとう于协方差さ矩のり阵的てき特とく征せい向こう量りょう C = X X^T,

\mathbf {X} \mathbf {X} ^{\top }=\mathbf {W} \mathbf {\Sigma } \mathbf {\Sigma } ^{\top }\mathbf {W} ^{\top }

在ざい欧おう几里得とく空そら间给定一いち组点数すう，第だい一主成分对应于通过多维空间平均点的一条线，同どう时保证各个点到いた这条直ちょく线距离的平方和へいほうわ最小さいしょう。去さ除じょ掉第一いち主成分しゅせいぶん后きさき，用もちい同どう样的方法ほうほう得え到いた第だい二に主成分しゅせいぶん。依よ此类推。在ざいΣしぐま中なか的てき奇き异值均ひとし为矩阵 XX^T的てき特とく征せい值的てき平方根へいほうこん。每まい一个特征值都与跟它们相关的方差是成正比的，而且所有しょゆう特とく征せい值的总和等とう于所有しょゆう点てん到いた它们的てき多た维空间平均へいきん点てん距离的てき平方和へいほうわ。PCA提供ていきょう了りょう一种降低维度的有效办法，本ほん质上，它利用りよう正せい交变换将围绕平均へいきん点てん的てき点てん集中しゅうちゅう尽つき可能かのう多た的てき变量投影とうえい到いた第だい一いち维中去さ，因いん此，降くだ低てい维度必定ひつじょう是ぜ失しつ去さ讯息最少さいしょう的てき方法ほうほう。PCA具有ぐゆう保持ほじ子こ空そら间拥有ゆう最大さいだい方かた差さ的てき最さい优正交变换的特性とくせい。然しか而，当とう与あずか离散余弦よげん变换相そう比ひ时，它需要よう更さら大だい的てき计算需求代だい价。非ひ线性降くだ维技术相对于PCA来らい说则需要じゅよう更さら高だか的てき计算要求ようきゅう。

PCA对变量的りょうてき缩放很敏感かん。如果我わが们只有ゆう两个变量，而且它们具有ぐゆう相しょう同どう的てき样本方かた差さ，并且成なり正せい相しょう关，那な么PCA将はた涉わたる及两个变量的りょうてき主成分しゅせいぶん的てき旋转。但ただし是ぜ，如果把わ第だい一个变量的所有值都乘以100，那な么第一主成分就几乎和这个变量一样，另一个变量只提供了很小的贡献，第だい二主成分也将和第二个原始变量几乎一致。这就意味いみ着ぎ当とう不同ふどう的てき变量代表だいひょう不同ふどう的てき单位（如温度おんど和わ质量）时，PCA是ぜ一种比较武断的分析方法。但ただし是ぜ在ざいPearson的てき题为 "On Lines and Planes of Closest Fit to Systems of Points in Space"的てき原始げんし文ぶん件けん里さと，是ぜ假かり设在欧おう几里得とく空そら间里不ふ考こう虑这些。一いち种使PCA不ふ那な么武断ぶだん的てき方法ほうほう是ぜ使用しよう变量缩放以得到いた单位方かた差さ。

讨论

通常つうじょう，为了确保第だい一主成分描述的是最大方差的方向，我わが们会使用しよう平均へいきん减法进行主成分しゅせいぶん分析ぶんせき。如果不ふ执行平均へいきん减法，第だい一主成分有可能或多或少的对应于数据的平均值。另外，为了找到近似きんじ数すう据すえ的てき最小さいしょう均ひとし方かた误差，我わが们必须选取一个零均值^[6]。

假かり设零经验均ひとし值，数すう据すえ集しゅう X 的てき主成分しゅせいぶんw₁可か以被定てい义为：

\mathbf {w} _{1}={\underset {\Vert \mathbf {w} \Vert =1}{\operatorname {\arg \,max} }}\,\operatorname {Var} \{\mathbf {w} ^{\top }\mathbf {X} \}={\underset {\Vert \mathbf {w} \Vert =1}{\operatorname {\arg \,max} }}\,E\left\{\left(\mathbf {w} ^{\top }\mathbf {X} \right)^{2}\right\}

为了得え到いた第だい k个主成分しゅせいぶん，必须先さき从X中ちゅう减去前面ぜんめん的てき $k-1$ 个主成分しゅせいぶん：

\mathbf {\hat {X}} _{k-1}=\mathbf {X} -\sum _{i=1}^{k-1}\mathbf {w} _{i}\mathbf {w} _{i}^{\top }\mathbf {X}

然しか后きさき把わ求もとめ得とく的てき第だいk个主成分しゅせいぶん带入数すう据すえ集しゅう，得とく到いた新しん的まと数すう据すえ集しゅう，继续寻找主成分しゅせいぶん。

\mathbf {w} _{k}={\underset {\Vert \mathbf {w} \Vert =1}{\operatorname {arg\,max} }}\,E\left\{\left(\mathbf {w} ^{\top }\mathbf {\hat {X}} _{k-1}\right)^{2}\right\}.

PCA相当そうとう于在气象学がく中ちゅう使用しよう的てき经验正せい交函数すう（EOF）,同どう时也类似于一个线性隐层神经网络。隐含层 K 个神经元的てき权重向むこう量りょう收おさむ敛后，将はた形成けいせい一いち个由前まえ K 个主成分しゅせいぶん跨またが越えつ空そら间的基もと础。但ただし是ぜ与あずかPCA不同ふどう的てき是ぜ，这种技わざ术并不ふ一定会产生正交向量。

PCA是ぜ一种很流行且主要的模式识别技术。然しか而，它并不能ふのう最さい优化类别可分かぶん离性^[7] 。另一种不考虑这一点的方法是线性判别分析。

符号ふごう和わ缩写表ひょう

Symbol符号ふごう	Meaning意い义	Dimensions尺寸しゃくすん	Indices指数しすう
$\mathbf {X} =\{X[m,n]\}$	由よし所有しょゆう数すう据すえ向こう量りょう集しゅう组成的てき数すう据すえ矩のり阵，一いち列れつ代表だいひょう一いち个向量りょう	$M\times N$	$m=1\ldots M$ $n=1\ldots N$
$N\,$	数かず据すえ集中しゅうちゅう列れつ向こう量的りょうてき个数	$1\times 1$	标量
$M\,$	每まい个列向こう量的りょうてき元素げんそ个数	$1\times 1$	标量
$L\,$	子こ空そら间的维数, $1\leq L\leq M$	$1\times 1$	标量
$\mathbf {u} =\{u[m]\}$	经验均ひとし值向量りょう	$M\times 1$	$m=1\ldots M$
$\mathbf {s} =\{s[m]\}$	经验标准方かた差さ向むこう量りょう	$M\times 1$	$m=1\ldots M$
$\mathbf {h} =\{h[n]\}$	所有しょゆう的てき单位向むこう量りょう	$1\times N$	$n=1\ldots N$
$\mathbf {B} =\{B[m,n]\}$	对均值的偏へん离向量りょう	$M\times N$	$m=1\ldots M$ $n=1\ldots N$
$\mathbf {Z} =\{Z[m,n]\}$	Z-分数ぶんすう，利用りよう均ひとし值和标准差さ计算得え到いた	$M\times N$	$m=1\ldots M$ $n=1\ldots N$
$\mathbf {C} =\{C[p,q]\}$	协方差さ矩のり阵	$M\times M$	$p=1\ldots M$ $q=1\ldots M$
$\mathbf {R} =\{R[p,q]\}$	相あい关矩阵	$M\times M$	$p=1\ldots M$ $q=1\ldots M$
$\mathbf {V} =\{V[p,q]\}$	C的てき所有しょゆう特とく征せい向こう量りょう集しゅう	$M\times M$	$p=1\ldots M$ $q=1\ldots M$
$\mathbf {D} =\{D[p,q]\}$	主しゅ对角线为特とく征せい值的对角矩のり阵	$M\times M$	$p=1\ldots M$ $q=1\ldots M$
$\mathbf {W} =\{W[p,q]\}$	基もと向むこう量りょう矩のり阵	$M\times L$	$p=1\ldots M$ $q=1\ldots L$
$\mathbf {Y} =\{Y[m,n]\}$	X 和わW矩のり阵的投影とうえい矩のり阵	$L\times N$	$m=1\ldots L$ $n=1\ldots N$

主成分しゅせいぶん分析ぶんせき的てき属性ぞくせい和わ限げん制せい

如上じょじょう所しょ述じゅつ，主成分しゅせいぶん分析ぶんせき的てき结果依よ赖于变量的てき缩放。

主成分しゅせいぶん分析ぶんせき的てき适用性せい受到由よし它的派生はせい物ぶつ产生的てき某ぼう些假设^[8] 的まと限げん制せい。

主成分しゅせいぶん分析ぶんせき和信かずのぶ息いき理り论

通つう过使用しよう降くだ维来保存ほぞん大だい部分ぶぶん数すう据すえ信しんじ息いき的てき主成分しゅせいぶん分析ぶんせき的てき观点是ぜ不正ふせい确的。确实如此，当とう没ぼつ有ゆう任にん何なん假かり设信息いき的てき信号しんごう模型もけい时，主成分しゅせいぶん分析ぶんせき在ざい降くだ维的同どう时并不能ふのう保ほ证信息いき的てき不ふ丢失，其中信しん息いき是ぜ由ゆかり香こう农熵^[9]来らい衡量的てき。基もと于假设得 $\mathbf {x} =\mathbf {s} +\mathbf {n}$ 也就是ぜ说，向むこう量りょう x 是ぜ含有がんゆう信しん息いき的てき目め标信号ごう s 和かず噪声信号しんごう n 之これ和わ，从信息いき论角度かくど考こう虑主成分しゅせいぶん分析ぶんせき在ざい降くだ维上是ぜ最さい优的。

特とく别地，Linsker证明了りょう如果 s 是ぜ高だか斯分布ぶんぷ，且 n 是ぜ与あずか密度みつど矩のり阵相应的协方差さ矩のり阵的高だか斯噪声ごえ，

使用しよう统计方法ほうほう计算PCA

以下いか是ぜ使用しよう统计方法ほうほう计算PCA的てき详细说明。但ただし是ぜ请注意ちゅうい，如果利用りよう奇き异值分解ぶんかい（使用しよう标准的てき软件）效果こうか会かい更さら好このみ。

我わが们的目め标是把わ一いち个给定じょう的てき具有ぐゆう M 维的数すう据すえ集しゅうX 变换成なり具有ぐゆう较小维度 L的まと数すう据すえ集しゅうY。现在要求ようきゅう的てき就是矩のり阵Y，Y是ぜ矩のり阵X Karhunen–Loève变换。: $\mathbf {Y} =\mathbb {KLT} \{\mathbf {X} \}$

组织数すう据すえ集しゅう

假かり设有一いち组 M 个变量的りょうてき观察数すう据すえ，我わが们的目的もくてき是ぜ减少数すう据すえ，使つかい得能とくのう够用L 个向量りょう来らい描述每ごと个观察值，L < M。进一いち步ほ假かり设，该数据すえ被ひ整理せいり成なり一いち组具有ぐゆうN个向量的りょうてき数すう据すえ集しゅう，其中每ごと个向量りょう都と代表だいひょうM 个变量的りょうてき单一观察数すう据すえ。

$\mathbf {x} _{1}\ldots \mathbf {x} _{N}$ 为列向むこう量りょう，其中每ごと个列向むこう量りょう有ゆうM 行くだり。

将はた列れつ向むこう量りょう放ひ入いれM × N的てき单矩阵X 里さと。

计算经验均ひとし值

对每一いち维m = 1, ..., M计算经验均ひとし值

将はた计算得え到いた的てき均ひとし值放入いれ一いち个 M × 1维的经验均ひとし值向量りょうu中なか

u[m]={1 \over N}\sum _{n=1}^{N}X[m,n]

计算平均へいきん偏差へんさ

对于在ざい最大さいだい限度げんど地ち减少近似きんじ数すう据すえ的てき均ひとし方かた误差的てき基もと础上找到一个主成分来说，均ひとし值减去法ほう是ぜ该解决方案あん的てき不可ふか或ある缺かけ的てき组成部分ぶぶん^[10] 。因よし此，我わが们继续如下か步ふ骤：

从数据すえ矩のり阵X的まと每ごと一列中减去经验均值向量 u

将はた平均へいきん减去过的数すう据すえ存そん储在M × N矩のり阵B中なか

\mathbf {B} =\mathbf {X} -\mathbf {u} \mathbf {h}

其中h是ぜ一个长度为N的てき全ぜん为1的てき行ぎょう向むこう量りょう：

h[n]=1\,\qquad \qquad {\text{for }}n=1,\ldots ,N

求もとめ协方差さ矩のり阵

从矩阵B 中ちゅう找到M × M 的てき经验协方差さ矩のり阵C

\mathbf {C} =\mathbb {E} \left[\mathbf {B} \otimes \mathbf {B} \right]=\mathbb {E} \left[\mathbf {B} \cdot \mathbf {B} ^{*}\right]={1 \over N-1}\sum _{}\mathbf {B} \cdot \mathbf {B} ^{*}

其中 $\mathbb {E}$ 为期望もち

$\otimes$ 是ぜ最さい外そと层运算さん符ふ

$*\$ 是ぜ共ども轭转置おけ运算符ふ。

请注意ちゅうい，如果B完全かんぜん由よし实数组成，那な么共轭转置おけ与あずか正常せいじょう的てき转置一いち样。

为什么是N-1,而不是ぜN，Bessel's correction（英えい语：Bessel%27s_correction）给出了解りょうかい释

查找协方差さ矩のり阵的特とく征せい值和特とく征せい向こう量りょう

计算矩のり阵C 的てき特とく征せい向こう量りょう

\mathbf {V} ^{-1}\mathbf {C} \mathbf {V} =\mathbf {D}

其中，D 是これC的てき特とく征せい值对角かく矩のり阵，这一いち步ほ通常つうじょう会かい涉わたる及到使用しよう基もと于计算さん机つくえ的てき计算特とく征せい值和特とく征せい向こう量的りょうてき算法さんぽう。在ざい很多矩のり阵代数すう系けい统中这些算法さんぽう都と是ぜ现成可用かよう的てき，如R语言，MATLAB,^[11]^[12] Mathematica,^[13] SciPy, IDL(交互こうご式しき数すう据すえ语言), 或ある者ものGNU Octave以及OpenCV。

矩のり阵D为M × M的てき对角矩のり阵

各かく个特征せい值和特とく征せい向こう量りょう都と是ぜ配はい对的，m个特征せい值对应m个特征せい向こう量りょう。

参まいり见

Correspondence analysis（英えい语：Correspondence analysis）
Canonical correlation
CUR matrix approximation（英えい语：CUR matrix approximation） (can replace of low-rank SVD approximation)
Detrended correspondence analysis（英えい语：Detrended correspondence analysis）
Dynamic mode decomposition（英えい语：Dynamic mode decomposition）
特とく征せい脸(Eigenface)
多た线性主成分しゅせいぶん分析ぶんせき(Multilinear PCA)
Geometric data analysis（英えい语：Geometric data analysis）
Factorial code（英えい语：Factorial code）
独立どくりつ成分せいぶん分析ぶんせき
核かく主成分しゅせいぶん分析ぶんせき
矩のり阵分解ぶんかい
Nonlinear dimensionality reduction
Oja's rule（英えい语：Oja's rule）
Point distribution model（英えい语：Point distribution model） (PCA applied to morphometry and computer vision)
Principal component regression（英えい语：Principal component regression）
Singular spectrum analysis（英えい语：Singular spectrum analysis）
奇き异值分解ぶんかい
Sparse PCA（英えい语：Sparse PCA）
变换编码
最小さいしょう二に乘法じょうほう
Low-rank approximation（英えい语：Low-rank approximation）

注ちゅう释

^ 主成分しゅせいぶん分析ぶんせき（principal components analysis, PCA）——无监督とく学がく习. （原始げんし内容ないよう存そん档于2020-08-19）.
^ Pearson, K. On Lines and Planes of Closest Fit to Systems of Points in Space (PDF). Philosophical Magazine. 1901, 2 (6): 559–572 [2012-01-24]. （原始げんし内容ないよう (PDF)存そん档于2013-10-20）.
^ Abdi. H., & Williams, L.J. Principal component analysis.. Wiley Interdisciplinary Reviews: Computational Statistics,. 2010, 2: 433–459.
^ Shaw P.J.A. (2003) Multivariate statistics for the Environmental Sciences, Hodder-Arnold. ISBN 978-0-340-80763-7. ^{[页码请求]}
^ Jolliffe I.T. Principal Component Analysis （页面存そん档备份，存そん于互联网档案あん馆）, Series: Springer Series in Statistics （页面存そん档备份，存そん于互联网档案あん馆）, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. ISBN 978-0-387-95442-4
^ A. A. Miranda, Y. A. Le Borgne, and G. Bontempi. New Routes from Minimal Approximation Error to Principal Components （页面存そん档备份，存そん于互联网档案あん馆）, Volume 27, Number 3 / June, 2008, Neural Processing Letters, Springer
^ Fukunaga, Keinosuke. Introduction to Statistical Pattern Recognition. Elsevier. 1990. ISBN 0122698517.
^ Jonathon Shlens, A Tutorial on Principal Component Analysis. （页面存そん档备份，存そん于互联网档案あん馆）
^ Geiger, Bernhard; Kubin, Gernot (Sep 2012), Relative Information Loss in the PCA （页面存そん档备份，存そん于互联网档案あん馆）
^ A.A. Miranda, Y.-A. Le Borgne, and G. Bontempi. New Routes from Minimal Approximation Error to Principal Components （页面存そん档备份，存そん于互联网档案あん馆）, Volume 27, Number 3 / June, 2008, Neural Processing Letters, Springer
^ eig function （页面存そん档备份，存そん于互联网档案あん馆） Matlab documentation
^ MATLAB PCA-based Face recognition software. [2012-04-30]. （原始げんし内容ないよう存そん档于2012-03-09）.
^ Eigenvalues function （页面存そん档备份，存そん于互联网档案あん馆） Mathematica documentation

参考さんこう

Jolliffe, I. T. Principal Component Analysis. Springer-Verlag. 1986: 487 [2012-01-24]. ISBN 978-0-387-95442-4. doi:10.1007/b98835. （原始げんし内容ないよう存そん档于2019-10-16）.

[1] 主成分しゅせいぶん分析ぶんせき（principal components analysis, PCA）——无监督とく学がく习. （原始げんし内容ないよう存そん档于2020-08-19）.

[2] Pearson, K. On Lines and Planes of Closest Fit to Systems of Points in Space (PDF). Philosophical Magazine. 1901, 2 (6): 559–572 [2012-01-24]. （原始げんし内容ないよう (PDF)存そん档于2013-10-20）.

[3] Abdi. H., & Williams, L.J. Principal component analysis.. Wiley Interdisciplinary Reviews: Computational Statistics,. 2010, 2: 433–459.

[4] Shaw P.J.A. (2003) Multivariate statistics for the Environmental Sciences, Hodder-Arnold. ISBN 978-0-340-80763-7. ^{[页码请求]}

[5] Jolliffe I.T. Principal Component Analysis （页面存そん档备份，存そん于互联网档案あん馆）, Series: Springer Series in Statistics （页面存そん档备份，存そん于互联网档案あん馆）, 2nd ed., Springer, NY, 2002, XXIX, 487 p. 28 illus. ISBN 978-0-387-95442-4

[6] A. A. Miranda, Y. A. Le Borgne, and G. Bontempi. New Routes from Minimal Approximation Error to Principal Components （页面存そん档备份，存そん于互联网档案あん馆）, Volume 27, Number 3 / June, 2008, Neural Processing Letters, Springer

[7] Fukunaga, Keinosuke. Introduction to Statistical Pattern Recognition. Elsevier. 1990. ISBN 0122698517.

[8] Jonathon Shlens, A Tutorial on Principal Component Analysis. （页面存そん档备份，存そん于互联网档案あん馆）

[9] Geiger, Bernhard; Kubin, Gernot (Sep 2012), Relative Information Loss in the PCA （页面存そん档备份，存そん于互联网档案あん馆）

[10] A.A. Miranda, Y.-A. Le Borgne, and G. Bontempi. New Routes from Minimal Approximation Error to Principal Components （页面存そん档备份，存そん于互联网档案あん馆）, Volume 27, Number 3 / June, 2008, Neural Processing Letters, Springer

[11] unction （页面存そん档备份，存そん于互联网档案あん馆） Matlab documentation

[12] MATLAB PCA-based Face recognition software. [2012-04-30]. （原始げんし内容ないよう存そん档于2012-03-09）.

[13] Eigenvalues function （页面存そん档备份，存そん于互联网档案あん馆） Mathematica documentation

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]