协方差矩阵

mac2024-11-13 94

多元统计分析中，协方差矩阵比较重要，它研究多个变量的关系。

设随机向量 $\bf X$ ，它包括多个变量 $X_1$ , $X_2$ , …, $X_n$ ，即

$\bf{X}=\left( \begin{array}{c} X_1\\ X_2\\ \vdots\\ X_n \end{array} \right)$

它的期望为：

$E(\bf{X})=\left( \begin{array}{c} E(X_1)\\ E(X_2)\\ \vdots\\ E(X_n) \end{array} \right)$

它的协方差阵为： $\begin{aligned} cov(\bf{X}) &=E\left[(\bf X-E(X))(X-E(X))^T\right]\\ &=\left[ \begin{array}{cc} cov(X_1, X_1)&cov(X_1, X_2)&\dots&cov(X_n, X_1)\\ cov(X_2, X_1)&cov(X_2, X_2)&\dots&cov(X_n, X_2)\\ \vdots&\vdots&\ddots&\vdots\\ cov(X_n, X_1)&cov(X_n, X_2)&\dots&cov(X_n, X_n) \end{array} \right] \end{aligned}$

其中，任意一个两个变量的协方差为： $cov(X_1, X_2)=E[(X_1-E(X_1))(X_2-E(X_2))]=E(X_1X_2)-E(X_1)E(X_2)$

性质：

对于任意一个常数矩阵

\bf A

，有

cov(\textbf{AX})=\textbf{A}cov(\bf X)A^T

证明：这个根据定义： $cov(\bf{X}) =E\left[(\bf X-E(X))(X-E(X))^T\right]$ ，套进去就能证出来。

协方差阵为半正定矩阵.

证明：对于任意非零向量 $a$ ， $\begin{aligned} a^T cov(\textbf{X}) a=&cov(a^T\textbf{X})\\ =&E[a^T(\bf X-E(X))(X-E(X))^Ta]\\ =&E[a^T(\bf X-E(X))]^2\geq 0 \end{aligned}$

这是由于 $a^T\bf (X-E(X))$ 是一个标量（数值）。这也意味着它的特征根是非负的。

由于协方差矩阵为正定矩阵，所以它可以进行 Cholesky 分解，即

$\Sigma=CC^T$ 其中， $C$ 为一个下三角矩阵，并且对角线元素为非负实数。

协方差阵可以正交对角化，即存在一个正交矩阵

\bf P

以及对角线矩阵

\bf \land

，使得

cov(\bf X)=P\wedge P^T

其中，对角线矩阵为协方差阵的特征值 ( $\lambda_1, \lambda_2, \dots, \lambda_n$ )。（这个定理证明比较难）。

而正交矩阵 $\bf P$ 可以是协方差矩阵的特征向量矩阵，即 $\bf P=(e_1, e_2, \dots, e_n)$ 。由于协方差矩阵是对称阵，它存在谱分解: $\begin{aligned} cov\bf(x)=P\land P^T=&(e_1,e_2,\dots, e_n)\left[ \begin{array}{cc} \lambda_1\\ &\lambda_2&\\ &&\dots\\ &&&\lambda_n \end{array} \right] \left[ \begin{array}{cc} e^T_1\\ &e^T_2&\\ &&\dots\\ &&&e^T_n \end{array} \right]\\ =\sum\lambda_ie_ie_i^T \end{aligned}$

$\lambda_i$ 是特征值， $\bf e_i$ 是特征向量。（上面的式子中，将对角矩阵看成行向量阵，利用分块矩阵的乘法即可推出）

将各个变量标准化后，它的协方差阵为相关系数阵由于协方差矩阵为实对称阵，它的特征根一定为实数

最新回复(0)