特征值和特征向量在机器学习中有着很重要的应用,本文介绍一些相关的结论和证明,方便大家复习参考。

定义

特征向量与特征值

定义:对方阵AA,若存在λ\lambda 和非零向量xx,满足Ax=λxAx = \lambda x,则称λ\lambda为矩阵AA的特征值(eigenvalue),xxAA属于特征值λ\lambda的特征向量(eigenvector)

Ax=λx(AλI)x=0Ax= \lambda x \Rightarrow (A - \lambda I )x = 0

因此,我们可以认为满足这个方程的xN(AλI)x \in N(A- \lambda I),也就是说,xx属于这个零空间。

我们知道,对于任意的λ\lambda,向量xx总满足Ax=λxAx= \lambda x,但我们关心的是由非零向量xx满足此方程的特殊的λ\lambda值。

因此, 不难得到以下推论:

N(AλI)N(A -\lambda I) 含非零向量 Aλ\Leftrightarrow A - \lambda 不可逆 det(AλI)=0\Leftrightarrow det(A- \lambda I ) = 0

特征方程

我们记det(AλI)=0det(A- \lambda I ) = 0为矩阵AA的特征方程(characteristic equation),AA的特征值就是特征方程的解。

从直观理解上看,由于矩阵的乘法实际上是对向量进行坐标旋转变换,而Ax=λxAx = \lambda x表示了一种特殊的向量,它使得左乘AA后的向量依然与xx共线。

求解方法

  1. 计算特征多项式det(AλI)det(A- \lambda I )
  2. 求特征方程det(AλI)=0det(A- \lambda I ) = 0的解,即为特征值。
  3. 对每个特征值λ\lambda,求解其次线性方程组(AλI)x=0(A- \lambda I )x = 0,其所有非零解即为属于λ\lambda的所有特征向量。

性质

  1. 矩阵AA 不可逆A\Leftrightarrow A有零特征值。

  2. 实对称矩阵的特征向量两两正交

    • Ax1=λ1x1Ax2=λ2x2Ax_1 = \lambda _1x_1 \quad Ax_2 = \lambda _2x_2

    • x2TAx1=λ1x2Tx1(Ax2)Tx1=λ1x2Tx1x_2^TA x_1 = \lambda _1 x_2^Tx_1 \Rightarrow (Ax_2)^Tx_1 = \lambda _1 x_2^Tx_1

    • λ2x2Tx1=λ1x2Tx1\lambda _2 x_2^T x_1 = \lambda _1 x_2^T x_1

    • (λ1λ2)x2Tx1=0x2Tx1=0(\lambda _1 - \lambda_2) x_2^T x_1 = 0 \Rightarrow x_2^T x_1 = 0

  3. 投影矩阵的特征值为0和1。

    • PP是到子空间VRnV \subset R^n的投影矩阵,其中p=Pb,bVp = Pb ,b \in V

    • bVb\in V,则Pb=bPb = b

    • bVb \perp V,则Pb=0Pb = 0

  4. 反射矩阵R=I2uuTR = I - 2uu^T的特征值是1和-1。

    • vuv \perp u,则Rv=vRv = v

    • v//uv // u,则Rv=vRv = -v

  5. 上(下)三角矩阵的特征值为所有的对角元。

  6. Markov矩阵A一定有特征值1(且为最大特征值)

    • 由于Markov矩阵的列项之和为1,那么每一列减去1,列项之和就变成0,一次你各行之间线性相关。即 (AI)T(11...1)=0(A - I)^T\begin{pmatrix}1 \\\\ 1\\\\ ...\\\\1 \end{pmatrix} = 0
    • 因此λ=1\lambda = 1
  7. 由代数学基本定理,任何复系数一元n次多项式方程在复数域上至少有一根(n≥1),由此推出,n次复系数多项式方程在复数域内有且只有n个根(重根按重数计算),并且,虚根一定成对出现。

  8. λ\lambda 是矩阵AA的特征值,则λ2\lambda ^2A2A^2的特征值,λ+m\lambda + m A+mIA + mI的特征值。

  9. p(x)p(x)是关于xx的多项式函数,则p(λ)p(\lambda)是矩阵p(A)p(A)的一个特征值。

  10. AA可逆,则1λ\frac{1}{\lambda}A1A^{-1}的一个特征值。

    • Ax=λxx=A1Ax=A1λx=λA1xAx = \lambda x \Rightarrow x = A^{-1}Ax = A^{-1}\lambda x = \lambda A^{-1}x

    • A1x=1λxA^{-1}x = \frac{1}{\lambda} x

  11. nn阶矩阵A=(aij)A = (a_{ij})nn个特征值,可能重复,则

    • λ1+...+λn=a11+a22+...+ann=trA\lambda _1 + ...+ \lambda_n = a_{11} + a_{22} + ... + a{nn} = tr A

    • λ1...λn=det(A)\lambda_1 ...\lambda_n = det(A)

  12. 矩阵互异特征值对应的特征向量线性无关。

  13. AA的所有特征值均小于1时,EAE-A可逆。

参考资料

  1. 马尔科夫矩阵 矩阵的特征值和特征向量
  2. 行列式的本质

results matching ""

    No results matching ""