向量投影是线性代数中很重要的应用,用于找到向量到目标投影空间的投影向量。基本子空间中有着更加特殊和精确的关系,由此可以引出向量空间的正交性及投影等问题。这是下一节线性回归的基础。

Ax=bAx=b有解时

当计算线性方程组Ax=bAx=b 有解时, bb就在C(A)C(A)的子空间中,则Ax=bAx= b C(AT)C(A^T)中有唯一解。我们考虑xx的投影。

αRn\alpha \in \mathbb {R}^nAx=bAx= b的解,则α=αr+αn,αrC(AT),αnN(A)\alpha = \alpha_r + \alpha_n, \alpha_r \in C(A^T), \alpha_n \in N(A) 。则:

αr\alpha _rα\alphaC(AT)C(A^T)的投影。 αn\alpha _nα\alphaN(A)N(A)的投影。

Ax=bAx=b无解时

当计算线性方程组 Ax=bAx=b 时, 它可能是无解的,此时我们可以考虑求 x^Rn\hat{x} \in \mathbb{R}^{n} ,使得|| Ax^b A \hat{x} - b || 最小或极小?

这就意味着当 bC(A)b \notin C(A) 时,我们需要求解 C(A)C(A) 上距离 bb 最近的点 Ax^A \hat{x} , 它就是bbC(A)C(A) 上的投影点。

这对于我们理解最小二乘法很有帮助,具体请参考下一章。

以三维空间为例,目标投影空间可能是线,也可能是面。

投影的实质就是找一个函数,从而使得 P(B)=bP(B) = b ,也就找到了 BB 在某一维度的映射。

类似的,在线性代数中,我们需要找到投影矩阵 PP ,使得 PbC(A)Pb \in C(A)

投影矩阵 PP

投影矩阵 PP ,顾名思义,就是利用矩阵 PP ,将向量 bb 投影到所需的”空间“中,设投影点为 pp,则误差向量 e=bpe = b - pp1

在直线上的投影

bb 在直线 aa 上的投影向量 pp.

已知 p+e=b,ea,p=ta(tR) p + e = b, e \perp a , p = ta (t \in \mathbb{R})

eaaT(bta)=0t=aTbaTa(a0)\therefore e \perp a \rightarrow a^T(b - ta) = 0 \rightarrow t = \frac{a^Tb}{a^Ta} (a \ne 0)

bb 在直线 aa 上的投影向量为 (aTbaTa)a=p (\frac{a^Tb}{a^Ta} ) a = p . (a,b表示相应列向量)

投影向量p=(aTbaTa)a=aTaaTa)bp = (\frac{a^Tb}{a^Ta} ) a = \frac{a^Ta}{a^Ta} ) b

我们称 aTaaTa \frac{a^Ta}{a^Ta}为投影矩阵 PP.

在平面上的投影

给定 vR3v \in \mathbb{R}^3 ,求 vv 在平面 π=C(A)\pi= C(A) 上的投影 pp .

α1,α2\alpha_1, \alpha_2 是平面 π\pi 上两无关向量,即 π=C(A) \pi = C(A) 的一组基。

p=Ax^p = A\hat{x},则 e=vAx^e = v - A\hat{x} 垂直于平面 π\pi ,即其属于AA 的左零空间。

AT(AX^v)=0\therefore A^T(A\hat{X} - v) = 0, 即 x^ \hat{x}ATAx=ATvA^TAx = A^Tv 的解。

A\because A 的列向量线性无关,即 ATAA^TA 是可逆矩阵

x^=(ATA)1ATvp=A(ATA)1ATv\therefore \hat{x} = (A^TA)^{-1}A^Tv \rightarrow p = A(A^TA)^{-1}A^Tv.

我们称 A(ATA)1AT A(A^TA)^{-1}A^T 为投影矩阵 PP.

一般情形

AAm×nm \times n 矩阵,设 bRmb \in \mathbb{R}^m,求 bbC(A)C(A) 上的投影 pp ?

pC(A)x^Rn,Ax^=pp \in C(A) \Longleftrightarrow \exists \hat{x} \in \mathbb{R}^n, A \hat{x} = p

e=bpC(A)eN(AT)\because e = b - p \perp C(A) \leftrightarrow e \in N(A^T)

ATe=AT(bAx^)=0.p=Ax^=A(ATA)1ATb\therefore A^T e= \Rightarrow A^T(b - A \hat{x}) = 0. \Longrightarrow p = A\hat{x} = A(A^TA)^{-1}A^Tb

这里需要注意一点:ATAx=ATbA^TAx = A^Tb 总有解(无论 AA 是否列满秩)

这是因为C(AT)=C(ATA),ATbC(AT)=C(ATA)C(A^T) = C(A^TA), A^Tb \in C(A^T) = C(A^TA),所以总能找到这样的 x^\hat{x} 使得 x^=A(ATA)1AT\hat{x} = A(A^TA)^{-1}A^T

投影矩阵 PP 的性质

  • AA 的列向量线性无关(列满秩),则矩阵 ATAA^TA 可逆,投影矩阵 P=A(ATA)1AT P = A(A^TA)^{-1}A^T 满足

P2=P,PT=PP^2=P, P^T = P

从直观上,向量 bb 经过一次投影到平面AA 上后再经过相同的一次投影仍然在平面AA 上,因此投影矩阵 P2P^2PP 的效果是一样的,因此P2=PP^2=P

数学推理:

P2=(A(ATA)1AT)(A(ATA)1AT))=A(ATA)1(ATA)(ATA)1AT=A(ATA)1AT=PP^2 = (A(A^TA)^{-1}A^T)(A(A^TA)^{-1}A^T)) = A(A^TA)^{-1}(A^TA)(A^TA)^{-1}A^T = A(A^TA)^{-1}A^T = P

  • C(P)=N(IP),N(P)=C(IP)C(P) = N(I-P), N(P) = C(I-P)

P2=P\because P^2 = P

P(IP)=0C(IP)N(P)\therefore P(I-P)=0 \Longrightarrow C(I-P) \subset N(P)

αN(P)\alpha \in N(P),则 Pα=0α=(IP)αP\alpha = 0 \Longrightarrow \alpha = (I-P) \alpha

αC(IP)N(P)C(IP)\therefore \alpha \in C(I-P) \Longrightarrow N(P) \subset C(I-P)

综上:N(P)=C(IP)N(P) = C(I-P)

同理C(P)=N(IP)C(P) = N(I-P)

results matching ""

    No results matching ""