上一讲我们学习了最小二乘法,主要就是求解ATAx=ATbA^TAx = A^Tb这个方程,我们能不能想办法使得这个方程越简单越好呢?。

引言

如果矩阵的列向量互相正交,若长度都为一,则称为标准正交阵,若满秩,即QQ为方阵,那么我们称这个矩阵为正交矩阵(orthogonal matrix)。标准正交阵有很多很好的性质:

  • QTQ=IQ^TQ=I,不要求QQ为方阵

  • 如果QQ为方阵,则QT=Q1Q^T = Q^{-1}

  • QxQx是保持长度的变换

    Qx2=(Qx)T(Qx)=xTQTQx=xTx=x2||Qx||^2 =(Qx)^T(Qx) = x^TQ^TQx = x^Tx = ||x||^2

  • QQ不改变向量点积。

    Qx×Qy=(Qx)TQy=xTQTQy=xTyQx\times Qy = (Qx)^TQy=x^TQ^TQy = x^Ty

反射矩阵

uu是一列向量,uTu=1u^Tu = 1

Q=In2uuT,uRnQ = I_n - 2uu^T, u\in R^nQQ为一个反射矩阵(refection matrix)。

QT=I2uuT=Q, QTQ=I4uuT+4uuT=IQ^T = I - 2uu^T = Q, \space Q^TQ = I - 4uu^T + 4uu^T = I

Qu=u2uuTu=uQu = u - 2uu^Tu = -u

可以感性地认为uuQQ上“没有动”,类似于镜面。

投影与正交

在上一讲中,我们推导了向量投影的公式,里面有ATAA^TA的形式,如果用QQ来代替AA,那么可以重新推导结论:

  • 投影矩阵P=Q(QTQ)1QT=QQTP = Q(Q^TQ)^{-1}Q^T = QQ^T
  • 投影向量p=Pb=QQTbp = Pb=QQ^Tb

我们可以进一步仔细观察投影向量:

p=QQTb=[q1...qn][q1T...qnT]b=[q1...qn][q1Tb...qnTb]=i=1n(qiqiT)bp = QQ^Tb = \begin{bmatrix}q_1 &... &q_n \end{bmatrix} \begin{bmatrix}q_1^T \\\\...\\\\ q_n^T \end{bmatrix}b = \begin{bmatrix}q_1 &... &q_n \end{bmatrix}\begin{bmatrix}q_1^Tb \\\\...\\\\ q_n^Tb \end{bmatrix} = \sum \limits _{i=1}^{n}(q_iq^T_i)b

可以发现,其实向量bb到矩阵C(A)C(A)的投影,本质上可以分为bb到每个正交向量qiq_i的投影之和

这是一个十分优美和谐的关系,投影之后彼此之间依然是正交,没有任何冗余。

Gram Schmidt正交化

由此我们想到,标准正交阵有这么好的形式,而每个子空间都有无数个基,那么是不是可以将每个基都表示称标准正交基的形式呢?理论上当然可以,但如何进行变换呢?Gram Schmidt正交化是一种很好的迭代方法。

直接先给出定理:

α1,α2,...,αk\alpha _1,\alpha_2,...,\alpha_k 相互正交,vL{α1,α2,...,αk}v\in L\{\alpha _1,\alpha_2,...,\alpha_k \},则:

v=α1Tvα1Tα1α1+...+αkTvαkTαkαkv =\frac{\alpha_1^Tv}{\alpha_1^T\alpha_1}\alpha_1+...+\frac{\alpha_k^Tv}{\alpha_k^T\alpha_k}\alpha_k

特别的,若α1,α2,...,αk\alpha _1,\alpha_2,...,\alpha_k 标准正交,则:

v=(α1Tv)α1+...+(αkTv)αkv =(\alpha_1^Tv)\alpha_1+...+(\alpha_k^Tv)\alpha_k

就相当于把vv投影到L{α1,α2,...,αk}L\{\alpha _1,\alpha_2,...,\alpha_k \}这个子空间中,等于分解到每个正交向量的投影之和。

可以利用这个定理,很容易的求出正交向量,这里给出另一种方法,可以边正交化边标准化。

eie_i为误差向量,viv_i 为原始向量,qiq_i即为所求

e1=v1=w1,q1=v1v1e_1 = v_1 = w_1,q_1 = \frac{v_1}{||v_1||}

e2=v2(q1Tv2)q1=w2,q2=w2w2e_2 = v_2 - (q_1^Tv_2)q_1 = w_2,q_2 = \frac{w_2}{||w_2||}

ek=vk(q1Tvk)q1...(qk1Tvk)qk1=wk,qk=vkvke_k = v_k - (q_1^Tv_k)q_1 - ... - (q^T_{k_1}v_k)q_{k-1}= w_k,q_k = \frac{v_k}{||v_k||}

QR分解

通过Gram Schmidt正交化,我们知道任何子空间的基AA都可以转化为标准正交基QQ,那会很自然的想到,AAQQ之间到底有什么样的关系呢?其实关系已经蕴含在Gram Schmidt的定理中了:

a1=(q1Ta1)q1a_1=(q_1^T a_1)q_1

a2=(q1Ta2)q1+(q2Ta2)q2a_2=(q_1^T a_2)q_1 + (q_2^Ta_2)q_2

a3=(q1Ta3)q1+(q2Ta3)q2+(q2Ta3)q3a_3=(q_1^T a_3)q_1 + (q_2^Ta_3)q_2+(q_2^Ta_3)q_3

an=(q1Tan)q1+(q2Tan)q2+...+(qnTan)qna_n=(q_1^T a_n)q_1 + (q_2^Ta_n)q_2+...+(q^T_na_n)q_n

总结为矩阵形式:

A=[a1a2...an]=[q1q2...qn][q1Ta1q1Ta2...q1Tan0q2Ta2...q2Tan............00...qnTan]A = \begin{bmatrix}a1 &a_2 & ... & a_n\end{bmatrix} = \begin{bmatrix}q_1 &q_2 & ... & q_n\end{bmatrix}\begin{bmatrix} q_1 ^T a_1& q_1^Ta_2 &... &q_1^Ta_n \\\\ 0 &q_2^Ta_2 & ... & q_2^Ta_n\\\\ ... & ... &... & ...\\\\ 0 &0 & ... & q_n^Ta_n\end{bmatrix}

Q=[q1q2...qn],  R=[q1Ta1q1Ta2...q1Tan0q2Ta2...q2Tan ............00...qnTan]Q =\begin{bmatrix}q_1 &q_2 & ... & q_n\end{bmatrix},\space \space R = \begin{bmatrix}q_1^T a_1& q_1^Ta_2 &... &q_1^Ta_n \\\\ 0 &q_2^Ta_2 & ... & q_2^Ta_n\\\ ... & ... &... & ...\\\\ 0 &0 & ... & q_n^Ta_n\end{bmatrix}

应用

  • A,BA,B都是正交矩阵,则ABAB也是正交矩阵

    ATA=E  BTB=EA^TA = E \space \space B^TB=E

    (AB)TAB=BTATAB=BTEB=E(AB)^TAB = B^TA^TAB = B^TEB =E

  • AA是可逆方阵,则QRQR分解是唯一的。

  • Am×nA_{m\times n}列满秩,有QR分解A=QRA = QRbC(A)b \notin C(A),设bbC(A)C(A)上的投影为p,e=bpp,e= b-p,则(A,b)(A,b)也是列满秩,其QR分解为:

    (A,b)=(Q,ee)(Rα0e),α=QTb(A,b) = (Q,\frac {e}{||e||})\begin{pmatrix} R& \alpha \\\\ 0 & ||e||\end{pmatrix}, \alpha = Q^Tb

results matching ""

    No results matching ""