最小二乘法大家都很熟悉了,今天以向量投影的角度重新认识它。

引入

回到解方程组Ax=bAx = b

Ax=bAx = b 有解,则bC(A)b\in C(A)

Ax=bAx = b 有解,则bC(A)b\notin C(A),转化为问题求:x^\hat{x}使得||Ax^bA\hat{x} - b||最小,即minxRnAx^bmin_{x\in R^n}||A\hat{x}-b||的最小值点。

由上一讲可知,最小值其实就是e=bAx^e = b- A\hat x,即误差向量。在空间中表示为bbC(A)C(A)上的投影。

因此,我们可以求得投影向量p=Ax^p = A\hat x,然后根据eC(A)e \perp C(A)得到法方程组ATAx^=ATbA^TA\hat x= A^Tb

法方程组有几个重要的性质:

  1. 法方程组总有解(无论A是否列满秩)。

  2. ATAx^=ATbA^TA\hat x = A^Tb的解可能有无数多个,但p=Ax^p = A\hat x唯一。

直线拟合

首先我们来看最常见的直线拟合。 p1

我们想得到目标直线y^=a+bx,ei=yiy^i\hat y = a + bx, e_i = y_i - \hat y_i

给定数据{(x1,y1,...(xn,yn)}\{(x_1,y_1,...(x_n,y_n)\}。寻找直线y=C+Dxy=C+Dx,使得误差最小:

E(C,D)=[y1(C+Dx1)]2+....+[yn(C+Dn)]2E(C,D)=[y_1-(C+Dx_1)]^2+ .... +[y_n-(C+D_n)]^2

即向量(y1(C+Dx1)...yn(C+Dxn))\begin{pmatrix}y_1-(C+Dx_1)\\\\ ...\\\\ y_n-(C+Dx_n)\end{pmatrix}的长度最小。

A=(1 x1...... 1xn)A = \begin{pmatrix}1 & \ x_1 \\\\...& ...\\\\\ 1& x_n \end{pmatrix}b=[y1...yn]b = \begin{bmatrix}y_1\\ ...\\ y_n \end{bmatrix}x^=b=[C^D^]\hat x = b = \begin{bmatrix}\hat C\\ \hat D\end{bmatrix}。即求解x^\hat x 使得bAx^||b-A\hat{x}||最小。

利用之前的结论,ATAx^=ATbA^TA\hat x= A^Tb,带入即可得:

C^=yD^x, D^=i=1n(xix)(yiy)i=1n(xix)\hat C = \overline y - \hat D \overline x, \space \hat D = \frac{\sum\limits_{i=1}^{n}(x_i - \overline x)(y_i - \overline y)}{\sum\limits_{i=1}^{n} (x_i - \overline x)}

直线y=C^+D^x y = \hat C + \hat Dx称为最小二成直线。

因此,我们只需要求法方程组,即可求得直线的所有参数。

微积分

曲线拟合与直线类似,只是多了几个参数而已,在此不做介绍。

我们现在可以说明法方程组也来自微积分。令:

f(x1,...,xn)=Ax=b2=(Axb)T(Axb)f(x_1,...,x_n) = || Ax = b||^2=(Ax-b)^T(Ax-b)

fX=(fx1...fxn)=2ATAX2ATb\frac{\partial f}{\partial X} = \begin{pmatrix} \frac{\partial f}{\partial x_1} \\\\...\\\\ \frac{\partial f}{\partial x_n} \end{pmatrix} = 2A^TAX - 2A^Tb

x^\hat x 满足minxRnAx^bmin_{x\in R^n}||A\hat{x}-b||,则fX\frac{\partial f}{\partial X}一定是极值点。因此可得:ATAx^=ATbA^TA\hat x= A^Tb

results matching ""

    No results matching ""