这一章开始,进入凸优化的应用。
拟合、逼近、插值
- 拟合
- 一般是对于离散点
- 用函数代替列表函数使得误差在某种意义下最小
- 插值
- 一般是对于离散点
- 用一个函数来近似代替列表函数,并要求函数通过列表函数中给定的数据点
- 逼近
- 一般是对于连续函数
- 为复杂函数寻找近似替代函数,其误差在某种度量下最小
范数逼近
基本问题p286
最简单的范数逼近问题具有以下形式的无约束问题:
min∣∣Ax−b∣∣
向量r=Ax−b称为这个问题的残差,其分量称为个体残差。
很明显,范数逼近问题是一个凸问题,也就是说,至少存在一个最优解。
由线性代数的知识,当b∈C(A)时,最优值为0,但我们更关心其不为A的列空间的情况。
解释
Ax=x1a1+...+xnan
可以看出,范数逼近问题目标是用A的列空间的线性组合尽可能的逼近b向量,其偏差由范数度量。
在几何上有更好的解释,其中,x可认为是向量b在A的子空间中的投影点,也就是最靠近b的点。
最小二乘逼近
最常见的范数逼近是l2范数。其问题描述为:
min∣∣Ax−b∣∣22=r12+...+rm2
其目标函数为残差平方和。我们可以将目标函数转化为凸二次函数:
f(x)=xTATAx−2bTAx+bTb
可以解析的求解得到:
ATAx=ATb
这个方程为正规方程,并且总是有解的。
Chebyshev逼近
当使用l∞范数时,逼近问题转化为:
min∣∣Ax−b∣∣∞=minmax{∣r1∣,...,∣rm∣}
表示为极小化最大残差。可以将其描述为线性规划问题:
mint
s.t.−t1⪯Ax−b⪯t1
残差绝对值之和逼近
如果使用l1范数,逼近问题表示为:
min∣∣Ax−b∣∣=min∣r1∣+...+∣rm∣
这是一种鲁棒估计器。也可以表示为线性规划问题:
min1Tt
s.t.−t⪯Ax−b⪯t
罚函数逼近
我们把范数扩展开来,可以考虑目标函数:
(∣r1∣p+...+∣rm∣p)1/p
我们可以不用管外面的幂次,具体来说,可写成如下罚函数逼近问题:
minϕ(r1)+...+ϕ(rm)
s.t.r=Ax−b
其中,ϕ称为罚函数,若其为凸函数,则该问题为凸优化问题。
我们可以将目标函数理解为总体惩罚:每个残差的罚函数之和。
有一些常见的罚函数p288:
- ϕ(u)=∣u∣p,为范数逼近问题
- 带有死区的线性罚函数
- 对数障碍罚函数
- Huber罚函数
对于这些罚函数的解释可以参考书上p288。
书中还考虑了野值(很大的噪声值)对用罚函数设计的影响。
最小范数问题
之前我们考虑的是范数逼近问题(在某种度量下残差最小),现在考虑范数最小问题:
min∣∣x∣∣
s.t.Ax=b
该问题的解为Ax=b的最小范数解。
可重构为范数逼近问题,令x0为任意解,Z的列是A的零空间的基:
min∣∣x0+Zu∣∣
几何解释
可行集{x∣Ax=b}是仿射的,最小范数问题是在仿射集合中寻找距离0最近的点,即寻找0向仿射集合的投影。
线性方程组的最小二乘解p296
最常见的最小范数问题为l2范数:
min∣∣x∣∣22
s.t.Ax=b
其唯一解称为方程Ax=b的最小二乘解。类似于最小二乘逼近,此问题也可以被解析的求解。我们可以使用对偶问题来解决此凸优化问题,最优性条件为:
2x⋆+ATv⋆=0,Ax⋆=b
这很容易求解,不再赘述。
最小罚问题
minϕ(x1)+...+ϕ(xn)
s.t.Ax=b
在约束Ax=b下,最小罚问题找到了具有最小总惩罚的x。
正则化逼近
双准则式
在正则化逼近中,我们的目标是寻找向量x使其较小,同时使得残差较小的值。
可以描述为双目标凸向量优化问题:
min(∣∣Ax−b∣∣,∣∣x∣∣)
注意,这两个范数可能是不同的,第一个用以度量残差的规模,第二个用于度量x的规模。
正则化
正则化是求解双准则问题的一个常用的标量化方法:
min∣∣Ax−b∣∣+γ∣∣x∣∣
其中γ>0为问题参数。
Tikhonov正则化p298
最常见的正则化基于上式并利用Euclid范数,得到一个凸二次优化问题(也称为领回归):
min∣∣Ax−b∣∣22+δ∣∣x∣∣22=xT(ATA+δI)x−2bTAx+bTb
这个正则化有解析解:
x=(ATA+δI)−1ATb
鲁棒逼近
随机鲁棒逼近
当矩阵数据A允许不确定和可能的变化时,记起均值为Aˉ,U为均值为0的随机矩阵,则可以将A表示为:
A=Aˉ+U
自然的,可以用∣∣Ax−b∣∣的期望来作为目标函数:
minE∣∣Ax−b∣∣
这种问题被称为随机鲁棒逼近问题。虽然是凸优化,但并不好解。
若A仅有有限个可能值(离散点)时,即P(A=Ai)=pi,则问题可以写为:
minpi∣∣A1x−b∣∣+...+pk∣∣Akx−b∣∣
这被称为范数和问题。可以表述为:
minpTt
s.t.∣∣Aix−b∣∣≤ti
可见,若为l2范数,则范数和问题是一个二阶锥规划。
鲁棒最小二乘问题
minE∣∣Ax−b∣∣22
由于A=Aˉ+U,则可以将目标函数改写为:
E∥Ax−b∥22=E(Aˉx−b+Ux)T(Aˉx−b+Ux)=(Aˉx−b)T(Aˉx−b)+E(xTUTUx)=∥Aˉx−b∥22+xTPx
其中P=E(UTU)。因此,可以将该问题化为正则化最小二乘形式:
min∣∣Aˉx−b∣∣22+∣∣P1/2x∣∣22
不难通过求导可以得到解为:
x=(AˉTAˉ+P)−1AˉTb
最坏鲁棒逼近
我们用A的可能值集合χ描述其不确定性,我们定义候选的逼近解x的最坏误差为:
ewc(x)=sup{∣∣Ax−b∣∣∣A∈χ}
最坏情况鲁棒逼近问题是极小化最差情况的误差:
minewc(x)