这一节我们将看见,如何将数值函数用矩阵表示,并使用正定矩阵来指示函数的极值。

二次型

  1. 定义:nn维实向量xxnn阶实对称矩阵AA,称以下数值函数为一个实二次型(quadratic form),为一个二次齐次多项式。

    • f(x)=xTAx=i=1nj=1naijxixjf(x) = x^TAx = \sum\limits_{i =1}^n \sum\limits_{j =1}^na_{ij}x_ix_j
  2. nn维复向量xx以及nn阶复矩阵AAA=AˉT(Hermitian)A = \bar A^T(Hermitian),则称f(x)=xˉTAxf(x ) = \bar x^T Ax为复二次型。

  3. nn阶矩阵DD为对角阵,则称二次型为对角型的:

    • f(x)=xTDx=i=1ndiixi2f(x) = x^TDx = \sum\limits_{i =1}^n d_{ii}x_i^2

    • 任何二次型总可以经过坐标变换x=Qyx = Qy变为对角型的,这是因为对实对称矩阵AA,总存在正交阵QQ,使得QTAQ=Λ=diag(λ1,...,λn)Q^TAQ = \Lambda = diag(\lambda_1,...,\lambda_n)

    • f(x)=xTQΛQTx=yTΛy=i=1nλiyi2\therefore f(x) = x^TQ\Lambda Q^Tx = y^T\Lambda y = \sum\limits _{i=1}^n\lambda_iy_i^2

二次型的分类

一个二次型f(x)=xTAxf(x) = x^TAx是:

  • 正定的,若对所有x0x \ne 0,有f(x)>0f(x) > 0;
  • 负定的,若对所有x0x \ne 0,有f(x)<0f(x) < 0;
  • 不定的,若f(x)f(x)既有正值,也有负值;
  • 半正定的,若对所有x0x \ne 0,有f(x)0f(x) \ge 0;
  • 半负定的,若对所有x0x \ne 0,有f(x)0f(x) \le 0;

性质及定理

  1. 主轴定理:

    • AA是一个nn阶实对称矩阵,则存在正交变换x=Qyx = Qy,使得二次型变为对角型的二次型:

    • xTAx=yTΛy=λiyi2x^TAx = y^T\Lambda y = \sum \lambda_iy_i^2

  2. 推论:

    • AAnn阶正定矩阵,则xTAx=1x^TAx = 1 表示中心在原点,主轴沿着AA的特征值方向,半长轴相应为1λ1,...1λn\frac{1}{\sqrt{\lambda_1}},...\frac{1}{\sqrt{\lambda_n}}的椭球面,其中λ1,...λn\lambda_1,...\lambda_nAA的特征值。
  3. AAnn阶实对称矩阵,则二次型f(x)=xTAxf(x) = x^TAx是:

    • 正定的 <=> AA的所有特征值都是正数;
    • 负定的 <=> AA的所有特征值都是负数;
    • 不定的 <=> AA的特征值既有负数,也有正数;
  4. 矩阵的合同

    • 若两个矩阵A,BA,B,若存在nn阶可逆矩阵CC,使得:

    • CTAC=BC^TAC = B

    • 则称矩阵AABB合同(congruent)

  5. 主轴定理可表述为:任何实对称矩阵正交合同与对角阵。

  6. 事实上,实对称矩阵不限于正交合同,其他代换(如LDU分解)也可合同与对角阵。

  7. 惯性定理:

    • 实对称矩阵AA与矩阵CTACC^TAC具有相同数目的正特征值,负特征值和零特征值。

在函数极值中的应用

  • 这里不给出证明,当我们使用一阶导为0求得稳定点之后,将函数转化为二次型,可根据二次型的性质判断是极小值还是极大值。

  • 二次型矩阵(Hessian矩阵):

    Hessianf(x0,y0)=(2fx2(x0,y0)2fxy(x0,y0)2fxy(x0,y0)2fy2(x0,y0))Hessian_f(x_0,y_0) =\begin{pmatrix}\frac{\partial^2 f}{\partial x^2} (x_0,y_0)&\frac{\partial^2 f}{\partial x\partial y} (x_0,y_0)\\\\ \frac{\partial^2 f}{\partial x\partial y}(x_0,y_0)& \frac{\partial^2 f}{\partial y^2} (x_0,y_0)\end{pmatrix}

  • 若二次型负定,则f(x,y)f(x,y) (x0,y0)(x_0,y_0)达到极大值。

  • 若二次型正定,则f(x,y)f(x,y) (x0,y0)(x_0,y_0)达到极小值。

  • 若二次型不定,则f(x,y)f(x,y) (x0,y0)(x_0,y_0)不是极值。

results matching ""

    No results matching ""