其他分享
首页 > 其他分享> > 对偶理论

对偶理论

作者:互联网

对偶问题的意义在于无论原问题是凸还是非凸,对偶问题都是凸优化问题。通过将原问题转化为对偶问题,有将复杂问题简单化的可能性,并能够求得原问题的全局最优解。

一、线性规划中的对偶理论

1.1 对偶的三种形式

  1. 对称形式的对偶(只包含不等式约束)

    原问题

    \[\begin{array}{ll} \min & c x \\ \text { s. t. } & A x \geqslant b,\\ & x \geqslant 0 . \end{array}\quad\quad(1) \]

    对偶问题

    \[\begin{array}{ll} \max & w b \\ \text { s. t. } & w A \leqslant c,\\ & w \geqslant 0 . \end{array}\quad\quad(2) \]

    其中,\(A=(p_1,p_2,\cdots,p_n)\) 是 \(m\times n\) 矩阵,\(b=(b_1,b_2,\cdots,b_m)\) 是 \(m\) 维列向量,\(c=(c_1,c_2,\cdots,c_n)\) 是 \(n\) 维行向量,\(x=(x_1,x_2,\cdots,x_n)\) 是由原问题的变量组成的 \(n\) 维列向量,\(w=(w_1,w_2,\cdots,w_m)\) 是由对偶问题的变量组成的 \(m\) 维行向量。(原问题约束条件个数=对偶问题中变量的个数;原问题中变量个数=对偶问题中约束条件的个数)

  2. 非对称形式的对偶(只包含等式约束)

    原问题

    \[\begin{array}{ll} \min & c x \\ \text { s. t. } & A x=b, \\ & x \geqslant 0 \end{array}\quad\quad(3) \]

    需要先写成等价形式

    \[\begin{array}{ll} \min & c x \\ \text { s. t. } & A x\ge b, \\ &-A x\le -b, \\ & x \geqslant 0 \end{array}\quad\quad(4) \]

    对偶问题

    \[\begin{array}{ll} \max & wb \\ \text { s. t. } & wA \le c. \end{array}\quad\quad(5) \]

    其中,对偶问题中的变量无正负号限制。

  3. 一般情形

    原问题

    \[\begin{array}{ll} \min & {c x} \\ \text { s. t. } & {A}_{1} {x} \geqslant {b}_{1}, \\ & {A}_{2} {x}={b}_{2}, \\ & {A}_{3} {x} \leqslant {b}_{3}, \\ & {x} \geqslant {0} \end{array}\quad\quad(6) \]

    引入松弛变量将其写成等价形式

    \[\begin{array}{ll} \min & {c x} \\ \text { s. t. } & {A}_{1} {x} -x_s = {b}_{1}, \\ & {A}_{2} {x}={b}_{2}, \\ & {A}_{3} {x}+x_t = {b}_{3}, \\ & x,x_s,x_t \geqslant {0} \end{array}\quad\quad(7) \]

    对偶问题为

    \[\begin{array}{ll} \max & {w}_{1} {b}_{1}+{w}_{2} {b}_{2}+{w}_{3} {b}_{3} \\ \text { s. t. } & {w}_{1} {A}_{1}+{w}_{2} {A}_{2}+{w}_{3} {A}_{3} \leqslant {c}, \\ & {w}_{1} \geqslant {0}, \\ & {w}_{3} \leqslant {0}, \\ & {w}_{2} \text { 无限制 , } \end{array}\quad\quad(8) \]

1.2 对偶变换规则

  1. 若原问题是极大化问题, 那么对偶问题就是极小化问题;若原问题是极小化问 题,那么对偶问题就是极大化问题。
  2. 在原问题和对偶问题中,约束右端向量与目标函数中系数向量恰好对换。
  3. 对于极小化问题的“\(\ge\)”型约束(极大化问题中的“\(\le\)”型约束),相应的对偶问题有非负限制;对于极小化问题的“ \(\le\) ”型约束(极大化问题中的“\(\ge\)”型约束),相应的对偶变量有非正制;对于原问题中的“\(=\)”型约束,相应的对偶变量无正负限制。
  4. 对于极小化问题的具有非负限制的变量(极大化问题的具有非正限制的变量),在其对偶问题中,相应的约束为“ \(\le\) ”型不等式;对极小化问题中具有非正限制的变量(极大化问题的具有非负限制的变量),在其对偶问题中,相应的约束为“\(\ge\)”型不等式;对于原问题中无正负限制的变量, 在其对偶问题中, 相应的约束为等式。

例子

1.3 对偶定理

1.4 互补松弛性质

二、非线性规划中的对偶理论

对偶问题的极大值等于原问题的极小值。这种现象对于线性规划中的对偶是必然的;但是对于非线性规划,这一结论并不是普遍成立。

2.1 共轭函数(对偶函数)

2.2 Lagrange 对偶问题

考虑非线性规划问题

\[\begin{array}{ll} \operatorname{min} & f(x) \\ \text { s.t. } & g_{i}(x) \leq 0, \quad i=1, \ldots, m \\ & h_{j}(x)=0, \quad j=1, \ldots, p,\\ & x\in D \end{array}\quad\quad(9) \]

则其对偶问题可以写为

\[\begin{array}{ll} \operatorname{max} & \theta(\lambda,\nu) \\ \text { s.t. } &\lambda\ge 0 \end{array}\quad\quad(10) \]

称为 Lagrange 对偶问题 。其目标函数 \(\theta(\lambda,\nu)\) 为 Lagrange 对偶函数,其定义如下:

\[\theta(\lambda,\nu)=\inf_{x\in D} L(x, \lambda, \nu)=\inf_{x\in D}\left( f(x)+\sum_{i=1}^{m} \lambda_{i} g_{i}(x)+\sum_{j=1}^{p} \nu_{j} h_{j}(x)\right) \]

其中,\(L(x, \lambda, \nu)\) 是 Lagrange 函数,\(L\) 称为 Lagrange 算符,\(\lambda, \nu\) 是 Lagrange 乘子。根据 2.1 节所述,由于 Lagrange 对偶函数是一系列仿射函数的逐点下确界,因此 \(\theta(\lambda,\nu)\) 是凹函数,而对偶问题的约束条件为凸集,因此 Lagrange 对偶问题为凸优化问题,且无论原问题是否为凸优化问题。

2.3 对偶定理

2.4 KKT 条件

参考链接

标签:理论,问题,ge,quad,对偶,nu,lambda
来源: https://www.cnblogs.com/hjd21/p/16601516.html