1. 原始问题、拉格朗日函数与对偶问题

1.1 原始优化问题

考虑一个一般的约束优化问题 : 的定义域交集, 为可行域。设原始问题的最优值(下界)为

1.2 拉格朗日函数

我们引入拉格朗日乘子 ,并构造拉格朗日函数 : 其中,约束要求

1.3 对偶函数

对偶函数 是拉格朗日函数关于 的下确界:

核心性质: 对偶函数 总是凹函数,无论原始问题 是否是凸的。

1.4 对偶优化问题

对偶问题 是最大化对偶函数: 设对偶问题的最优值(上界)为


2. 上下界的关系:弱对偶性

“上下界在优化点相等的特性”的基础是弱对偶性。

2.1 弱对偶性定理

对于任何优化问题(凸或非凸),原始最优值 总是大于或等于对偶最优值

推导证明:

是原始问题的可行解, 是对偶问题的可行解(即 )。

  1. 由于 是可行解,我们有
  2. 由于 ,因此

考虑拉格朗日函数:

现在,根据对偶函数的定义,它是关于 的下确界: 由于 中的一个点,显然:

结合上述两个不等式:

由于这个关系对所有原始可行解 和所有对偶可行解 都成立,我们可以对左边取上确界(对偶问题),对右边取下确界(原始问题):

弱对偶性总是成立的,它意味着对偶问题提供了一个原始问题最优值的下界


3. 优化点相等的特性:强对偶性

强对偶性是“上下界在优化点相等”的特性。

3.1 强对偶性定理

定义: 如果 ,则称原始问题和对偶问题之间存在强对偶性

重要性: 在强对偶性成立时:

  1. 对偶问题提供了一个紧致的下界。
  2. 求解对偶问题与求解原始问题是等价的(这通常更容易,因为对偶函数总是凹的)。
  3. 原始最优解 和对偶最优解 之间满足 KKT (Karush-Kuhn-Tucker) 条件

3.2 强对偶性的条件:Slater 条件

对于凸优化问题(即 是凸函数, 是仿射函数),强对偶性成立的充分条件是 Slater 条件

Slater 条件: 存在一个严格可行点 ,使得所有非仿射不等式约束严格满足:

只要满足 Slater 条件,并且原始问题是凸的,我们就保证

3.3 KKT 条件:最优解的充要条件

当强对偶性成立时, 是原始问题的最优解, 是对偶问题的最优解,当且仅当它们满足 KKT 条件:

条件形式化表示意义
1. 可行性 (Primal Feasibility) 必须是原始问题的可行解。
2. 对偶可行性 (Dual Feasibility) 必须是对偶问题的可行解。
3. 互补松弛性 (Complementary Slackness)对于非紧约束 (),其拉格朗日乘子必须为零 ()。
4. 梯度为零 (Stationarity) 使拉格朗日函数达到极小值。

4. 结论:上下界相等的数学意义

“上下界在优化点相等”的特性,即 ,是凸优化理论中最有价值的成果之一。

它意味着:

时, 是原始问题的解, 是对偶问题的解,它们形成一个鞍点 (Saddle Point)

在鞍点处,原始问题的解 使得拉格朗日函数极小化,而对偶乘子 使得拉格朗日函数极大化。强对偶性成立,确保了这种极小化和极大化的顺序可以互换,并且最终的最优值是相同的。