1. 原始问题、拉格朗日函数与对偶问题
1.1 原始优化问题
考虑一个一般的约束优化问题 : 设 为 的定义域交集, 为可行域。设原始问题的最优值(下界)为 :
1.2 拉格朗日函数
我们引入拉格朗日乘子 和 ,并构造拉格朗日函数 : 其中,约束要求 。
1.3 对偶函数
对偶函数 是拉格朗日函数关于 的下确界:
核心性质: 对偶函数 总是凹函数,无论原始问题 是否是凸的。
1.4 对偶优化问题
对偶问题 是最大化对偶函数: 设对偶问题的最优值(上界)为 :
2. 上下界的关系:弱对偶性
“上下界在优化点相等的特性”的基础是弱对偶性。
2.1 弱对偶性定理
对于任何优化问题(凸或非凸),原始最优值 总是大于或等于对偶最优值 :
推导证明:
设 是原始问题的可行解, 是对偶问题的可行解(即 )。
- 由于 是可行解,我们有 和 。
- 由于 ,因此 且 。
考虑拉格朗日函数:
现在,根据对偶函数的定义,它是关于 的下确界: 由于 是 中的一个点,显然:
结合上述两个不等式:
由于这个关系对所有原始可行解 和所有对偶可行解 都成立,我们可以对左边取上确界(对偶问题),对右边取下确界(原始问题):
弱对偶性总是成立的,它意味着对偶问题提供了一个原始问题最优值的下界。
3. 优化点相等的特性:强对偶性
强对偶性是“上下界在优化点相等”的特性。
3.1 强对偶性定理
定义: 如果 ,则称原始问题和对偶问题之间存在强对偶性。
重要性: 在强对偶性成立时:
- 对偶问题提供了一个紧致的下界。
- 求解对偶问题与求解原始问题是等价的(这通常更容易,因为对偶函数总是凹的)。
- 原始最优解 和对偶最优解 之间满足 KKT (Karush-Kuhn-Tucker) 条件。
3.2 强对偶性的条件:Slater 条件
对于凸优化问题(即 是凸函数, 是仿射函数),强对偶性成立的充分条件是 Slater 条件:
Slater 条件: 存在一个严格可行点 ,使得所有非仿射不等式约束严格满足:
只要满足 Slater 条件,并且原始问题是凸的,我们就保证 。
3.3 KKT 条件:最优解的充要条件
当强对偶性成立时, 是原始问题的最优解, 是对偶问题的最优解,当且仅当它们满足 KKT 条件:
| 条件 | 形式化表示 | 意义 |
|---|---|---|
| 1. 可行性 (Primal Feasibility) | 必须是原始问题的可行解。 | |
| 2. 对偶可行性 (Dual Feasibility) | 必须是对偶问题的可行解。 | |
| 3. 互补松弛性 (Complementary Slackness) | 对于非紧约束 (),其拉格朗日乘子必须为零 ()。 | |
| 4. 梯度为零 (Stationarity) | 使拉格朗日函数达到极小值。 |
4. 结论:上下界相等的数学意义
“上下界在优化点相等”的特性,即 ,是凸优化理论中最有价值的成果之一。
它意味着:
当 时, 是原始问题的解, 是对偶问题的解,它们形成一个鞍点 (Saddle Point):
在鞍点处,原始问题的解 使得拉格朗日函数极小化,而对偶乘子 使得拉格朗日函数极大化。强对偶性成立,确保了这种极小化和极大化的顺序可以互换,并且最终的最优值是相同的。