首页 > 代码库 > 关于KKT条件在约束边界的物理意义的思考
关于KKT条件在约束边界的物理意义的思考
学习笔记性质的博文,随时发现错误和疏漏随时修改。
对于有不等式约束的拉格朗日对偶问题,KKT条件可以总结成:约束条件(原始约束和引入拉格朗日乘子后的约束)、对x偏导为0、对偶互补条件
进一步可以理解为:
①对于无约束的变量偏导为0
②对于有约束的变量,在约束边界偏导可以不为0,不在约束边界偏导必为0
其中,不在约束边界的情况提供了函数值的伸缩性,使其取值为一个空间而不是一个点。
对偶互补条件就是对②的数学描述:
其中是原始约束。
对偶互补条件的在约束边界的物理意义:
当不位于原始边界时,它在各个方向是“自由”的,若此时他的偏导不为0,那么它沿着原始问题中的负梯度方向移动时,可取的函数值变小,那么就不可能是解。所以,当不在约束边界时,它必须在极值点上,即:小于0时必为0
当位于原始边界,即等于0时,它在边界上的移动不会改变函数值,所以它的偏导取合适的值来进一步减小函数值,即它的偏导可取大于0的值。
通过物理意义来理解KKT在边界的行为,会显得比较直观。
由此,SVM中的硬间隔最大化可由物理意义来直观的理解:
硬间隔最大化问题中,不等式约束为点的函数距离大于等于1。位于间隔边界的点(支持向量),相当于位于约束边界,他们的偏导可以不为0。而位于间隔边界之后的点,它们不在约束边界上,此时要想使间隔最大化,必须使的偏导为0,否则在负梯度方向上查找必能找到更优解。
对于SVM的软间隔最大化,由于支持向量不光是间隔边界上的点,还包括间隔平面之间的点,此时松弛变量的偏导同时也由惩罚参数决定,松弛变量的偏导的符号转换为与的大小关系。通过分析,以下结论不难得到:
参考资料:《统计学习方法》李航
关于KKT条件在约束边界的物理意义的思考