首页 > 代码库 > 对偶SVM

对偶SVM

1.对偶问题的推导

为什么要求解对偶问题?一是对偶问题往往更容易求解,二是可以自然的引入核函数。

1.1 用拉格朗日函数将原问题转化为“无约束”等价问题

原问题是:

技术分享

写出它的拉格朗日函数:

技术分享

然后我们的原问题就等价为:

技术分享

为什么可以这样等价:

技术分享

即:对于不满足约束条件的(b,w),min里面趋于无穷大,因此min就把这些b,w舍去了;对于满足约束条件的解,min里面就刚好是原来的目标函数,刚好与原问题等价。

 

1.2 导出拉格朗日对偶问题

首先我们有如下成立:

技术分享

然后我们取右边式子中的“best”阿尔法,仍然会有大于等于号成立,因为best is one of any:

技术分享

这时右边的式子就是对偶问题。这里直接给出一个定理,当满足下面条件时(对于SVM来说刚好满足),原始问题和对偶问题的解是相同的:

技术分享

并且它们的最优解满足KKT条件:

 

1.3 用KKT条件来简化对偶问题

我们的对偶问题现在是:

 技术分享

根据KKT条件,我们有:

技术分享

技术分享

把第一个代进来:

技术分享

再把第二个代进来:

技术分享

这时候,我们的问题里面就只剩一个参数阿尔法了。再把平方项展开,写的好看一点,就得到了标准的硬间隔SVM对偶问题:

技术分享

 

2. 解对偶问题

还是解QP那一套:

 

对偶SVM