分布式计算、统计学习与ADMM算法

首页 > 代码库 > 分布式计算、统计学习与ADMM算法

分布式计算、统计学习与ADMM算法

2024-08-16 16:12:45 222人阅读

在整理旧电脑时，才发现13年下半年电脑里有不少残文。老师说，东西搁下了再拿起来花费的时间和之前可能差不多。我一眼看过去这篇关于分布式计算的文章，貌似还真的没有了当时理解的深度和感觉。当时还想利用ADMM算法，把统计中常见的带惩罚的高维问题在此框架下用R重写一下，但是中途多种事情一耽搁，就早已抛之脑后。看来任何事情，真的还是需要坚持，哪怕拨点时间都是好的。先把一篇残文扔出来祭奠下过去的13年吧。公式多文字长，慎入！

业界一直在谈论大数据，对于统计而言，大数据其实意味着要不是样本量增加

1. 优化的一些基本算法思想

ADMM算法并不是一个很新的算法，他只是整合许多不少经典优化思路，然后结合现代统计学习所遇到的问题，提出了一个比较一般的比较好实施的分布式计算框架。因此必须先要了解一些基本算法思想。

1.1 Dual Ascent

对于凸函数的优化问题，对偶上升法核心思想就是引入一个对偶变量，然后利用交替优化的思路，使得两者同时达到optimal。一个凸函数的对偶函数其实就是原凸函数的一个下界，因此可以证明一个较好的性质：在强对偶性假设下，即最小化原凸函数（primal）等价于最大化对偶函数（dual），两者会同时达到optimal。这种转化可以将原来很多的参数约束条件变得少了很多，以利于做优化。具体表述如下：

minf(x)

s.t.Ax=b ?L(x,y)=f(x)+yT(Ax?b)?对偶函数（下界）g(y)=infL(x,y)

\begin{array}{lc} min & f (x) \\ s . t . & A x = b \end{array} ⟹ L (x, y) = f (x) + y^{T} (A x - b) \overset{对 偶 函 数 （ 下 界 ）}{⟹} g (y) = inf_{x} L (x, y)

在强对偶性的假设下，primal和dual问题同时达到最优。

x^{⋆} = \arg min_{x} L (x, y^{⋆})

因此，若对偶函数

\begin{aligned} x^{k + 1} : & = \arg min_{x} L (x, y^{k}) (x -最小化步) \\ y^{k + 1} : & = y^{k} + α^{k} \nabla g (y) = y^{k} + α^{k} (A x^{k + 1} - b) (对偶变量更新， α^{k} 是步长) \end{aligned}

当

分布式计算、统计学习与ADMM算法

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 分布式计算、统计学习与ADMM算法