boosting和bagging

2024-07-17 00:51:51 224人阅读

首先来说明一下bootstraps：可以把它认为是一种有放回的抽样方法。

bagging：boostraps aggregating（汇总）

boosting：Adaboot （Adaptive Boosting）提示方法

提升（boosting）：在分类问题中，通过改变训练样本的权重，学习多个分类器，并将这些分类器进行线性组合，提高分类的性能。

思想：提示方法就是从弱学习算法出发，反复学习，得到一系列弱分类器（基分类器），然后组合这些弱分类器，构成一个强分类器

1)改变训练数据的概率分布 2）改变数据权值分布。

AdaBoost：1）提高那些未被正确分类的样本权值，降低那些被分类正确的样本权值。这样分类错误的样本就被后来的分类器更大的关注。

2）采用加权多数表决，加大准确率高的分类器权值。

算法步骤：

（1）初始化权值

（2）使用具有权值分布的D_m的训练数据学习，得到基本分类器 G_m(x).

(3) 计算G_m（x）在训练数据集上的分类误差率

（4）计算G_m（x）的系数

（5）更新权值分布（如果分类错误要提高权值，分类正确要降低权值（公式我就不打出来了））

不改变所给的训练数据，而是不断的改变数据的权值分布，使得训练数据在基本分类器的学习中起到不同的作用

（6）循环直到多个分类器都训练完。

（7）构建基本分类器

以后等我学了python，我在自己实现一遍。这是串行的，与之前的分类器的学习训练结果有关。，根据错误率采样。

bagging：

通过使用bootstrap随机选取训练数据集，分类器的训练建模师相互独立的，可以采取并行的方式。

bagging的基础是重复取样，通过产生样本的重复Bootstrap实例作为训练集，每回都是从总的样本随机选取和样本一样大小的数据（不一定一样规模），是有放回的，所以可能有的样本数据会重复出现。但其实就是利用这一点。这样通过增加训练数据的差异性生成有差异性的分类器，提高集成泛化能力。

对于这个的理论分析我就不说了，我他妈看不懂。。

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们