【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

首页 > 代码库 > 【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

2024-07-05 20:29:55 230人阅读

GML AdaBoost Matlab Toolbox是一款非常优秀的AdaBoost工具箱，内部实现了Real AdaBoost, Gentle AdaBoost和Modest AdaBoost三种方法。

AdaBoost的训练和分类的结构都是相似的，可以参考前一篇《Boosting》，只简介一下GML。GML内部弱分类器使用的CART决策树。决策树的叶子表示决策，内部每个分支都是决策过程。从根部开始，每个决策结果指向下一层决策，最后到达叶子，得到最终的决策结果。一个比较简单的示意如下图所示：

对于特征{x1,x2,x3}值为{4,-1,2}的样本，上图决策树的最终决策为y=-1，而对于{3,-2,3}的样本预测值为+1。
工具箱中CART根的构造算法如下：

1. 对于n为特征的每个维度，分别找到阈值使得分类错误率最小
2. 选择错误率最小的第i维构造根节点：
a) 预测xi>Θ
b) 分别构造true/false子树分支，各自的分类结果作为叶子

在树中移动并最终到达叶子，我们把得到的预测结果错误分类一个样本的概率作为“树叶的错误率”。整颗决策树的构造使用如下规则：

1. 构造根节点
2. 选择错误率最小的叶子
3. 仅适用于和所选叶子相关的训练数据构造节点
4. 使用构造的节点代替所选的叶子
5. 重复2-4步直到所有的叶子错误率为0，或者到达循环结束的循环次数。

事实上，工具箱使用中，CART树的构造过程只有树深一个可调参数，使用：

function tree_node = tree_node_w(max_splits)

函数初始化最大树深，之后就是将构造的弱分类器传给相应的AdaBoost函数。以下是一个使用示例：

% Step1: reading Data from the file
clear
clc
file_data = http://www.mamicode.com/load(‘Ionosphere.txt‘);>
以上代码构造深度为3的CART决策树作为弱分类器，分别使用GentleAdaBoost，ModestAdaBoost和RealAdaBoost迭代200次训练AdaBoost分类器。以上代码直接使用MaxIter调用函数训练与下面方法是等价的：
% Step4: iterativly running the training
for lrn_num = 1 : MaxIter
    clc;
    disp(strcat(‘Boosting step: ‘, num2str(lrn_num),‘/‘, num2str(MaxIter)));
    %training gentle adaboost
    [GLearners GWeights] = GentleAdaBoost(weak_learner, TrainData, TrainLabels, 1, GWeights, GLearners);
    %evaluating control error
    GControl = sign(Classify(GLearners, GWeights, ControlData));
    GAB_control_error(lrn_num) = GAB_control_error(lrn_num) + sum(GControl ~= ControlLabels) / length(ControlLabels);
    %training real adaboost
    [RLearners RWeights] = RealAdaBoost(weak_learner, TrainData, TrainLabels, 1, RWeights, RLearners);
    %evaluating control error
    RControl = sign(Classify(RLearners, RWeights, ControlData));
    RAB_control_error(lrn_num) = RAB_control_error(lrn_num) + sum(RControl ~= ControlLabels) / length(ControlLabels);
    %training modest adaboost
    [NuLearners NuWeights] = ModestAdaBoost(weak_learner, TrainData, TrainLabels, 1, NuWeights, NuLearners);
    %evaluating control error
    NuControl = sign(Classify(NuLearners, NuWeights, ControlData));
    MAB_control_error(lrn_num) = MAB_control_error(lrn_num) + sum(NuControl ~= ControlLabels) / length(ControlLabels);
end
但是第二段代码每次显示使用了上一次的训练结果，实际运行速度更快。

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经允许请勿用于商业用途）

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

【模式识别】CART和GML AdaBoost MATLAB TOOLBOX

（转载请注明作者和出处：http://blog.csdn.net/xiaowei_cqu 未经允许请勿用于商业用途）

看完仍有疑问？有类似问题直接问程序猿