用DPM(Deformable Part Model，voc-release4.01)算法在INRIA数据集上训练自己的人体检测模型

2024-07-14 14:36:20 221人阅读

步骤一，首先要使voc-release4.01目标检测部分的代码在windows系统下跑起来：

参考在window下运行DPM(deformable part models) -（检测demo部分）

步骤二，把训练部分代码跑通，在VOC数据集上进行测试，如下文：

在windows下运行Felzenszwalb的Deformable Part Model(DPM)源码voc-release3.1来训练自己的模型

但是其中的learn.cpp代码有误，其中319行check(argc == 8)通不过，因为matlab中传入的参数多于8个，故learn.cpp文件源码参考：

在windows下训练models of Object Detection with Discriminatively Trained Part Based Models

步骤三，再之后就是使之能在其他的数据集上训练模型，比如INRIA人体数据集。

这一步中主要是修改pascal_data.m文件，这个文件的作用就是读取标注，为训练准备数据。此函数会返回两个数组，pos[]和neg[]，

pos[]中是正样本信息，格式为：[imagePath x1 y1 x2 y2 ]；

neg[]中是负样本信息，格式为：[imagePath] 。

先读取INRIA数据集的标注，保存为下面的格式：（统一存入一个txt文档如“InriaPersonPos.txt”, 此外windows下用‘\’而不要用‘/‘, 这里有问题）

然后在pascal_data.m中读取此文件，依次将标注信息保存到pos[]数组中，注意要将图片路径补全为绝对路径。

[html] view plaincopy

pos = []; % 存储正样本目标信息的数组，每个元素是一个结构，{im, x1, y1, x2, y2}
numpos = 0; % 正样本目标个数(一个图片中可能含有多个正样本目标)
% InriaPersonPos.txt是从Inria人体数据集获得的50个正样本的标注文件，格式为[x1 y1 x2 y2 RelativePath]
[a,b,c,d,p] = textread(‘InriaPersonPos.txt‘,‘%d %d %d %d %s‘); % 注意：读取后p的类型时50*1的cell类型
% 遍历训练图片文件名数组ids
for i = 1:length(a);
if mod(i,10)==0
fprintf(‘%s: parsing positives: %d/%d\n‘, cls, i, length(a));
end;
numpos = numpos+1; % 正样本目标个数
pos(numpos).im = [VOCopts.datadir p{numpos}]; % 引用cell单元时要用{},引用矩阵单元时用()
pos(numpos).x1 = a(numpos);
pos(numpos).y1 = b(numpos);
pos(numpos).x2 = c(numpos);
pos(numpos).y2 = d(numpos);
end