首页 > 代码库 > 【计算机视觉】OpenCV中直方图处理函数简述

【计算机视觉】OpenCV中直方图处理函数简述

计算直方图calcHist

直方图是对数据集合的统计 ,并将统计结果分布于一系列提前定义的bins中。这里的数据不只指的是灰度值 ,统计数据可能是不论什么能有效描写叙述图像的特征。
如果有一个矩阵包括一张图像的信息 (灰度值 0-255):

技术分享
gray

既然已知数字的范围包括256个值, 我们能够将这个范围切割成子区域(称作 bins),如:

技术分享
bins

然后再统计掉入每个bin_{i}的像素数目。採用这一方法来统计上面的数字矩阵,我们能够得到下图( x轴表示 bin, y轴表示各个bin中的像素个数)。

技术分享
hist1

直方图能够统计的不不过颜色灰度,它能够统计不论什么图像特征(如梯度,方向等等)。

直方图详细细节

dims: 须要统计的特征的数目,在上例中,dims = 1由于我们只统计了灰度值(灰度图像)
bins: 每一个特征空间子区段的数目,在上例中,bins = 16
range: 每一个特征空间的取值范围,在上例中,range = [0,255]

OpenCV的直方图计算

OpenCV提供了一个简单的计算数组集(一般是图像或切割后的通道)的直方图函数calcHist。支持高达32维的直方图。

void calcHist(
const Mat* arrays,            // 图像源数组,相同深度(CV_8U or CV_32F),相同大小
int narrays,                 // 图片个数
const int* channels,         // 通道
InputArray mask,             // 掩码图像
OutputArray hist,             // 返回的直方图
int dims,                     // 直方图的维数
const int* histSize,         // 每一维上直方图的个数
const float** ranges,        // 像素值的范围
bool uniform=true, 
bool accumulate=false );

说明:

channels - 用来计算直方图的channels的数组
mask - 掩码。假设mask不为空,那么它必须是一个8位(CV_8U)的数组,而且它的大小的和arrays[i]的大小同样,值为1的点将用来计算
dim - 直方图的维数。必须为正,而且不大于CV_MAX_DIMS(当前的OpenCV版本号中为32,即最大能够统计32维的直方图)
histSize - 在每一维上直方图的个数。简单把直方图看作一个一个的竖条的话,就是每一维上竖条的个数
ranges - 用来进行统计的范围

反投影直方图

反向投影是一种记录给定图像中的像素点怎样适应直方图模型像素分布的方式。
简单的讲,所谓反向投影就是首先计算某一特征的直方图模型,然后使用模型去寻找图像中存在的该特征。

void calcBackProject(
const Mat* arrays, 
int narrays, 
const int* channels, 
InputArray hist, 
OutputArray backProject, 
const float** ranges, 
double scale=1, bool uniform=true );

hist - 输入直方图
backProject - 反投影向量,这是一个单通道的向量,和arrays[0]具有同样的大小和深度

以下使用肤色直方图为例来解释反向投影的工作原理:
使用模型直方图(代表手掌的皮肤色调)来检測測试图像中的皮肤区域,

  • 对測试图像中的每一个像素 ( p(i,j) ),获取色调数据并找到该色调( h(i,j), s(i,j) )在直方图中的bin的位置
  • 查询 模型直方图 中相应的bin( h(i,j), s(i,j) )并读取该bin的数值
  • 将此数值储存在新的图像中(BackProjection)。 你也能够先归一化 模型直方图 ,这样測试图像的输出就能够在屏幕显示了
  • 通过对測试图像中的每一个像素採用以上步骤, 得到 BackProjection 结果图
    技术分享
    backProjection
  • 使用统计学的语言, BackProjection 中储存的数值代表了測试图像中该像素属于皮肤区域的概率。比方以上图为例, 亮起的区域是皮肤区域的概率更大(事实确实如此),而更暗的区域则表示更低的概率

阈值化

阈值是最简单的图像切割的方法。
应用举例:从一副图像中利用阈值切割出我们须要的物体部分(当然这里的物体能够是一部分或者总体)。这种图像切割方法是基于图像中物体与背景之间的灰度差异,并且此切割属于像素级的切割。
为了从一副图像中提取出我们须要的部分,应该用图像中的每个像素点的灰度值与选取的阈值进行比較,并作出对应的推断。(注意:阈值的选取依赖于详细的问题。即:物体在不同的图像中有可能会有不同的灰度值。)
一旦找到了须要切割的物体的像素点,我们能够对这些像素点设定一些特定的值来表示。(比如:能够将该物体的像素点的灰度值设定为:‘0’(黑色),其它的像素点的灰度值为:‘255’(白色);当然像素点的灰度值能够随意,但最好设定的两种颜色对照度较强,方便观察结果)。

技术分享
Threshold_Example

阈值类型

技术分享
Threshold Type 1
技术分享
Threshold Type 2
技术分享
Threshold Type 3
技术分享
Threshold Type 4
技术分享
Threshold Type 5

阈值API

double threshold(
InputArray src, 
OutputArray dst, 
double thresh, 
double maxVal, 
int thresholdType);

均值漂移(Mean Shift)算法函数

该函数利用了迭代物体搜索算法,它要以一个物体的反射直方图(back projection)和初始位置作为输入。
搜索窗体的重心向反射直方图的质心(mass center)移动,该过程不断的反复,直到达到了迭代的次数(criteria.maxCount),或者窗体中心小于一个阈值(criteria.epsilon)。

int meanShift(
InputArray probImage,         // Back projection of the object histogram
Rect& window,                 // Initial search window
TermCriteria criteria        // Stop criteria for the iterative search algorithm.
);

Camshift算法函数

该函数首先利用meanShift()函数找到物体的中心,然后调整窗体的大小并找到最优的旋转角度。该函数返回一个rotated rectangle数据结构(包括物体的位置,大小和旋转角度)。下一次搜索窗体的位置能够通过RotatedRect::boundingRect()得到。

RotatedRect CamShift(
InputArray probImage,         // Back projection of the object histogram
Rect& window,                 // Initial search window
TermCriteria criteria        // Stop criteria for the underlying meanShift()
);

TermCriteria模板类

该类是作为迭代算法的终止条件使用的,其构造函数须要三个參数:一个是类型,第二个參数为迭代的最大次数,最后一个是特定的阈值。

TermCriteria(int type, int maxCount, double epsilon);

类型有CV_TERMCRIT_ITER、CV_TERMCRIT_EPS、CV_TERMCRIT_ITER+CV_TERMCRIT_EPS,分别代表着迭代终止条件为达到最大迭代次数终止,迭代到阈值终止,或者两者都作为迭代终止条件。

參考资料

OpenCV Histograms API文档
直方图之calcHist使用
直方图之calcHist使用(补)
OpenCV 教程 imgproc模块
反向投影
阈值操作

转载请注明作者Jason Ding及其出处
Github主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)

【计算机视觉】OpenCV中直方图处理函数简述