首页 > 代码库 > 计算机视觉之一:特征检测

计算机视觉之一:特征检测

计算机视觉之一:特征检测

 

主要内容:

1、一个例子解释为什么要进行特征检测

2、图像特征

3、点特征检测:Harris角点、MOPS、SIFT

4、边缘检测:一阶微分算子、二阶微分算子、Canny算子

 

一、为什么要检测特征?

举一个例子:全景图像拼接,给定两张图像,如何拼接成一张大图?

image_thumb2

步骤一:检测特征点

image_thumb5

步骤二:匹配特征点

image_thumb91

步骤三:图像适配

image_thumb13

二、图像的特征有哪些?

计算机视觉中常用的图像特征包括:点、边缘、直线、曲线等

image22_thumb1

三、点特征检测

1、点特征的优势:

点特征属于局部特征,对遮挡有一定鲁棒性;

通常图像中可以检测到成百上千的点特征,以量取胜;

点特征有较好的辨识性,不同物体上的点容易区分;

点特征提取通常速度很快;

2、什么是好的点特征?

image30_thumb1

考虑图像上的一个小窗口,当窗口位置发生微小变化时,窗口图像如何变化?

很明显,从下图可以看出,角点是一个好的点特征,因为它沿任意方向移动,窗口的灰度变化明显,所以它可以作为一个特征来进行区分和辨别

image331_thumb

3、点特征的数学表达

      image391_thumb

  • 假设窗口W发生位置偏移(u,v);
  • 比较偏移前后窗口中每一个像素点的灰度变化值;
  • 使用误差平方和定义误差函数E(u,v)

          image36_thumb

       不同位置点计算得到的E(u,v)如下图所示,E(u,v)值随着u、v变化的效果图,可以看出,平坦区域(如天空)的灰度变化不大(下图3),边缘区域沿着边缘方向的灰度变化.

也很小(下图2),只有角点处的灰度变化稍微剧烈一点(下图1)

image42_thumb

  误差函数E(u,v):

image45_thumb1

将I(u,v)进行Taylor展开:

image48_thumb1

进一步展开,写成:

image511_thumb

image64_thumb1

H称为自相关矩阵,image57_thumbimage60_thumb是H的2个特征值,E(u,v)的变化如下图所示:

image67_thumb1

根据H的2个特征值大小对图像点进行分类:

image70_thumb

角点应该满足的基本性质:最小特征值尽量大

角点响应:image77_thumb

image81_thumb更有效的角点响应函数:

image841_thumb1

image871_thumb1

image90_thumb2

四、点特征检测:Harris角点

  • 算法步骤:

  1. 将原图像I使用w(x,y)进行卷积,并计算图像梯度Ix与Iy;
  2. 计算每个图像点的自相关矩阵H;
  3. 计算角点响应image93_thumb
  4. 选择R大于阈值且为局部极大值的点作为角点。

image96_thumbimage991_thumb

image102_thumbimage1051_thumbimage1081_thumbimage111_thumb

  • Harris角点改进:

Harris检测子获得的角点可能在图像上分布不均匀(对比度高的区域角点多)

改进方法:Adaptive non-maximal suppression(ANMS),只保留半径r内角点响应比其他点大10%的点作为角点。(Brown,Szeliski and Winder,2005)

image1_thumb

  • Harris角点的性质:

1.   旋转不变:

image411_thumb

椭圆转过一定角度但是其形状保持不变(特征值保持不变)

2.   光照变化不变:

image7_thumb

image1011_thumb只使用了图像导数,对于光照线性变化不变

3.   对比度变化部分不变:

image13_thumb

4.   对于图像尺度变化不具有不变性:

image16_thumb

五、点特征检测:MOPS

MOPS:Multi-scale oriented patches

尺度不变:在多层图像金字塔上检测角点,在同一层进行匹配

MOPS局限:待匹配的图像需要尺度近似

image26_thumb

六、点特征检测:SIFT

Scale Invariant Feature Transform (SIFT)(Lowe,2004)

主要内容:

1.SIFT算法特点

2.SIFT算法流程

3.SIFT算法的具体步骤

4.SIFT点的特点

 

1、SIFT算法的特点:

  • 不变性:

——对图像的旋转和尺度变化具有不变性;

——对三维视角变化和光照变化具有很强的适应性;

——局部特征,在遮挡和场景杂乱时仍保持不变性;

  • 辨别力强:

——特征之间相互区分的能力强,有利于匹配;

  • 数量较多:

——一般500*500的图像能提取约2000个特征点。

2、SIFT算法的流程:

在高斯差分(Difference of Gaussian,DOG)尺度空间中提取极值点并进行优化,从而获取特征点。

image3011_thumb

3、SIFT算法点检测的具体步骤:

——构建尺度空间;

——构造高斯差分尺度空间;

——DoG尺度空间极值点检测;

——特征点精确定位;

——去除不稳定点;

  • 构建尺度空间:模拟图像数据的多尺度特征

         image33_thumb

其中image361_thumb是尺度可变高斯函数

image39_thumb

尺度参数image421_thumb决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征

  • 构造高斯差分尺度空间(Difference of Gaussian,DOG)

为了在尺度空间中检测稳定的关键点,构造高斯差分尺度空间

image4511_thumb

使用DOG的几个理由:

          1.   计算效率高:高斯卷积,减法;

   2.   高斯差分是对尺度归一化LoGimage4811_thumb的一个很好的近似,而尺度归一化的LoG空间具有真正的尺度不变性(Lindegerg 1994);

   3.  实验比较表明,从尺度归一化LoG空间中提取的图像特征的尺度稳定性最好,优于梯度、Hessian或Harris角点函数。

image51_thumb1

image54_thumb1

DoG尺度空间:

image571_thumb1

image601_thumb1

  • DoG尺度空间极值点检测:

一个点和它同尺度的8个相邻点以及上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。
一个点如果在DOG尺度空间的26个领域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点。
一个特征点是在三维尺度空间image63_thumb的局部极值点。

  • 特征点精确定位:

一个特征点是在三维尺度空间image66_thumb的局部极值点。但(x,y)为整数像素,image_thumb28为离散尺度,需要对DoG空间拟合进行特征点精确定位。

image72_thumb的特征点image75_thumb处二阶Taylor展开:

image78_thumb

对上式求导,并令其为0,得到精确的位置(偏移量):

image811_thumb

image84_thumb1中的三个变量任意一个偏移量大于0.5,说明精确极值点更接近于另一个特征点,则更换特征点重复上述精确定位流程。

  • 去除不稳定特征点:

——去除对比度低的点:

计算极值点取值image87_thumb1,若image9011_thumb,则保留该特征点,否则丢弃。

——去除边缘点:

DoG算子会产生较强的边缘响应,利用Harris检测子判断。

image931_thumb

image961_thumb,则保留该特征点,否则丢弃。

image99_thumb3image1021_thumb3

4、SIFT点的特点:

  • 视角和旋转变化不变性:

image105_thumb2image108_thumb2

  • 光照不变性:

image1111_thumb3

  • 尺度不变性:

image114_thumb3

七、点特征检测:小结

  • 根据自相关矩阵特征值检测角点(Harris); Harris角点具有旋转、光照不变性,但不具有尺度不变性。
  • 高斯差分尺度空间中检测尺度不变特征点(SIFT); SIFT具有尺度不变性。
  • Harris与SIFT的机理不同,因此可以联合使用,互为补充。

八、边缘检测

主要内容:

1.图像梯度

2.一阶微分算子

3.二阶微分算子

4.Canny算子

1、为什么要检测边缘?

一个例子:基于边缘的图像编辑

image_thumb89

2、图像边缘的产生

物体的边界、表面方向的改变、不同的颜色、光照明暗的变化

image_thumb90

3、边缘检测——图像梯度

图像梯度的定义:image_thumb91[1]   image_thumb92

水平梯度:image_thumb93

垂直梯度:image_thumb94

图像梯度指向灰度变化最快的方向:image_thumb95

梯度幅值表示边缘的强弱:image_thumb96

边缘是一阶倒数的极大值点:

image_thumb97

4、边缘检测——一阶微分算子

使用差分近似一阶微分算子:

image_thumb98

直接对图像使用差分容易受到噪声影响:

image_thumb99

解决方法:先平滑,再微分

image_thumb100

image_thumb101,可将平滑和微分合为一个算子

image_thumb102

二维高斯微分:

实际应用中:对二维高斯微分进行数值近似:Prewitt算子、Sobel算子

image_thumb103

Prewitt算子:去噪+ 增强边缘

image_thumb104

Sobel算子:去噪+ 增强边缘(给四邻域更大的权重)

image_thumb105

使用一阶微分算子提取边缘流程:
1. 使用Prewitt或Sobel算子对图像进行卷积;
2. 将梯度幅值大于阈值的点标记为边缘;
3. (optional)将边缘细化为一个像素宽度。

image_thumb106

5、边缘检测——二阶微分算子

如果不使用细化,如何获得单像素宽度边缘?

image_thumb107

边缘是一阶倒数的极大值点

image_thumb108

边缘是二阶倒数的过零点
注意:仅仅等于0不够,常数函数也为0,必须存在符号改变

image_thumb109

对平滑图像做二阶微分:image_thumb110

image_thumb111

二维高斯微分:

image_thumb112

Laplacian of Gaussian (LoG)算子:首先用Gauss函数对图像进行平滑,抑制噪声,然后对经过平滑的图像使用Laplacian算子
LoG算子等效于:Gaussian平滑+ Laplacian二阶微分

LoG因其形状,也称为Mexican hat

image_thumb113

LoG算子与一阶微分算子的比较:

image_thumb115

LoG算子的特点:
? 正确检测到的边缘:单像素宽度,定位准确;
? 形成许多封闭的轮廓,这是一个主要问题;
? 需要更加复杂的算法检测过零点。

6、边缘检测——Canny算子

  • Canny算子是最常用的边缘检测算子
  • Canny算子是一阶微分算子,但是一个优化的方案
    -单像素宽度
    -噪声抑制
    -边缘增强
    -边缘定位
    J.Canny, “A Computational Approach to Edge Detection”, IEEE Trans. on PAMI, 8(6),1986.
    18482 cites
  • Canny算子基本流程

image_thumb116

(1)高斯平滑滤波器卷积

image_thumb117

(2)使用一阶有限差分计算偏导数的两个阵列

image_thumb118

相当于与模板进行卷积运算:image_thumb119

当然也可以使用高斯微分算子(Prewitt或Sobel)直接与image_thumb120卷积计算image_thumb121image_thumb122

(3)边缘幅值和边缘方位角

image_thumb123

M代表梯度幅值的大小,在存在边缘的图像位置处,
M的值变大,图像的边缘特征被“增强”。

(4)梯度非极大值抑制

局部极值周围存在相近数值的点:

image_thumb124

非极大值抑制(NMS:Non-Maxima Suppression)
主要思想:

由梯度幅值图像image_thumb125,仅保留极大值(严格地说,保留梯度方向上的极大值点)。

具体过程:

1.初始化image_thumb126

2.对于每个点,在梯度方向和反梯度方向各找n个像素点。若image_thumb127不是这些点中的最大点,则将image_thumb128置零,否则保持image_thumb129不变。

image_thumb130

  • 在梯度方向的沿线上检测该点是否为局部极大值;
  • 简化的情形,只使用4个方向:【0,45,90,135】;
  • 得到的结果image_thumb131包含边缘的宽度为1个像素;

(5)对NMS结果进行阈值二值化—双阈值检测

  • 使用大的阈值,得到:
    -少量的边缘点
    -许多空隙
  • 使用小的阈值,得到:
    -大量的边缘点
    -大量的错误检测

两个阈值T1,T2:T2 >> T1

由T1得到image_thumb132,低阈值边缘图:更大的误检测率
由T2得到image_thumb133,高阈值边缘图:更加可靠

image_thumb134

(6)边缘连接
1. 将image_thumb135中相连的边缘点输出为一幅边缘图像image_thumb136
2. 对于image_thumb137中每条边,从端点出发在image_thumb138中寻找其延长的部分,直至image_thumb139与中另外一条边的端点相连,否则认为image_thumb140中没有它延长的部分;
3. 将image_thumb141作为结果输出。

Canny算子流程效果图:

image_thumb142

image_thumb143

image_thumb144

? Canny算子的优点
-参数较少
-计算效率
-得到的边缘连续完整
? 参数的选择
-Gauss滤波的尺度
-双阈值的选择(LOW=HIGH*0.4)

image_thumb145

image_thumb146

Canny算子的处理效果:

image_thumb147

image_thumb148

九、总结

? 根据自相关矩阵特征值检测角点(Harris);
? 高斯差分尺度空间中检测尺度不变特征点(SIFT);
? 一阶高斯微分算子(Prewitt、Sobel)极值检测边缘;
? 二阶高斯微分算子(LoG)过零点检测边缘;
? 非极大值抑制+双阈值检测边缘(Canny)。

十、特征检测参考文献

? Harris, C. and Stephens, M. J. A combined corner and edge detector. In Alvey Vision Conference, 1988.
? Lowe, D. G. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 60(2):91–110, 2004.
? Canny, J. A computational approach to edge detection. IEEE Transactions onPAMI, 8(6):679–698, 1986.
? Tuytelaars, T. and Mikolajczyk, K. Local Invariant Feature Detectors: A Survey. Foundations and Trends in Computer Graphics and Vision, 3(3): 177–280, 2007.