首页 > 代码库 > 关于手指提取的文章的调研
关于手指提取的文章的调研
1.Combining Contrast Saliency and Region Discontinuity for Precise Hand Segmentation in Projector-Camera System
2.Global Contrast based Salient Region Detection
首先我们提出几个问题
1.salient和saliency map 是什么?
2.有什么用?
3.在什么情况下用?
salient即显著性,一般指的是人眼及其神经视觉系统本能上感觉显著及突出的一种性质。比如白墙上的黑点即为显著的。
这一概念最初是从神经科学上来的,科学家们研究人类能够快速识别物体的视觉原理时发现,人能够快速的将注意力集中到环境中的部分区域,而对其他区域却视而不见。故将注意力集中的这一区域称为显著性区域或saliency region。
心理学家将人的视觉认识机制分为两种情况:自顶向下的与自底向上的。
自顶向下的认识机制一般发生在有意识的寻找什么的,我们已知大概知道了想寻找的东西,然后慢速的遍历面前的一切进行显著性提取。
而自底向上则相反,一般发生在无意识的情形,我们不知道想要寻找什么,是一种快速的扫描定位到客观上显著的东西。不知道为什么,就是觉得墙上那个黑点好显眼啊这种感觉。
我们知道计算机视觉的算法本来就是为了模拟人类的视觉而存在的,于是根据这两套认识机制,也就发展出了各自的显著性检测方法。
即自底向上的图像显著性检测与自顶向下的图像显著性检测。
前者是数据驱动的,更加快速。往往是通过图像中某区域在颜色、亮度、方向等特征上与其他区域的不同来寻找显著性区域。这方面已经有了很多工作。
而后者是目标驱动的,是根据具体的任务对自底向上方法的结果进行相应调整实现的。
自顶向下又分两种情况,既然说目标是已知的,那么这个已知是如何得到的?怎么知道检测目标的结构和性质的?
一种是人为设定检测目标的性质。比如Canny方法进行边缘检测,这就是已经对边缘(即检测目标)的结构和性质有了深入的理解后才能够实现的。但显然如果我们的目标较为复杂,这种人为设定的方法就不太现实了。
另一种则是通过样本训练,自动的建立显著性区域模型,得到我们感兴趣区域的性质和结构。比如甚至可以在人脸识别中应用该方法。
(同样,手势识别的话也可以应用类似的方法)