首页 > 代码库 > FPGA机器学习之龙星计划机器学习第十八堂
FPGA机器学习之龙星计划机器学习第十八堂
第十八堂讲的内容是机器视觉。
处理视频信息,理解图像
每个人都有一个手机了。每个人都有相机。
二维图还原三维图。分析面相。自动检视(外星人)。
理解人的表情。
一张图一个故事,如何解析出来就是很大的问题了。
人眼的错觉。
这个是三维感知,它能识别远近,前景后景的
人脸识别。能找到人脸,但是不知道是谁。而且目前做的最好的是清华的研究院做的算法。
评判过程情况。
指纹识别,目前已经很好了。
目前已经有一家公司可以做到3D还原了。
3维度重建。
同一个人,但是变化的太多。这个就是机器视觉的难点。
这里是一个图像转动的过程。
光线的影响,对于机器视觉来说也是很大的影响。
这个是遮挡。影响很大。那就必须有全局理解,局部理解才行。
表情。人的表情还可以。识别动物的话,也需要把蹲握的状态也要能够识别,分离开才行。
形状前景背景都要分离才行。
机器视觉其实就是这么一个过程,中间是很多的特征,然后不同的组合就是不同的事物了。
关键是特征是怎么提取,是什么。
特征的信息量最大了,也需要很稳定,不易受到光线等条件影响。
同一张图,是否能匹配
这个角度很大,提取的特征是不是不受到影响,还是很好的识别。
这个是人的长大变化。机器是否能够提取的特征还是没变化,识别出是同一个人,
这个就更难了。
一个图是比例尺很大的,一个比例尺很小的,角度也不一样,然后找出是比例尺大的哪一个部分。
同一本书的识别。
什么是良好的信息,或者说是特征,是最后一个角,因为只要稍微变化,就有信息变化,容易识别。
阿凡达3D重建的方法,其实从右图的脸上的绿点里标定表情变化。然后映射回到左边的过程。
模型,讲重建方法。
我们希望的是,不同人去过同一个地点,但是角度不同,光线不同。可以融化起来,构建3维度的现实图。
行人检测。
我能力有限,但是我努力学习。这个是机器视觉的情况。路途遥远吧。