首页 > 代码库 > 自问自答 学习系列(1):从图像分类,到损失函数,到神经网络

自问自答 学习系列(1):从图像分类,到损失函数,到神经网络

1.图像分类的挑战:

  • 视角变化(Viewpoint variation:同一个物体,摄像机可以从多个角度来展现。
  • 大小变化(Scale variation:物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
  • 形变(Deformation:很多东西的形状并非一成不变,会有很大变化。
  • 遮挡(Occlusion:目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
  • 光照条件(Illumination conditions:在像素层面上,光照的影响非常大。
  • 背景干扰(Background clutter:物体可能混入背景之中,使之难以被辨认。
  • 类内差异(Intra-class variation:一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。
2.Nearest Neighbor 分类器和 K-Nearest Neighbor分类器的 原理公式 以及区别,联系
KNN是寻找K个相似的图片的标签。分别投票,选出最相似的标签。
L1  L2 
3.交叉验证的到 htperparameter的原理:
数据只有1000个,我们分成5分,用其中4分训练,剩下的一份来验证,如此循环。
4.NN分类器的优缺点
优点:易于理解,实现简单,测试耗费时间长。因为要与测试的每一张图片进行比较。 将所有的数据都存储起来,过于浪费资源。
5.基于 4的优缺点,我们提出了使用Score function 和 Loss function 来进行图像分类,将图像分类变成一个最优化问题,这是如何实现的?
关键点 :将图像到标签值的参数化映射,也就是 Score function ,一个线性得分函数:技术分享
6.小知识点:将权重和偏置参数合并的技术:技术分享

 

自问自答 学习系列(1):从图像分类,到损失函数,到神经网络