自问自答学习系列（1）：从图像分类，到损失函数，到神经网络

2024-08-13 16:34:47 211人阅读

1.图像分类的挑战：

视角变化（Viewpoint variation）：同一个物体，摄像机可以从多个角度来展现。
大小变化（Scale variation）：物体可视的大小通常是会变化的（不仅是在图片中，在真实世界中大小也是变化的）。
形变（Deformation）：很多东西的形状并非一成不变，会有很大变化。
遮挡（Occlusion）：目标物体可能被挡住。有时候只有物体的一小部分（可以小到几个像素）是可见的。
光照条件（Illumination conditions）：在像素层面上，光照的影响非常大。
背景干扰（Background clutter）：物体可能混入背景之中，使之难以被辨认。
类内差异（Intra-class variation）：一类物体的个体之间的外形差异很大，比如椅子。这一类物体有许多不同的对象，每个都有自己的外形。

2.Nearest Neighbor 分类器和 K-Nearest Neighbor分类器的原理公式以及区别，联系

KNN是寻找K个相似的图片的标签。分别投票，选出最相似的标签。

L1 L2

3.交叉验证的到 htperparameter的原理：

数据只有1000个，我们分成5分，用其中4分训练，剩下的一份来验证，如此循环。

4.NN分类器的优缺点

优点：易于理解，实现简单，测试耗费时间长。因为要与测试的每一张图片进行比较。将所有的数据都存储起来，过于浪费资源。

5.基于 4的优缺点，我们提出了使用Score function 和 Loss function 来进行图像分类，将图像分类变成一个最优化问题，这是如何实现的？

关键点：将图像到标签值的参数化映射，也就是 Score function ，一个线性得分函数： $技术分享$

6.小知识点:将权重和偏置参数合并的技术：技术分享

自问自答学习系列（1）：从图像分类，到损失函数，到神经网络

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们