首页 > 代码库 > KNN算法
KNN算法
KNN算法的核心思想:如果一个样本在特征空间中的k个最邻近的样本大多数属于某一类别,则该样本也属于该类别
KNN算法的结果很大程度上取决于K的取值,下面进行说明:
如果k=5 则上图中的红点属于三角形所属类,因为三角形所属类占3/5,而四边形类只占了2/5,如果k=11,则红点属于四边形类,四边形类占8/11,而三角形类占3/11
KNN中,样本的距离一般采用欧式距离或曼哈顿距离
欧式距离d(x,y)=sqrt(∑k=1 t0 n(xk-yk)2)
曼哈顿距离d(x,y)=sqrt(∑k=1 to nabs(xk-yk))
KNN算法的描绘:
(1) 计算测试数据与训练数据之间的距离
(2)将距离从小到大排序
(3)选取前K个样本
(4)确定K个样本所属类的频率
(5)将测试数据所属类标记为上述频率最高的类别
KNN算法
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。