首页 > 代码库 > Mahout 常用相似度度量(笔记)
Mahout 常用相似度度量(笔记)
Mahout 基于推荐系统,分类,聚类算法 等经常用到的相似度度量:
PearsonCorrelationSimilarity 皮尔森距离
EuclideanDistanceSimilarity 欧几里德距离
CosineMeasureSimilarity 余弦距离(0.7变成了UncenteredCosineSimilarity)
SpearmanCorrelationSimilarity 斯皮尔曼等级相关, 排序后的皮尔森距离
TanimotoCoefficientSimilarity 谷本相关系数, 基于boolean preference
LogLikelihoodSimilarity 最大似然估计 最大似然估计,也称为最大概似估计,是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。 一般好于TanimotoCoefficientSimilarity
CityBlockSimilarity 基于曼哈顿距离
参考链接:mahout 推荐算法基础
本文出自 “流浪的脚步” 博客,请务必保留此出处http://now51jq.blog.51cto.com/3474143/1539515
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。