首页 > 代码库 > chapter2:提供推荐

chapter2:提供推荐

一.相似度度量方法

1.欧几里得距离(euclidean)

  对于两个n维向量A,B,

 

  技术分享

2.皮尔逊相关度

  皮尔逊相关度其实是协方差和标准差的商,即对于两个n维向量A,B,

  技术分享

 

  所以:

  技术分享

  皮尔逊相关度的取值范围是[-1,1],是两个样本集向量夹角的cosine值

3.jaccard相似度和广义jaccard相似度

  对集合A和B,Jaccard相似度计算如下:

  Jaccard(A, B)= |A intersect B| / |A union B|

  相似度数值在[0, 1]之间,当A==B的时候,为1.

  元素的取值只能是0或者1

  

  广义jaccard相似度,即Tanimoto系数,用EJ来表示。

  EJ(A,B)=(A*B)/(||A||^2+||B||^2-A*B)

4.曼哈顿距离

  平面上坐标(x1, y1)的i点与坐标(x2, y2)的j点的曼哈顿距离为

  d(i,j)=|X1-X2|+|Y1-Y2|

chapter2:提供推荐