首页 > 代码库 > 几种相似性度量(Similarity Measurement)

几种相似性度量(Similarity Measurement)

前言

在图论之中,衡量两个点之间的距离可以用多种测量方法。本文主要是总结几种相似性度量方法,主要内容参考自Wiki和Tsingke的博客(见参考部分)。

目录

1.欧式距离

2.标准化欧式距离

3.曼哈顿距离

4.切比雪夫距离

5.闵可夫斯基距离

6.马氏距离

7.夹角余弦

8.汉明距离

9.杰卡德距离

10.相关系数

11.信息熵

具体内容

1. 欧氏距离 (Euclidean distance)

  • 欧式距离是用来衡量定义在欧式空间的两个点之间的距离。比较基础和常用。
  • 公式:技术分享,其中 p = (p1, p2, ..., pn), q = (q1, q2, ..., qn).
  • 例子:p = (0, 0, 0), q = (7, 8, 9). d(p, q) = 13.928. 注意这个距离就是三维空间到原点的距离。

2.标准化欧式距离

 

3.曼哈顿距离

 

4.切比雪夫距离

 

5.闵可夫斯基距离

 

6.马氏距离

 

7.夹角余弦

 

8.汉明距离

 

9.杰卡德距离

 

10.相关系数

 

11.信息熵

 

实现代码(Python)

 

实验结果

 

参考:

http://www.cnblogs.com/tsingke/p/5873258.html

https://en.wikipedia.org/wiki/Euclidean_distance

几种相似性度量(Similarity Measurement)