首页 > 代码库 > 聚类分析

聚类分析

  聚类分析是一种数据归约技术,旨在揭露一个数据集中观测值的子集。它可以把大量的观测值归约为若干个类。 最常用的两种聚类方法是层次聚类hierarchical agglomerative clustering)和划分聚类partitioning clustering)。在层次聚类中,每一个观测值自成一类,这些类每次两两合并,直到所有的类被聚成一类为止。在划分聚类中,首先指定类的个数K,然后观测值被随机分成K类,再重新形成聚合的类。

  对于层次聚类来说,最常用的算法是单联动(single linkage)、全联动(complete linkage )、平均联动(average linkage) 、质心(centroid)和Ward方法。

  

  对于划分聚类来说,最常用的算法是K均值(K-means)和围绕中心点的划分(PAM)。

  

  最近在看分类和聚类,好一段时间没写博客了,主要是觉得这两个问题都比较复杂,好多东西要整理

  
  

 

聚类分析