首页 > 代码库 > 聚类算法

聚类算法

聚类算法是机器学习的一个重要分支,一般采用无监督学习,常见聚类算法分类有K-Means, K-Medoids, GMM, Spectral clustering,Ncut等。

分类:

1. Partitioning approach:

        建立数据的不同分割,然后用相同标准评价聚类结果。(比如最小化平方误差和)目标:找出一个分割,使得距离平方和最小

        典型算法:K-Means, K-Medoids

K-Means算法:

       1. 将数据分为k个非空子集

       2. 计算每个类中心点seed point

       3. 将每个object聚类到最近seed point

       4. 返回2,当聚类结果不再变化的时候stop

 

2. Model-based:

       对于每个类假定一个分布模型,试图找到每个类最好的模型

       典型算法:GMM(混合高斯) 

GMM:将k个高斯模型混合在一起,每个点出现的概率是几个高斯混合的结果。EM应用到GMM进行参数的求解。

3. Dimensionality Reduction Approach:

       先降维,再聚类

       典型算法:Spectral clustering,Ncut

 

聚类算法