聚类分析方法概述

聚类分析是数据挖掘中的一个很活跃的研究领域，并提出了许多聚类算法。
这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和
基于模型方法。
1 划分方法(PAM:PArtitioning method)  首先创建k个划分，k为要创建的划分个数；然后利用一个循环
定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括：
k-means,k-medoids,CLARA(Clustering LARge Application),
CLARANS(Clustering Large Application based upon RANdomized Search).
FCM

2 层次方法(hierarchical method)  创建一个层次以分解给定的数据集。该方法可以分为自上
而下（分解）和自下而上（合并）两种操作方式。为弥补分解与合并的不足，层次合
并经常要与其它聚类方法相结合，如循环定位。典型的这类方法包括：
第一个是;BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies) 方法，它首先利用树的结构对对象集进行划分；然后再利
用其它聚类方法对这些聚类进行优化。
第二个是CURE(Clustering Using REprisentatives) 方法，它利用固定数目代表对象来表示相应聚类；然后对各聚类按照指定
量（向聚类中心）进行收缩。
第三个是ROCK方法，它利用聚类间的连接进行聚类合并。
最后一个CHEMALOEN，它则是在层次聚类时构造动态模型。

3 基于密度方法，根据密度完成对象的聚类。它根据对象周围的密度（如
DBSCAN）不断增长聚类。典型的基于密度方法包括：
  DBSCAN(Densit-based Spatial Clustering of Application with Noise):该算法通过不断生长足够高密
度区域来进行聚类；它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义
为一组“密度连接”的点集。
  OPTICS(Ordering Points To Identify the Clustering Structure):并不明确产生一
个聚类，而是为自动交互的聚类分析计算出一个增强聚类顺序。。

4 基于网格方法，首先将对象空间划分为有限个单元以构成网格结构；然后利
用网格结构完成聚类。
    STING(STatistical INformation Grid) 就是一个利用网格单元保存的统计信息进行基
于网格聚类的方法。
    CLIQUE(Clustering In QUEst)和Wave-Cluster 则是一个将基于网格与基于密度相结合的方
法。

5 基于模型方法，它假设每个聚类的模型并发现适合相应模型的数据。典型的
基于模型方法包括：

    统计方法COBWEB:是一个常用的且简单的增量式概念聚类方法。它的输入对象是采
用符号量（属性-值）对来加以描述的。采用分类树的形式来创建
一个层次聚类。
    CLASSIT是COBWEB的另一个版本.。它可以对连续取值属性进行增量式聚
类。它为每个结点中的每个属性保存相应的连续正态分布（均值与方差）；并利
用一个改进的分类能力描述方法，即不象COBWEB那样计算离散属性（取值）
和而是对连续属性求积分。但是CLASSIT方法也存在与COBWEB类似的问题。
因此它们都不适合对大数据库进行聚类处理.

posted on 2008-02-15 23:32 Amigo 阅读(8730) 评论(4) 编辑收藏引用

# 求助聚类分析方法 2008-05-11 17:40 一名求助者

你好.我是高校的一名老师,我现在正在做一个毕业论文,其中用到了聚类分析的方法,我做出了个结果，但是不能对该结果有个比较满意的解释,直接导致论文的最后一个部分:讨论部分没有主题,由于论文马上要答辩,请楼主看到我的留言后给我回个信息,希望能得到指点,谢谢!我的手机13509711779 回复更多评论

# re: 聚类分析方法概述 2008-09-17 12:53 川山

@一名求助者
聚类结果解释不满意时，先看聚类的指标是否合适，符合理论分析的需要，或变量进行标准化变换！！回复更多评论

# re: 聚类分析方法概述 2009-11-27 19:15 辉子

楼主，你好，我现在用聚类分析来做，但是效果不好，总是有些聚类很分散。不知道为什么？楼主可以指点一下吗？谢谢。我的邮箱是：xujianhui306@163.com。很着急的。回复更多评论

# re: 聚类分析方法概述 2012-03-05 15:33 小格子

楼主大人你好~
我现在在做的课题有关空间中点的聚类~
我想把距离在1以内的点都聚在一起，
对于类间距离没有要求
不知道用什么聚类方法~
求回复~
我邮箱397023518@qq.com
跪谢！！！回复更多评论

刷新评论列表

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

# 求助聚类分析方法 2008-05-11 17:40 一名求助者

# re: 聚类分析方法概述 2008-09-17 12:53 川山

# re: 聚类分析方法概述 2009-11-27 19:15 辉子

# re: 聚类分析方法概述 2012-03-05 15:33 小格子

聚类分析方法概述

评论

导航

统计

常用链接

留言簿(4)

随笔档案

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜