QA园 - C++博客

2006年4月21日

总体设计方案：

本文将采取基于特征的方法对图像进行聚类与检索。基于特征对图像进行聚类与检索的基本方法是在建立图像库时 , 对输入的图像先进行图像分析 , 提取图像或目标的特征向量并根据特征向量及匹配算法等将图像进行聚类。在进行图像检索时 , 对每一幅给定的查询图 , 进行图像分析并提取该图的特征向量。通过将该图特征向量与特征库中的特征向量进行匹配并根据匹配结果到图像库中搜索就可提取出所需要的检索图像来。

由上述工作原理可以知道基于特征的图像聚类与检索有四个关键 , 一是要从图像中抽取分类和检索的特征 , 二是确定建立在相应特征基础上的图像相似性度量 , 三是要利用聚类算法对图像库中的图像进行聚类，四是要利用匹配算法在图像库中检索相应的图像。

1 .从图像中抽取分类和检索的特征

我们知道，一幅图像是以矩阵的形式存储在计算机中的，具体地讲，矩阵上某一点的值代表了图像在该点的颜色信息，正是许多这样的点的组合、排列呈现在我们的眼中才使得缤纷五彩的世界得以在计算机的屏幕上显示出来。然而对于图像聚类和图像检索来说，将全部这些点作为数据进行分析处理是没有必要也是不切实际的。例如在汽车车型识别中，图像中的道路和行人以及其他建筑物都属于无用信息，对于识别车型来说没有任何意义，应该将其去除，否则在识别时会产生不利影响。

所谓特征是从模式中得到的对分类有用的度量或属性，应该能够反映不同类别之间的本质差别。正如我们每个人具有高、矮、胖、瘦各不相同的特征一样，不同的图像之间也存在着互相得以区分的特征。在图像聚类与检索中，这些特征一般表示为一组数字，这些数字构成一个矢量，称为特征矢量。抓住关键特征，忽略其它信息是一种通用的、有效的方法。颜色和纹理是图像的两个最重要的特征，本文将对颜色和纹理的聚类与检索进行探讨。

l 颜色

在图像的自动分析检索中，颜色是一种能够简化目标提取和分类的一种重要描述符，最早在基于内容的图像检索中得到应用。颜色特征定义比较明确，抽取也相对容易，所以在图像处理中得到广泛的重视和应用，并已提出了很多成熟的算法。对颜色特征的表达方式有很多种，如直方图法，累积直方图法，局部累加直方图法，颜色布局法，中心矩法等。由于颜色的信息量比较大，所以各种方法的共同的一点就是要用较有效和紧凑的办法来表达颜色信息。

l 纹理

纹理是另一个用于描述图像的常用的概念。纹理通常被看作图像的某种局部特性，或是对局部区域中图像间关系的一种度量。另外，纹理信息也可以用来对图像中的空间信息进行一定程度的定量描述。基于纹理的图像检索也有很多成果。

2. 确定建立在相应特征基础上的图像相似性度量

获取了图像的特征为我们接下来的工作奠定了良好的基础，我们的目标是图像的聚类和检索，从根本上说就是将特征相近的图像找出来。这里的“特征相近”只是一个直观上的概念，何谓“相近”，不同的情况下有着不同的解释。因此，我们很有必要定义一个具体的数学描述符定量的体现两幅图片间“相近”的程度，这就是相似性度量。显然，我们的目标就是找到相似度最小的图像。

3.利用聚类算法对图像库中的图像进行聚类

人类的分类识别能力不是与生俱来的，而是后天经过不断的实践和学习而逐渐具有的功能，例如对语言的学习，对文字的学习。

在图像检索的过程中我们同样面临着分类的任务，具体地讲就是图像的聚类。所谓图像聚类就是将未知类别的一组图像分成若干类的过程，也称无监督学习或无教师学习。聚类分析的思路比较直观，根据各个待分类图像特征的相似程度来进行分类，将在特征空间中聚集在一起的样本点划分为一类。选择合适的聚类算法对图像库中的图像进行聚类，是我们的核心任务之一。

4.利用匹配算法在图像库中检索相应的图像

匹配可理解为结合不同的、已经存在的表达而建立他们的解释之间的联系的技术与过程。从广义上讲，匹配是要研究如何把知识模型与从图像获得的描述信息对应起来，从而达到识别目标，理解图像，认知世界的过程。而具体到基于内容的图像信息检索，就是要将从查询要求通过分析而得到的描述与需要检索的图像数据库中个体的描述进行比较，以便提取出视觉效果或语义内容最为接近／相似的个体。

通俗地讲，我们就是要根据用户需要检索的图像的特征，到图像库中与现存的图像特征进行比较，根据一定的算法，找出相似度最小的一个或一组图像，完成一个匹配过程，将用户最希望得到的图像信息检索出来。

小结：

通过从图像中抽取分类和检索的特征 , 确定建立在相应特征基础上的图像相似性度量 , 利用聚类算法对图像库中的图像进行聚类，利用匹配算法在图像库中检索相应的图像这四个步骤，我们基本提出了一个可行的图像聚类与检索的方案，接下来探讨一些具体的关键技术与实验。

posted @ 2006-04-21 20:32 Arthur_QA 阅读(1766) | 评论 (0) | 编辑收藏

图像聚类与检索的简单实现（一）

目的和意义

随着科学技术的进步发展和推广应用，特别是计算机技术和网络技术的发展，信息高速公路的建设，以及多媒体的推广应用，现代信息处理的对象和方法都有了很大的变化。大量的各种类型的信息在全球得到了采集、传输、流通和应用，人们正快速的进入一个信息化的社会。

多媒体是一种极其重要的信息资源，现代技术已能运用各种手段大量地采集和产生各种类型的多媒体信息数据，而多媒体信息中占有举足轻重作用的一种就是图像信息。近年来随着需求的增加、工艺技术的进步，以各种方式获取的图像信息的数量得到了飞速的增长，进入新世纪后，有人估计世界每年产生的新图像已达 800 亿幅，信息膨胀已给人类带来过多的信息量以致超出了人的接受能力，有鉴于此，如何快速、准确、高效的从浩如烟海的图像信息源（比如网络）中获取有用的信息就变得极为重要，近年来国际上广泛开展了基于内容的图像检索研究，而其中图像聚类与检索技术已取得相当进展，在各个领域已得到了广泛的应用。

所谓图像聚类就是在给出的图像集合中，根据图像的内容，在无先验知识的条件下，将图像分成有意义的簇。对于图像聚类，最引人注目的特征属性是颜色、纹理和形状等。目前有很多有效的聚类技术，如层次聚类算法、基于分割的算法、混合——溶解算法、模式——搜寻算法、最近相邻聚类、模糊聚类和进化聚类方法。

所谓图像检索是从图像数据库中快速的提取出一个与查询相关的图像或图像序列。随着越来越多的图像数据库的建立和越来越多的图像信息在数字档案中的应用，对图像信息检索的需求越来越大。

只有掌握了对图像信息进行自动查询和选择的技术，才能使人类只接受或快速地获取需要的信息而不至于淹没于图像信息的汪洋大海中。有鉴于此，本文将对图像聚类与检索的方法进行研究，本文的实验图库为一特定情况下的图像库，具体地说是一组灰度图像，该组图像是一系列连续拍摄的列车行进照片，因此不同的图像之间既有相似性，又有因运动和拍摄时间的不同而形成的差异性，对于实验结果的分析较为有利。另外，如果时间、条件允许，也可以实现对任意图像进行聚类、检索（包括彩色图像）。

posted @ 2006-04-21 20:31 Arthur_QA 阅读(655) | 评论 (0) | 编辑收藏

仅列出标题

常用链接

留言簿(2)

随笔档案

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜