1)基于手工标注的检索
对图像的内容(如物体、背景、构成、颜色等)进行人工描述并分类,将其标注为一系列关键字,并对关键字建立索引,当用户输入关键字后,系统可以根据数据库中的倒排文件将关键字映射为M站或网页的地址。但是,由人工完整地标注所有图像,劳动强度太大,限制处理图像的数量。由于图像所包含的信息量竞大,不同用户对于同一张图像的看法不尽相同,这就导致对图像的标注没有一个统一标准。
2)基于图像外部信息进行检索
即根据图像的文件钇或目录名、路径名、页面标题、ALT标
签以及图像周围的文本信息等外部信启、进行检索,这是目前图
像搜索引擎采用最多的方法。
3)基于内容的图像检索|.
目前基于内容的图像检索技术主要集中在颜色、纹理、形状等低层物理特征提取的基础上.基于高层语义的检索正有待研究。颜色具有大小、方向、位置不变性,可以用直方图、颜色距、颜色集、主色调等表征,颜色是描述图像最有效的特征之一。纹理是指图像像素灰度集或颜色的某种规律性的变化,即图像中局部不规则而整体有规律的特性称之为纹理,纹理是从像素分布的方ruJ性和位置等得到的有意义的统汁数据。纹理特征主要包
括粗糙度、方向性、线性、对比度以及规则性,如人体肌肤的纹理、毛发、天空、水、织物、树木的纹理等。形状包括面积、连通性、环行性、偏心率、主轴方向等特征。很多情况下同一物体可能有各种不同的颜色,但其形状总是相似的,如汽车。另外,对于图形来说,形状是它惟一重要的特征..图像中某目标的边缘称为轮廓,而基于形状或轮廓的检索是图像内容检索的一个重要方面,它能从用户勾勒的图像的形状或轮廓入手,在图像库中检索出形状相似的图像。
4)反馈与学习技术
相关反馈是在信息检索系统中的一种用户指导性学习的技术,用以优化系统的检索能力 。对于检索的结果,系统根据用户反馈给系统的指导信息(哪些符合用户需求,哪些不符合),对I大J部检索参数进行 整,从而优化检索结果并提供给用户新的检索结果。
基于内容的图像搜索引擎工作原理
基于内容的图像搜索引擎,是建立在基于内容的图像检索技术之上的图像搜索工具,可以为在Web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息并建立索引库。基于内容的图像检索技术,可谓目前最流行的检索技术之一。它在特征匹配时,几乎不需要用户的参与,而主要利用图像自身的特征(如颜色、纹理、形状等)来完成,具有较强的客观性和直观性。利用这一特点,可以用来抽取各类图像库中所有图像文件的特征。在检索过程中,用户一般只需提供一个示例图像,系统首先抽取该示例图像的特征,然后根据图像特征的相似性匹配算法,与图像库中相应的特征进行比较,最后将与示例特征相似的图像返回给用户,以达到一个完整的图像检索过程。
基于内容的图像检索技术可分为以下几种:
①基于颜色特征的检索
在一幅图像的各种特征中,颜色特征是其中最直观、最明显的特征。一般采用直方图来描述这种特征。颜色直方图是表示图像中颜色分布的一种方法,它的横轴表示颜色等级,纵轴表示在某一个颜色等级上具有该颜色的像素在整幅图像中所占的比例,直方图颜色空间中的每一个刻度表示了颜色空间中的一种颜色。采用直方图计算图像间的相似性比较简单,但它不能反映图像中对象的空间特征。
②基于纹理特征的检索
图像可以看成是不同纹理区域的组合。纹理通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量。纹理特征可用来对图像中的空间信息进行一定程度的定量描述。根据纹理特征进行检索,主要考虑粗糙性、方向性和对比性三种特征。由于纹理描述比较困难,一般对纹理的检索都采用示例查询(QueryByExample)方式。用户给出示例的全部或部分区域特征,从而找到类似图像。
③基于形状特征的检索
采用该特征进行检索时,用户通过勾勒图像的形状或轮廓,从图像库中搜出与该形状类似的图像。基于此特征的检索方法有两种:
其一,分割图像经过边缘提取后,得到目标图像的轮廓线,针对这种轮廓线进行形状特征检索。
其二,直接针对图形,寻找适当的矢量特征检索算法。但处理这种结构化检索更为复杂,需要做更多的预处理。
一般说来,基于内容的种图像搜索引擎,需要完成以下四种工作:
在网上搜集图像信息、图像的相似性计算、为搜集到的
图像信息建立并维护索引库、回答用户的查询。其详细的工作
过程如图所示