摘 要 随着信息技术的发展,基于内容的图像检索技术已经成为一个研究热点。文章提出了一种颜色和纹理相结合的图像检索算法。首先在RGB颜色空间中对已经分割好的图像块求其三个通道的颜色平均值,进行离散余弦变换后取其低频分量作为颜色特征。用边缘直方图提取其纹理特征。最后综合利用这两个特征进行图像检索。实验结果表明,本文的算法具有较好的检索效果,有效地提高了检索的查准率和查全率。
关键词 RGB颜色空间;颜色平均值;二维离散余弦变换;边缘直方图;纹理特征
1 引言
近年来由于互联网络的快速发展,数字信息正海量的增长。传统的以文本的查询方式远远满足不了人们的要求,因此,基于内容的图像检索越来越受到人们的关注,成为了研究的热点。在基于内容的图像检索中,颜色和纹理是人们使用的最为频繁的视觉特征。人们单一的对颜色或者纹理特征提出了各种各样的算法,但是一种特征的方法只能表达图像的部分属性,往往满足不了人们的视觉需求。因此本文提出了一种综合利用颜色和纹理的图像检索算法。实验表明,综合颜色和纹理这两种特征可以得到比使用单一特征进行图像检索更好的效果。
2 利用颜色特征进行检索
2.1 提取颜色特征
在国际标准MPEG-7中建议了一种描述符颜色布局
[1],它表达了颜色的空间分布信息。在颜色布局描述符中,对分割好的8×8的图像取每一块图像的颜色平均值,形成一个颜色平均值矩阵,然后对其用二维离散余弦进行变换,取低频分量作为颜色特征。考虑到本文所选的测试图片都是bmp图片,以及减少计算量,提高检索速度的因素,本文的颜色布局描述符
[2,3]的提取方法如下:
(1)将整幅图像分成4×4块,计算每一块中所有象素RGB三个颜色通道的颜色平均值,并以此作为该块的代表颜色(主颜色)。
(2)将各块的颜色平均值进行离散余弦变换(DCT),得到DCT系数矩阵。DCT是一种分离的变换,是国际静止图像压缩标准JPEG的基础。由于大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对高频成分的失真不太敏感,所以可用更粗的量化。因此,在一般检索中可以利用部分DCT系数作为特征向量。
(3)对DCT系数矩阵进行之字形扫描和量化,得到DCT系数。
(4)对于R、G、B三个通道,分别从DCT系数中取出4个低频分量,形成12个参数,共同构成该图像的颜色特征向量。
2.2 相似度计算
国际标准MPEG-7中建议的颜色布局描述符在匹配时使用欧式距离公式,因此在本算法中匹配时也使用欧式距离公式,即为:
其中,各个分量的W为权重,R
i,G
i,B
i分别为各个分量的第i(i=0,1,2,3)个DCT系数。
3 利用纹理特征进行检索
3.1 提取纹理特征
在国际标准MPEG-7中建议了一种纹理特征描述符——边缘直方图
[1]。边缘直方图是基于图像边缘的统计特征,能较好地反映目标的边缘和纹理特征,而且运算速度较高
[4]。因此在本文中选取边缘直方图来提取图像的纹理特征。下面介绍一下提取的具体步骤:
(1)将bmp图像转换成灰度图。每个象素的灰度值可以根据RGB颜色分量按下列公式计算得到: 。