第41卷第1期 2009年3月郑州大学学报(理学版)
J.ofZhengzhouUniv.(Nat.Sci.Ed.)
Vol141No11Mar12009
基于多尺度及多方向分析的纹理图像检索算法
汪华章
(西南民族大学电气信息学院 成都610041)
摘要:提出一种基于多尺度及多方向分析的纹理图像检索算法.针对纹理图像的特点,从不同尺度和方向比较了实数离散小波变换和双树复小波变换的性能.充分利用双树复小波变换的旋转不变性、良好的方向选择性以及有限的冗余等优点,将其有效地应用于纹理特征提取过程中.通过提取各子带上的能量和标准差作为特征矢量,采用
Camberra距离作为相似度量进行检索,减小了计算量,取得了良好的检索效果.实验结果表明,双树复小波提取纹
理特征所获得的检索性能优于实数离散小波检索算法,也优于经典的灰度共生矩阵算法,且算法具有良好的旋转不变性.
关键词:图像检索;复小波变换;旋转不变性;相似度量中图分类号:TP391.41
文章编号:1671-6841(2009)01-0027-06
0 引言
多媒体和网络技术的飞速发展,以及大容量存储器和数字化设备的广泛应用,使图像数据以惊人的速度增长.无论是军用还是民用设备,每天都会产生数千兆的图像,这些数字图像中包含了大量的有用信息,因此,如何有效组织、快速检索相关图像变得越来越重要.基于内容的图像检索技术受到青睐,目前国内外许多研究人员提出了大量的检索策略和相应的改进算法,同时也实现了一些比较著名的原型系统,如QBIC、Virage、Photobook、MARs和VisualSEEK等,主要使用图像颜色、纹理、形状和空间位置关系以及多个特征的组合进行检索.
纹理特征作为最重要的底层视觉特征之一,在基于内容的图像检索中得到了广泛应用.现阶段,纹理特征的提取方法主要分为4类[1]:结构分析方法、模型分析方法、统计分析方法和信号处理分析方法.结构分析方法通常采用形式化语言来描述纹理,在纹理基元的选择和形式化语法建立上具有一定的难度,因此该方法用得相对较少.模型分析方法通过建立一个适当的模型,以此进行纹理描述,如马尔科夫随机场(MarkovRandomField,MRF)模型、Wolddecomposition模型以及分形模型等,但这些模型主要缺点都是在单一尺度上对图像进行分析.MRF模型能捕捉到图像的局部关联信息,却需要大量的计算来确定合适的参数.分形模型在一些自然纹理方面比传统技术更有效果,但是缺乏方向选择性,不适合描述图像的局部结构.统计分析方法是纹理研究用得最早、最多的一类方法,其中,灰度共生矩阵(GrayLevelCo2occurrenceMatrix,GLCM)[223]是最经典的纹理描述方法之一,它首先建立一个基于像素之间方向性和距离的共生矩阵,然后从矩阵中提取有意义的统计量作为纹理特征.信号处理分析方法在纹理分析中应用也比较广泛,主要包括Gabor滤波器、小波变换等.随着小波理论的发展和完善,越来越多的研究人员利用小波的多分辨特性提取纹理图像的特征,并应用于图像检索中,取得了良好的检索效果.作者提出了一种基于多尺度及多方向分析的纹理图像检索算法,充分利用双树复小波变换的优点,将其有效应用于纹理特征提取过程中,取得了良好的检索效果1
1 纹理特征选择
波器组的输出不是完全正交的,所提取的纹理特征之间存在着相关性和冗余性,计算量较大[425].小波分
收稿日期:2008210218
基金项目:四川省科技攻关项目,编号05GG0212026203.
作者简介:汪华章(1976-),男,博士,主要从事多媒体信息检索及智能控制与模式识别研究,E2mail:wanghuazhang@126.com.
28郑州大学学报(理学版)第41卷
析具有良好的时频局部化特性,但是传统的小波在纹理描述方面具有有限的方向性,不能充分地描述纹理特征.Pun等[6]提出了将图像转换到对数极坐标,获得了具有旋转不变性的小波纹理特征,但将尺度变量转化为平移变量进行处理,破坏了信息的频率性,而且不具备平移不变性.而复数小波在给变换带来一定冗余的同时可以克服上述问题,但是它同时存在另一个问题,即超过一层分解的复数小波变换的输入是复数形式,要构造完全重构的滤波器非常困难.Kingsbury[7]在实数小波理论框架的基础上,提出了一种双树复小波变换(DualTreeComplexWaveletTransform,DT2CWT)信号分析策略,不仅具有近似的平移不变性,而且具有良好的方向选择性,其有限的冗余度以及较小的计算量为纹理分析与特征提取提供了有利条件.
一维双树复小波实际上是由2个实数小波构成的平行树,其分解结构示意图如图1所示.其中,tree1的输出代表DT2CWT的实部,tree2的输出代表DT2CWT的虚部.它通过在分解树的每一层都使用采样率加倍而获得近似的平移不变性,那么对于输入信号的样值序列,tree1和tree2同时进行全采样,其中,tree1第一层滤波器h0(n)采样奇数点,h1(n)则采样偶数点,tree2第一层滤波器g0(n)行采样相对tree1有一个采样点的偏移,g0(n)采样偶数点,g1(n)则采样奇数点,这样保证全部样值序列被采样.但是在高于第一层的分解中,由于采样率更低,tree2的采样点不再处于tree1采样点的中间位置,因此不具有平移不变性.为了使这些层也具有平移不变性,对于给定的层和前面的分解层的总延时差必须等于一个采样间隔,即tree1和tree2各层交替采用奇数长和偶数长滤波器.为了获得满足这种条件的滤波器组,可以采用shift(quartershift)滤波器设计方法[6].
图1 一维双树复小波3层分解结构示意图
Fig.1 Threelevelsofdecompositionusing12Ddual2treecomplexwavelets
对于二维的图像信号,22D实数离散小波可以表示为:Ψ(x,y)=Ψ(x)Ψ(y),通过该式可以得到水平、
垂直、对角方向的3个小波.对于双树复小波而言,可以通过同样的方式产生多个不同方向的小波.若Ψ(x),Ψ(y)是近似解析的复小波,其中,Ψ(x)=Ψh(x)+jΨg(x),Ψ(y)=Ψh(y)+jΨg(y),那么Ψ(x,y)可以表示为
Ψ(x,y)=[Ψh(x)+jΨg(x)][Ψh(y)+jΨg(y)]
=Ψh(x)Ψh(y)-Ψg(x)Ψg(y)+j[Ψh(x)Ψg(y)+Ψg(x)Ψh(y)],
实部{Ψ(x,y)}=Ψh(x)Ψh(y)-Ψg(x)Ψg(y).同理,可以对Ψ(x)Ψ(y),<(x)<(y),Ψ(x)<(y),<(x)Ψ(y),Ψ(x)<(y)做相似处理,有
Ψ(x)=Ψh(x)+jΨg(x),
<(x)=Ψi(x,y)=1(Ψ1,i(x,y)-Ψ2,i(x,y)),2Ψi+3(x,y)=1(Ψ1,i(x,y)+Ψ2,i(x,y)),
2h∑
n
0
(n)1h∑
n
(n) 第1期汪华章:基于多尺度及多方向分析的纹理图像检索算法1作为标准化正交,i=1,2,31229
式中使用了
由于DT2CWT的二维形式是通过对二维信号(图像)分别进行行和列的一维分解.行和列的分解同时抑制负频率,只保留二维信号频谱的第一象限,高维的复数小波变换提供了方向选择性.上述6个实数方向小波成功分离了6个不同的方向,它们均来自于一对经典的小波,都近似满足Ψg(t)=h{Ψh(t)}[8].其中,2个分离的22D小波基定义如下:
Ψ1,1(x,y)=Ψ1,2(x,y)=Ψh(x)双树复小波不仅具有有限的冗余性,且冗余性与分解的尺度数无关.同时,它提供了良好的方向选择性,能提供{-15°,-45°,-75°,75°,45°,15°}6个方向的纹理特征,如图2所示.而经典的22DDWT仅能提供{0°,90°,±45°}4个方向,且±45°混叠在一起.图2 6个方向小波分解圆盘图像示意图Fig.2 Sixdirectionsdecompositionofcircleimage
图3为DWT和DT2CWT分解图像的各层对比,可以看出,DWT分解后的各子带图像中圆的边界附近有不规则的边缘和毛刺,存在明显的混叠现象,而DT2CWT分解后的图像各层图像不存在混叠现象,而且边缘比较光滑连续,表明DT2CWT具有良好的平移不变性,同时能在6个方向表达特征的性能使得它具有良好的旋转不变性.
图3 DWT和DT2CWT分解图像的各层对比
Fig.3 ContrastofdifferentlevelsfordecompositionimagesusingDWTandDT2CWT
2 双树复小波特征提取及相似度量
当图像在某一频率和方向下具有较明显的纹理特征时,与之对应的小波通道的输出就具有较大的能量,
因此,在采用双树复小波提取图像的纹理特征时,可以通过小波通道的能量和方差来表示.双树复小波图像的能量fe和标准差fσx提取公式如下:
fe=
1W×H
WH
i=1j=1
∑∑
|Wx(i,j)|, fσx=
1W×H
WH
i=1j=1
∑∑
2
|(Wx(i,j)-μ|x)
12
,
式中:W×H表示被分解的子带的尺寸;Wx(i,j)是第x个子带分解的小波系数;μx是小波系数的均值;i和j分别代表通道中元素的行和列值.因此可以得到综合特征F为
F=[fe1fe2fe3…fenfσx1fσx2fσx3…fσxn].
特征数据库的建立可以通过上述特征的提取过程重复进行.图像检索性能不仅取决于所提取特征的有效性能,同时好的相似度量方法不仅能提高检索的效率,同时能提高检索的准确率.由于所提取的能量和标准差特征具有不同的物理意义,而且量纲不一致,如果采用欧氏距离进行度量,必须对不同物理意义的特征
30郑州大学学报(理学版)第41卷
首先进行归一化,这为计算带来很大的复杂度,为了减少计算量,采用Camberra距离,该距离能克服量纲引起的问题,公式如下:
d
d(x,y)=
i=1
∑|xi-yi|,xi,yi≥0,xi+yi≠01
|xi+yi|
3 实验
3.1 测试数据库的建立
纹理具有很强的方向性,同一幅纹理图像经过旋转变换后,直观上不是相似图像,实际上它们属于同一类纹理图;2幅不同的纹理图像直观上看去一样,但实际上不是同一类纹理图像,因为纹理的粗细不一致.为此构建2个纹理图像数据库,即数据库DB1和数据库DB2.
数据库DB1中的图像来自于Brodatz纹理数据库,该数据库包含了108幅不同纹理的图像,大小均为512×512.对于相似的纹理或者同类纹理均认为来自于同一幅图像.为此,108幅尺寸比较大的图像需分割成尺寸较小的图像子块,即每一幅图分成16个互不重叠的128×128的子图,则图像数据库包含了1728幅图像.因此,每一幅纹理图像的相似图像应该为16幅(包含本身).该数据库主要测试算法对纹理图像检索的有效性.
数据库DB2图像也来自于Brodatz纹理数据库,共91幅大图,大小为512×512,实际上共有13类图像.其中,每类图像均具有0°,30°,60°,90°,120°,150°,200°7个方向,如图4所示.将每一幅图像分割为2×2的非重叠的图像子块,因此每一类图像共有28幅,整个新建的数据库包含旋转图像3幅.该数据库主要测试算法的旋转不变性.图4 旋转不同角度的纹理图像
Fig.4 Textureimageswithdifferentdirectionsbyrotating
3.2 DB1数据库上的测试实验
在相同条件下,经典的GLCM算法、DWT算法和DT2CWT算法相比,GLCM算法从数学角度研究纹
理灰度级的空间依赖关系,首先建立一个基于像素之间在某些特殊方向上具有一定距离的共生矩阵,然后从矩阵中提取有意义的统计量作为纹理特征.实验中采用了4个统计特征:能量、熵、相关性、逆差,并考虑图像在0°,45°,90°和135°的灰度像素对同时出现的联合频率分布,得
到了4个不同方向的共生矩阵,然后利用这4个统计特征对4个共生矩阵进行统计,并以所得参数的均值和方差作为特征矢量的各个分量,因此得到8维的特征矢量.标准的DWT方法和DT2CWT提取纹理的方法基本一样.为了比较其性能,首先在数据库DB1上做测试实验,采用检索准确度对检索算法进行评价.如图5所示,做出P(10),
P(20),P(30),…,P(NR)曲线图,分别指前10个,20个,
30个,…,NR个文件检索出来对应的准确度.
相对于算法DWT和GLCM,DT2CWT算法的性能更优越,其检索效率有了较大的提高.图6给出了一个不同算法下的检索实例,实验发现,DT2CWT算法能正确地
图5 3类算法性能比较
Fig.5 Contrastofperformanceforthreealgorithms
第1期汪华章:基于多尺度及多方向分析的纹理图像检索算法31
检索出前面16幅图像.3.3 DB2数据库上的测试实验
对于数据库DB2,由于每一类纹理是由不同旋转方向的纹理图像组成,可以通过该数据库的仿真实验反映出算法对图像旋转后检索性能的影响.每类图像共28幅,实验中每类图像做7次查询,即不同角度的图像各取一幅作为查询图像,最后对前28幅图像的检索准确度做平均得实验结果.实验发现:GLCM检索算法的检索准确率为75.6%,DWT算法的检索准确率为67.8%,而DT2CWT算法的检索准确率为78.5%.相比之下,DT2CWT对旋转图像具有更高的检索率.图7给出了一个具体的检索实例.对于weave查询图像,分别给出了不同算法下的检索结果.可以直观地发现无论是检索的准确率还是视觉的直观感知,DT2CWT的检索效果相对更好.
4 性能分析和小结
通过DB1和DB2数据库上的测试实验可以发现:无论是普通的纹理数据库(图像没有被旋转)还是特殊数据库(图像被旋转),DT2CWT的检索性能相对更优越.主要原因是DT2CWT在提取纹理特征时,能捕捉到{-15°,-45°,-75°,75°,45°,15°}6个不同方向上的特征,说明DT2CWT所提取的特征具有旋转不变性,因此,算法的鲁棒性更强.而GLCM可以获得{0°,45°,90°,135°}4个不同方向的特征,DWT在特征的方向选择性上相对弱一点,主要在{0°,90°,±45°},其中,±45°混叠在一起,因此,后2种算法检索精度相对较低.故纹理特征提取时,方向性越强,所提取的特征越能刻画纹理的特征,检索准确率越高.
参考文献:
[1] TuceryanM,JainAK.TextureAnalysis:HandbookPatternRecognitionandComputerVision[M].Singapor:World
ScientificPublishingCompany,1993:2352276.
32郑州大学学报(理学版)第41卷
[2] HaralickRM,ShanmugamK,DinsteinI.Texturefeaturesforimageclassification[J].IEEETransactionsonSystems,
ManandCybernetics,1973,3(6):6102621.
[3] 刘忠伟,章毓锦.综合利用颜色和纹理特征的图像检索[J].通信学报,1999,20(5):36240.
[4] ChallaS,SastryMR,ArunKP,etal.AmodifiedGaborfunctionforcontentbasedimageretrieval[J].PatternRecog2
nitionLetters,2007,28:2932300.
[5] HanJ,MaKK.Rotation2invariantandscale2invariantGaborfeaturesfortextureimageretrieval[J].ImageandVision
Computing,2007,25(9):147421481.
[6] PunCM,LeeMC.Log2polarwaveletenergysignaturesforrotationandscaleinvarianttextureclassification[J].IEEE
TransactionsonPAMI,2003,25(5):5902603.
[7] KingsburyN.Complexwaveletsforshiftinvariantanalysisandfilteringofsignals[J].AppliedandComputationalHar2
monicAnalysis,2001,10(3):2342253.
[8] SelesnickIW,BaraniukRG,KingsburyNG.Thedual2treecomplextransform[J].IEEESignalProcessingMagazine,
2005,22(6):1232151.
TextureImageRetrievalAlgorithmBasedonAnalysisof
Multi2scaleandMulti2orientationWANGHua2zhang
(InstituteofElectronicsandInformationEngineering,SouthwestUniversityfor
Nationalities,Chengdu610041,China)
Abstract:Anovelimageretrievalalgorithmbasedonanalysisofmulti2scaleandmulti2orientationisproposed.Aimedatthecharacteristicsoftextureimage,theperformanceofrealdiscretewave2lettransformanddualtreecomplexwavelettransformiscompared.Theexcellentcharacteristicsofrotation2invariance,goodorientationselectionandfiniteredundancyarefullyutilized,andap2pliedintexturefeatureextraction.Thealgorithmusesenergyandstandarddeviationoneachsub2bandofthedecomposedimageasfeaturevectors,andadoptsthedistanceofCamberraassimilari2tymeasurementtoretrieveimages,whichreducesthecomputationandgetsnicerretrievaleffect.Experimentprovesthattheretrievalperformanceofusingdualtreecomplexwavelettoextracttexturefeatureisbetterthanthatofusingrealdiscretewavelettransform,andalsopriortothemethodofgraylevelco2occurrencematrix.Meanwhile,theproposedschemepossessesrotation2invariance.
Keywords:imageretrieval;complexwavelettransform;rotation2invariance;similaritymeasure2ment