◆李 猛 苗岑岑 王國蘇
?
Hu矩不變量在圖像幾何變換中的分析
◆李 猛 苗岑岑 王國蘇
(珠海格力電器股份有限公司制冷技術研究院 廣東 519070)
由于圖像矩具有平移、縮放、旋轉(zhuǎn)不變性,所以被廣泛地應用到圖像的模式識別領域。在連續(xù)函數(shù)中矩具有嚴格的不變性。然而,在實際應用中,圖像函數(shù)是離散的。因此,隨著圖像的幾何變換,圖像的矩也可能會發(fā)生改變。針對此問題,本文定量分析了圖像的幾何變換對圖像矩的不變量所產(chǎn)生的影響。最后給出了減小這種影響的建議。
模式識別;Hu矩不變量;空間分辨率;圖像旋轉(zhuǎn);圖像縮放
在大量的應用中,矩及其不變量已被廣泛地用來分析圖像的特性。包括:幾何矩[1],Zernike矩[2],旋轉(zhuǎn)矩和復矩[3]。矩的不變量首先由Hu[4]引入。在代數(shù)不變量的基礎上,Hu推導出了6個絕對正交不變量和1個斜正交不變量,它們既不受位置、大小和方向的影響,也不受平行投影的影響。假設圖像沒有噪聲并且是連續(xù)的情況下,矩的不變量已經(jīng)被證明對圖像的平移、縮放、旋轉(zhuǎn)是有效的[5]。矩的不變量已被大量應用到圖像的模式識別,圖像配準,圖像重建[6]。然而,實際應用中的數(shù)字圖像并不是連續(xù)的、無噪聲的,因為圖像是由有限精度像素在離散坐標中量化的。此外,很多因素都可能會引入噪聲,比如相機。矩不變量的計算過程中也不可避免地會引入誤差。矩不變量可能隨圖像幾何變換而變化。Salama[7]分析了空間量化對矩不變量的影響。他發(fā)現(xiàn),當圖像尺寸增大,采樣間隔減小時,誤差減小,但一般不會單調(diào)減小。Tch[8]分析了關于矩不變量的三個基本問題,得出的結論是:對圖像噪聲的敏感性;信息冗余;圖像的表達能力。他發(fā)現(xiàn)高階矩更容易受到噪聲的污染。不僅圖像量化和噪聲的污染引起矩不變量的計算誤差,圖像縮放和旋轉(zhuǎn)等變換也會引起。圖像尺寸的變化是通過像素的插值或刪除來進行的。此外,圖像的旋轉(zhuǎn)還會引起圖像表達函數(shù)的變化,因為它涉及圖像的旋轉(zhuǎn)會引起像素值和坐標[9]的四舍五入。因此,矩的不變量可能會隨著圖像縮放或圖像旋轉(zhuǎn)而改變。
本文定量分析了圖像的縮放和旋轉(zhuǎn)對矩不變量的影響,找到了矩的不變量與圖像縮放、旋轉(zhuǎn)之間的關系,并且給出了最小化矩不變量誤差的建議。
二維第(+)階矩定義[10]如下:
如果圖像函數(shù)(,)是一個分段連續(xù)有界函數(shù),則存在所有階的矩,且矩序列{m}唯一由(,)確定,并且相應的(,)也由矩序列{m}唯一確定。
當(,)通過平移、旋轉(zhuǎn)或縮放發(fā)生變化時,式(1)中的矩可能會發(fā)生變化。不變的特征可以通過中心矩來實現(xiàn),中心矩定義如下:
其中:
通過圖像(,)的質(zhì)心計算中心矩u,相當于m的中心被平移到圖像的質(zhì)心。因此,中心距對圖像平移是不變的。
尺度不變性可以通過歸一化得到。歸一化的中心距定義如下:
基于歸一化中心距,引入七個不變矩:
七個矩的不變量是圖像縮放、平移和旋轉(zhuǎn)時不變的有用性質(zhì)。
在圖像處理中幾何變換是一種流行的技術,主要涉及圖像平移、縮放和旋轉(zhuǎn)。平移操作將輸入圖像中的每個像素的位置映射到輸出圖像中的新位置;縮放操作用于縮放圖像的大小,這是通過對輸入圖像進行子采樣或插值來實現(xiàn)的; 旋轉(zhuǎn)操作通過旋轉(zhuǎn)指定的角度將每個像素的位置映射到新的位置,這可能會產(chǎn)生非整數(shù)坐標。為了使像素坐標為整數(shù),可以采用不同的插值方法。例如最鄰近插值、雙線性插值和三次插值等。
從上一段的描述中,我們可以看到平移只是改變了像素的位置,縮放和旋轉(zhuǎn)不僅改變了像素的位置,也改變了圖像函數(shù)本身。因此,只有縮放和旋轉(zhuǎn)才會引起矩不變量的誤差。我們使用兩幅250*250分辨率的圖像來研究圖像縮放和旋轉(zhuǎn)對矩不變量的影響程度,一幅是沒有主方向的復雜圖像(圖1a);另一個是具有主方向的簡單圖像(圖1b)。
圖1 實驗圖像
如上所述,圖像縮放會引起圖像函數(shù)的變化,所以矩不變量也會相應變化。因此,研究矩不變量與圖像縮放的關系是十分必要的。我們通過計算圖像A和圖像B的7個不變矩來進行研究,分辨率從10*10到500*500,每次遞增10。圖2a、2b分別給出了圖像A、B的不矩變結果。從圖中可以看出130*130的分辨率是圖像A的閾值。當分辨率小于閾值時,其值具有明顯的波動,而當分辨率大于閾值時,其值具有穩(wěn)定性。相應的,圖像B的閾值為150*150。
表1 圖像A的波動率
圖2 圖像A、B不變矩結果
矩不變量的波動情況根據(jù)式4計算:
式中,max()、min()和mean()分別表示數(shù)據(jù)中的最大值、最小值和平均值。圖2a中的數(shù)據(jù)按閾值130*130分為兩組,分別由式(4)計算波動情況,結果如表1所示。在矩不變量Hu5中,當圖像的分辨率小于閾值時,最大的波動為387.431%;當圖像的分辨率大于閾值時,減少為22.258%。
由于圖像的旋轉(zhuǎn)會改變圖像的函數(shù),所以隨著圖像的旋轉(zhuǎn),矩不變量也會不斷變化。為了研究圖像旋轉(zhuǎn)引起的矩不變量的波動,我們進行了實驗,將輸入圖像以1度為增量從1度旋轉(zhuǎn)到360度。
圖3顯示了圖像B從1度旋轉(zhuǎn)到360度的矩不變量波動情況,它顯示了當旋轉(zhuǎn)角度接近45、135、225、315度時,矩不變量的波動變大,當旋轉(zhuǎn)角度接近90、180、270、360度時,矩不變量的波動變?nèi)酢?/p>
圖3 圖像B矩不變量的波動
在第二節(jié)的A中,圖像B的分辨率閾值是150*150。為了驗證相同的圖像在縮放和旋轉(zhuǎn)之間是否有相同的閾值,我們使用相同的原始圖像制作了分辨率從60*60到330*330的一系列圖像,并且以每次30度的增量,計算從0度到360度旋轉(zhuǎn)的每幅圖像的矩不變量。然后,根據(jù)式公式(4)計算每種分辨率下幅圖像的波動。圖4為矩不變量的波動趨勢。從圖4中可以看出,圖像縮放和圖像旋轉(zhuǎn)的閾值是不同的。圖像B上圖像旋轉(zhuǎn)的閾值不是150*150,而是240*240。
表2中為不同分辨率60*60—330*330下7個矩不變量的波動值,可以得出,隨著圖像空間分辨率的增加,波動在減小。當分辨率僅為60*60時,波動幾乎達到1921.1%,當分辨率為270*270時,波動迅速下降到1.1%。隨著分辨率的增加,波動明顯減小,直到達到閾值。但是,當分辨率大于270*270時,波動不再單調(diào)地減小。
圖4 不同分辨率圖像B上矩不變量的波動
表2 矩不變量在圖像B不同分辨率下的波動
如第二節(jié)所述,我們可以得出結論。分辨率越高,波動越小。但隨著分辨率的提高,矩不變量的計算量也會增加。因此,研究圖像分辨率與計算量之間的關系是十分必要的。在PC (CPU 4GHz, RAM 8G)上,以30為增量計算10*10—1500*1500分辨率的矩不變量。圖5為顯示結果。從圖中可以看出,分辨率與計算量之間的關系是非線性的。因此,我們必須選擇一個可接受的分辨率來平衡實際應用中的計算量和分辨率。
圖5 不同分辨率下的矩不變量的計算時間
本文分析了Hu矩不變量在圖像縮放和旋轉(zhuǎn)中的波動。我們的研究結果可以總結如下:(1)由于圖像不是連續(xù)函數(shù)而且受噪聲污染,所以矩不變量隨著圖像縮放或旋轉(zhuǎn)而變化。(2)當圖像的空間分辨率增加時,波動減小。但是,當分辨率大于閾值時,這種變化并不會隨著分辨率的增加而顯著降低。但是隨著分辨率的提高,計算量會迅速增加。
實驗研究表明,圖像空間分辨率的選擇對于保持圖像的不變性非常重要。為了減小矩不變量的波動,圖像的空間分辨率必須大于縮放和旋轉(zhuǎn)的閾值。但是,分辨率不能太高,因為隨著分辨率的增加,計算量會顯著增加。因此,在實際應用中必須平衡計算量和分辨率。
[1]于洋,梁佳鑫,李孟格.標準化HU不變矩算法的車臉圖像特征提取[J].沈陽理工大學學報,2016,35(6):72-73.
[2]賴玥聰.基于圖像矩的圖像區(qū)域復制粘貼篡改檢測[D].福州:福建師范大學,2016.
[3] 李波.正交圖像矩及其在精確定位與產(chǎn)品檢測中的應用研究[D].武漢:華中科技大學,2012.
[4] M. K. Hu. Visual pattern recognition by moment invariants[J] .IRE T r ans. Inf . Theory , 1926, 8(2) : 179~ 187.
[5]雷晨光.基于區(qū)域不變矩的形狀匹配技術的研究及應用 [D].大連理工大學,2014.
[6]高月芳,韓國強,李桂清,等.圖像分析中的矩技術[J].中國圖像圖形學報,2009,14(8):1494-1495.
[7] G. I. Salarna and A. L. Abbott, "Moment invariants and quantization effects," in Computer Vision and Pattern Recognition, 1998. Proceedings. 1998 IEEE Computer Society Conference on, 1998, pp. 157-163.
[8] Cho-huak Teh and Roland T. Chin, "On Image Analysis by the Methods of Moments," IEEE Transactions on Pattern Analysis and machine Intelligence, vol. 10, pp. 496-513, 1988.
[9] Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing(Third Edition): Prentice Hall, 2008.
[10]黃顯核.基于不變矩飛機型號識別方法研究與實現(xiàn) [D].成都:電子科技大學,2009.