王麗霞 馬美英 許媛等
摘要針對近年來我國內(nèi)陸水體富營養(yǎng)化程度日益嚴重,導致藍藻水華大規(guī)模爆發(fā)的情況,為了簡單快速識別藍藻,結合當前數(shù)碼攝像技術不斷提高的實際,提出并實現(xiàn)了利用高分辨率、高質(zhì)量的圖片對藍藻的關鍵特征進行識別的方法。該方法從空間域和頻域這兩個領域?qū)λ{藻圖片進行分析,首先引入色彩空間原理,根據(jù)預先所設的藍藻特征值門限處理圖片,提取藍藻在空間域上的顏色特征;然后利用傅里葉變換把空間域信號變換到頻域,并通過帶通濾波及高通濾波技術分析藍藻圖片,得到藍藻在頻域上的紋理特征;最后結合這兩個不同領域各自的結果交叉識別圖片中的藍藻。試驗結果表明,該方法能夠正確得到藍藻圖片的顏色特征和紋理特征,通過兩個特征能很好地識別藍藻,取得了較好的效果。
關鍵詞藍藻識別;顏色特征;傅里葉變換;紋理特征
中圖分類號S126文獻標識碼A文章編號0517-6611(2016)04-304-05
Research and Engineering Realization of Cyanobacteria Identification Based on Digital Photography
WANG Lixia, MA Meiying, XU Yuan, Shao Yubin*(College of Information Engineering and Automation, Kunming University of Science and Technology, Kunming, Yunnan 650000)
AbstractIn recent years, Chinas inland water eutrophication is becoming more and more serious, which results in algal outbreak in large scale. With the improvement of digital photography technology, a method was proposed and realized to identify cyanobacteria better and faster, which makes use of the high resolution and high quality images to identify the key features of cyanobacteria. This method analyzed the images in spatial domain and frequency domain. A spatial color principle was introduced firstly, images were handled according to predetermined Double Eigenvalue Threshold of cyanobacteria to get the color characteristics of spatial domain, and then the signal of spatial domain was transformed to frequency domain by Fourier transform. At the same time, cyanobacteria images were analyzed by bandpass filtering and highpass filtering technology, so as to obtain the texture characteristics on the frequency domain. Finally, the cyanobacteria in the images were identified by the results of the two domains. The experimental results showed that this method could get the color characteristics and texture characteristics from cyanobacteria images accurately, and identify cyanobacteria better by the two characteristics, and the result was satisfactory.
Key wordsCyanobacteria identification; Color characteristics; Fourier transform; Texture characteristics
根據(jù)歷年湖水檢測的數(shù)據(jù),國內(nèi)2/3以上的水質(zhì)由于不同程度的污染呈現(xiàn)嚴重的富營養(yǎng)化狀態(tài)[1],水體富營養(yǎng)化導致藍藻大面積滋生,最終形成藍藻水華現(xiàn)象,這也是水體惡化的突出表現(xiàn)[2]。水華現(xiàn)象的形成從根本上來說取決于藍藻的生物學特性,同時還受污染水體惡化程度、富營養(yǎng)化元素濃度、水體流速及環(huán)境變化等影響,嚴重的水質(zhì)污染已使藍藻水華幾乎連年爆發(fā),其對大自然的危害程度非常大。
我國湖泊河流眾多,水質(zhì)監(jiān)測和治理技術通過多年的積累和發(fā)展已經(jīng)逐漸形成了一套行之有效的體系,但仍然不夠精確地識別藍藻。該研究結合當前數(shù)碼攝像技術不斷提高的實際,提出利用高質(zhì)量圖片,提取藍藻特征,主要包括顏色特征和紋理特征,進而識別藍藻。對紋理特征的提取方法,各國研究者都進行了廣泛的研究,許多紋理特征提取方法也被相繼提出,如灰度共生矩陣法(GLCM)、灰度行程長度法(Gray Level Length)、自相關函數(shù)法、小波變換法、傅里葉變換法等。該研究主要采用傅里葉變換法提取了藍藻的紋理特征,針對此項變換在圖像處理中的研究十分廣泛,并取得了一定成果。 比如Zhou等[3]將圖像以8×8的正方形窗口分割,然后對分割后的圖像分別采用傅里葉變換變換到頻域,在此變換域中,變換后的系數(shù)通過相關設置和計算得到其紋理特征;文獻[4]中對圖像的最大矩形區(qū)域進行了傅里葉變換,然而結果得不到圖像的全局文體特征。王金滿等[5]通過研究木材切片中各種紋理與傅里葉周向譜能量的高、中、低頻段的關系,解譯出原細胞的規(guī)律結構。朱小燕等[6]利用傅里葉變換分析了字體單多間圖像及與傅里葉譜分布的關系,建立了粘連文字的判別算法,以及基于傅里葉變換的單字和多字圖像的判定準則。Tsai等[7]采用傅里葉功率譜的灰度對砂紙和皮革上的紋理缺陷進行了分析[8]。筆者結合藍藻識別的關鍵技術,以Visual Studio作為開發(fā)平臺,用C#語言進行代碼編寫,分別根據(jù)顏色特征值提取藍藻、由所選區(qū)域確定藍藻的特征值、根據(jù)傅里葉變換分析藍藻的頻域特征、提取藍藻圖像的紋理特征,由此實現(xiàn)了利用高質(zhì)量圖像對藍藻的識別,為水體中的藍藻監(jiān)測提供了更簡便的方法。
1藍藻識別的關鍵技術
1.1色彩空間描述顏色的空間主要有RGB空間和HSV空間,通過照片識別藍藻首先是對藍藻顏色的識別。藍藻的顏色主要為黃綠色,在RGB空間和HSV空間分別具有不同的表示[9]。
1.1.1 RGB空間。RGB顏色方案將顏色編碼為三基色[紅(R))、綠(G)、藍(B)]的混合。它是一個加性顏色系統(tǒng)。起初所有的顏色都為黑色,通過添加基色來形成不同的顏色,可以用公式(1)表示混合后的顏色[10]:
C=R(R)+G(G)+B(B)(1)
通常把RGB的值歸一化到區(qū)間[0,1],所以最終的顏色形成了一個單位立方體。
根據(jù)照片識別藍藻,這些照片都是在自然條件下拍攝的,因此必須運用相關算法減小光照強度產(chǎn)生的影響,將顏色模型采用歸一化顏色分量表示,用來克服光照變化及陰影的影響。
1.1.2HSV模型。HSV色彩空間模型是依據(jù)人們辨別顏色的習慣而研究出來的,是一種視覺上的生理模型。在圖像處理過程中,有時獲取到的圖像是基于RGB模型,而分析圖像時要用HSV模型,這樣就需要R、G、B成分轉(zhuǎn)換為H、S、V。HSV顏色模型的計算公式[11]如下:
SHSV=CrngChigh,Chigh>0
0,其他(2)
VHSV=ChighCmax(3)
其中Chigh、Clow、Crng定義如下:
Chigh=max(R,G,B)
Clow=min(R,G,B)
Crng=Chigh-Clow(4)
當3個RGB分量相等的時候,便是灰度圖像。這時Crng=0,飽和度SHSV=0,因此,色調(diào)無定義。于是只需計算Crng>0情況下時HHSV的值,首先將各分量歸一化:
R′=Chigh-RCrng,G′=Chigh-GCrng,B′=Chigh-BCrng(5)
然后,基于原始顏色分量中的最大值,計算出一個初步的色調(diào)H′:
H′=B′-G′,R=Chigh
R′-B′+2,G=Chigh
G′-R′+4,B=Chigh(6)
因為H′的值處在區(qū)間[-1,5],通過將其歸一化到區(qū)間[0,1],然后乘以360,得到最終的色調(diào)值范圍為0°~360°。
HHSV=16×(H′+6),H′<0
H′,其他(7)
H°HSV=HHSV×360(8)
1.2直方圖模塊任何一幅圖像的直方圖都包含了大量的信息,某些類型的圖像還可以通過其直方圖完全還原出原圖?;叶戎狈綀D是圖像灰度的線性函數(shù),描述的是圖像中0~255各個灰度級的個數(shù)?;叶戎狈綀D的分布函數(shù)[12]為h(k)=nk,在直角坐標系中表示,k的取值范圍為0~255,表示為在灰度級為k時,圖像中所含像素的個數(shù)為n。如果是8位灰度圖像,k=0,1,…,255。
24位彩色圖像每個像素用3個字節(jié)表示,每個字節(jié)對應著R、G、B分量的亮度(紅、綠、藍),一個字節(jié)為8位。R、G、B在計算機中的存儲順序是藍、綠、紅。當R、G、B分量值不同時,表現(xiàn)為彩色圖像。為了得到R、G、B的直方圖,對整張圖片進行掃描,每個像素又對應著R、G、B這3個分量??煞謩e統(tǒng)計R、G、B所處字節(jié)處的分量值,得到RGB直方圖。將RGB轉(zhuǎn)換到HSV空間后即可得到HSV的直方圖。RGB直方圖和HSV直方圖獲取與保存為藍藻特征值的提取做好了充分準備。
1.3傅里葉變換任何一幅圖像的直方圖都包含了大量的信息,某些類型的圖像還可以通過其直方圖完全還原出原圖。不同的圖像有可能會有相同的顏色特征值。于是需要用傅里葉變換來研究圖像在頻域的特征值。傅里葉變換的作用是把空間域信號變換到頻域,圖像的數(shù)據(jù)是二維離散數(shù)據(jù),則它們的傅里葉變換為離散的。
令f(x,y)表示一幅大小為M×N的圖像,x,y是空間域中圖像的橫、縱坐標軸,其中x=0,1,2,…,M-1;y=0,1,2,…,N-1。f(x,y)的二維離散傅里葉變換可表示為F(u,v)。F(u,v)是頻域圖像譜[13],通常F(u,v)是兩個實頻率變量u和v的復值函數(shù),頻率u是對應于x軸,頻率v是對應于y軸。
F(u,v)=M-1x=0N-1y=0f(x,y)e-j2π(ux/M+vy/N)(9)
其中u=0,1,2,…,M-1;v=0,1,2,…,N-1。離散傅里葉逆變換為:
f(x,y)=1MNM-1u=0N-1v=0F(u,v)ej2π(ux/M+vy/N)(10)
當以上兩式成立時,f(x,y)和F(u,v)形成了一個離散傅里葉變換(DFT)對。
傅里葉變換的振幅譜、相位譜和能量譜[14]分別為:
|F(u,v)|=R2(u,v)+I2(u,v)(11)
φ(u,v)=arctan(I(u,v)/R(u,v))(12)
E(u,v)=R2(u,v)+I2(u,v)(13)
其中R(u,v)、I(u,v)分別表示F(u,v)的實部和虛部,P(u,v)=|F(u,v)|2是傅里葉功率譜,又稱為能量譜。傅里葉變換具有共軛對稱性,即|F(u,v)|=|F(-u,-v)|,也就是頻譜分布是以圖像原點為對稱的。
一幅沒有絲毫紋理的光滑平坦圖像,其功率譜只有空間頻率為0的分量;當圖像中的紋理比較粗,也就是顏色的變化周期較大,則在低頻段會有較大能量;當紋理比較細,或比較復雜時,則在高頻段會有較大能大能量。
傅里葉變換提取圖像紋理特征常用的方法是周向譜和徑向譜能量法[15],特別是周向譜能量法。它的計算公式為:
P(u,v)=|F(u,v)|2(14)
其值表示空間域頻率強度,p(u,v)把用極坐標表示[16],設為p(r,θ),其中:
r=u2+v2,θ=arctan(v/u)(15)
則周向譜能量為p(r)=2πθ=1p(r,θ),即在功率譜中,計算以圖像形心為中心的一系列同心圓環(huán)內(nèi)能量的和值(如圖1中圓環(huán)),通過p(r)可以看到能量強度在不同頻率的分布情況。
一般的圖像都是長方形,由于u,v與x,y是對應的,又根據(jù)傅里葉變換的共軛對稱性,則圖像功率譜[p(r,θ)]也為相同的長方形,并且以圖像的形心為中心。而圓環(huán)r=u2+v2與功率譜形狀不相似,另外一系列逐漸外擴的圓環(huán)(最大圓環(huán)與長方形圖像短邊邊界內(nèi)切,如圖1所示)累加后不可能完全把圖像功率譜覆蓋,所以這種算法得到的傅里葉周向頻率分布圖不可能真正反映圖像的頻率特性。而與此圖像相似的一系列變大的長方環(huán)(如圖1中相似長方環(huán)),不僅與圖像形狀相似,而且可以完全覆蓋整個長方形的功率譜,所以長方環(huán)內(nèi)的功率譜能量可以反映出圖像不同頻率成分的能量強度,故此需要將傳統(tǒng)的圓環(huán)改進成形狀相似的長方環(huán)。
由于圖像大小不一,為了具有可比性,所以該研究采用各個長方環(huán)內(nèi)功率譜能量占整個圖像功率譜總能量的百分比作為紋理特征,均勻地把圖像功率譜分成M=20個等寬度的長方環(huán),求出每個長方環(huán)功率譜占總能量的百分比。設圖像大小為L×W,圖像中心為(L/2,W/2),則每個長方環(huán)內(nèi)能量百分比為fhi=Ei/Mu=0Nv=0P(u,v)[17]。
離散傅里葉變換的計算量是巨大的。對一幅M×N的圖像,它需要M2N2次復數(shù)乘法和加法。例如,M=N=512,則需要236=6.9×1010次復數(shù)乘法或者加法。
離散傅里葉變換的快速算法——快速傅里葉變換(FFT)在許多年以前就己經(jīng)被提出,并廣泛應用到各個領域。它是利用復指數(shù)(WN=e-j2π/N)的對稱性和周期性,通過蝶形結來簡化運算量的,它的計算復雜度不超過MN×log2MN。
2藍藻識別試驗
2.1功能分析為了提取藍藻的特征值,該研究選取Visual Studio作為開發(fā)平臺,用C#語言進行代碼編寫,分別實現(xiàn)藍藻的特征值提取的以下4個子功能,并按照以下順序分析:
(1)根據(jù)顏色特征值提取藍藻。根據(jù)設定的HSV門限值,將照片中在門限內(nèi)的像素部分提取出來顯示并計算其面積,并實現(xiàn)對藍藻的RGB直方圖和HSV直方圖的統(tǒng)計。
(2)由所選區(qū)域確定藍藻的特征值。在圖片中將肉眼可觀測到的藍藻部分用矩形圈出來或著曲線描出來,系統(tǒng)自動分析所選區(qū)域的HSV的門限值。
(3)傅里葉變換分析藍藻的頻域特性。將圖像經(jīng)過傅里葉變換到頻域后,觀察藍藻的高頻、低頻、中頻等分量和幅度圖像。
(4)紋理特征的提取。根據(jù)長方環(huán)周向譜能量百分比法提取藍藻圖像的紋理特征值。
2.2根據(jù)顏色特征值提取藍藻根據(jù)設定的顏色特征值的門限提取出照片中有藍藻的部分,并計算其面積。為了分析圖片中藍藻部分的各種特征值,得到圖片的RGB直方圖和HSV直方圖。
對現(xiàn)場采集圖像數(shù)據(jù)進行統(tǒng)計的過程中發(fā)現(xiàn),藍藻污染程度不同使得采集到的圖片中的藍藻區(qū)域的色彩特征有所不同,即使同一個藍藻區(qū)域,由于時間、光照強度和角度的不同也會使其色彩特征產(chǎn)生不同,所以綜合采樣樣本,選取顯著藍藻區(qū)域的HSV信息之進行統(tǒng)計,根據(jù)肉眼觀測時對藍藻色彩的感受,得到藍藻評估預警經(jīng)驗HSV判定模型值域為:H∈(70°,150°)。此門限值忽略了飽和度和亮度的影響,只根據(jù)色調(diào)進行藍藻的初步判斷。圖2中左邊分別為不同程度藍藻污染的圖片,肉眼可直接看出藍藻污染程度自上而下越來越嚴重。
結果表明,通過HSV特征值識別藍藻模塊基本能做到對藍藻有效的識別。
安徽農(nóng)業(yè)科學2016年2.3由所選區(qū)域確定藍藻的特征值上述功能中顏色特征值門限的獲取只是大致分析統(tǒng)計了H的數(shù)據(jù),觀察分析到的HSV門限與藍藻的門限存在一定差別,接下來在一張圖片中將認為是藍藻的部分用矩形圈出來或用曲線描出來,處理分析所選區(qū)域的HSV門限,并根據(jù)分析出來的HSV門限計算圖片中門限內(nèi)的面積,得到所有區(qū)域的顏色特征值RGB和HSV的值。這里只考慮HSV的門限,分析像素的HSV值,取其最小者為門限的下限,最大者為門限的上限,這樣可以獲得HSV的門限值,最終根據(jù)分析出來的門限值識別圖片中的藍藻。
從圖3可以看到,圖中矩形區(qū)域內(nèi)的門限值為:H∈(82°,138°),S∈(14%,43%),V∈(48%,82%)。在門限內(nèi)圖像顯示區(qū)域下方可得到門限為H∈(82°,138°),S∈(14%,43%),V∈(48%,82%)時,門限內(nèi)像素占整個圖像的百分比為97.7%,圖4為描點法的顯示結果。2.4傅里葉變換分析藍藻的頻域特性空間域和頻率域是數(shù)字圖像處理中兩個不同的領域。空間域是指圖像平面自身,它是以對圖像的像素直接處理為基礎的;頻率域是以圖像的傅里葉變換為基礎的。由于以上兩個功能只對時間域的藍藻的顏色進行了分析,通過顏色識別藍藻,但有些情況,在空間域內(nèi)表述十分困難,而在頻率域內(nèi)卻變得非常簡單,如不同的圖像會有同的顏色。例如草地、樹葉,有可能只通過顏色分析,軟件將其視為藍藻,于是還需要分析藍藻的頻域特性。
將一張圖片進行快速傅里葉變換,在進行快速傅里葉變換時,序列的長度一般都是以2為底的整數(shù)次冪,即基二算法。首先將圖片的大小調(diào)整為256×256。該研究采用按頻率抽取法進行運算,得到了圖片的幅度圖像和經(jīng)過成分濾波后的圖像。用該功能模塊分析藍藻和樹葉、草地的頻譜后,得出樹葉和草地的頻譜分布比較高。
打開任意一張圖片并執(zhí)行FFT處理,結果見圖5。
由圖6a和b能明顯看出,樹葉和藍藻的頻域分布是不同的。
2.5紋理特征的提取接下來對圖像進行紋理分析,此功能主要使用長方環(huán)傅里葉周向譜能量百分比算法,均勻地把圖像功率譜分成20個等間距同心長方環(huán),然后計算每一個長方環(huán)內(nèi)功率譜能量占總能量的比值作為圖像頻率分布特征。圖像FFT變換后得到以圖像中心為形心的頻譜圖像,由公式P(u,v)=|F(u,v)|2可得到圖像的功率譜,計算整個圖像的功率譜總能量EA。將圖像功率譜分為等間距的20個同心長方環(huán),分別計算每個長方環(huán)中的功率譜能量E[i]。然后計算每一個長方環(huán)內(nèi)功率譜能量占總能量的比值p作為圖像頻率分布特征。
對具有相同顏色特征值的草地、樹葉和藍藻進行紋理的對比。先將這3種圖像先經(jīng)過顏色特征的提取,結果見圖7,左半邊分別為草地、樹葉、藍藻的原圖,右半邊分別為經(jīng)過顏色特征值提取后所對應的圖片。
從圖7可看出,這3種圖片只經(jīng)過顏色特征值的門限處理后,并沒有將上述3張圖片完全區(qū)分開來,未達到識別藍藻的效果。然后對經(jīng)過顏色特征提取后的圖像繼續(xù)進行紋理特征的提取,結果分別如圖8~10所示。
圖8~10分別為草地、樹葉、藍藻原圖、FFT變換圖及其頻率分布,從紋理特征值的結果可明顯看出,藍藻的頻域分布主要集中于低頻,而樹葉和草地的頻域分布主要集中在中間的頻域部分。
3結語
該研究提出一種利用藍藻高質(zhì)量圖片進行特征值提取的簡單方法,實現(xiàn)了對藍藻的識別,將RGB模型和HIS模型配合使用,獲得RGB圖像和HSV直方圖。根據(jù)藍藻顏色特征值HSV的門限參數(shù)的設置處理圖像后,得到目標圖像的邊緣和區(qū)域,以此來提取藍藻空間域的特征值,再對有相似顏色特征的圖片以及不同程度的藍藻污染,采用傅里葉變換來分析其紋理差別,以此來提取藍藻在頻域的特征值。在實證中,對多種不同圖片進行了分析,結合提取出的顏色特征和紋理特征,能夠識別出圖中的藍藻,以此驗證了該方法的可行性,基本達到了預期目標,但仍然存在一些問題。如何提高特征提取的精確度,以便更好地滿足藍藻識別的準確性和高效性,還有待進一步研究。
參考文獻
[1] 劉文杰.內(nèi)陸湖泊藍藻水華的遙感監(jiān)測與評價研究[D].北京:中國地質(zhì)大學,2013:1-3.
[2] 周立國,馮學智,王春紅.太湖藍藻水華的MODIS衛(wèi)星監(jiān)測[J].湖泊科學,2008,20(2):203-207.
[3] ZHOU F F,SHI J Q.Texture feature based on local Fourier transform[J].IEEE international conference on imageprocessing,2001,17(2):610-613.
[4] CASTALMAN K R.Digital image processing[M].NY:Prentice Hall,1998.
[5] 王金滿,曲艷杰,李堅.傅里葉變換圖像方法在木材解剖特征研究上的應用[J].四川農(nóng)業(yè)大學學報,1998,16(1):177-181.
[6] 朱小燕,王松.傅里葉變換在粘連文字圖像切分中的應用[[J].計算機學報,1999,22(12):1246-1252.
[7] TSAI D M,HUANG T Y.Automated surface inspection for statistical textures[J].Image and vision computing,2003,21(4):307-323.
[8] CONNERS R,HARLOW C.A theoretical comparison of texture algorithms[J].IEEE transactions on pattern analysis and machine intelligence,1980,2(4):204-222.
[9] 孫燮華.數(shù)字圖像處理:Visual C#.NET編程與實驗[M].北京:機械工業(yè)出版社,2010:30-150.
[10] 田玉敏,林高全.基于顏色特征的圖像檢索[J].西安電子科技大學學報,2002,2(1):43-46.
[11] LIAPIS S,TZIRITAS G.Color and texture image retrieval using chromaticity histograms and wavelet frames[J].IEEE transactions on multimedia,2004,6(5):676-686.
[12] 趙春江.C#數(shù)字圖像處理算法典型實例[M].北京:人民郵電出版社,2009:24-178.
[13] 章毓晉.圖象工程(上冊):圖象分析與處理[M].北京:清華大學出版社,1999:231-241.
[14] REED T R,HANS J M,DU BUF.A review of recent texture segmentation and feature extraction techniques[J].Computer vsion,graphics and image processing,1993, 57(5):359-372.
[15] FURHT B,SMOLIAR S W,ZHANG H J.Video and image processing in multimedia systems[J].Boston:Kluwer Academinc Publishers,1995:226-270.
[16] CHANG S K,HSU A.Image information systems:Where we go from here[J].IEEE trans on knowledge and data engineering,1992,4(5):431-442.
[17] 周云龍,范振儒,蘇耀雷.基于圖像傅里葉變換紋理特征和概率神經(jīng)網(wǎng)絡的氣固流化床流型識別[J].化工自動及儀表,2009,36(2):38-42.