方益明,鄭紅平,馮海林
(1.浙江農(nóng)林大學(xué) 信息工程學(xué)院,浙江 臨安 311300;2.浙江農(nóng)林大學(xué) 天目學(xué)院,浙江 臨安 311300)
每種木材的細(xì)胞排列、幾何形態(tài)等特征都具有區(qū)別于其他樹(shù)種的獨(dú)立性,可以通過(guò)采集橫切面顯微圖像的特征參數(shù)建立數(shù)學(xué)模型來(lái)識(shí)別木材。目前,國(guó)內(nèi)外學(xué)者已開(kāi)展了大量開(kāi)創(chuàng)性的研究工作[1-3]。快速傅里葉變換(fast Fourier transform,F(xiàn)FT)是一種較常用的方法,它將木材顯微圖像從空間域轉(zhuǎn)換到頻率域,進(jìn)行特征提取、分類與識(shí)別等。由FFT得到的功率譜圖具有周期性和平移不變性,能有效克服圖像采集位置不同給木材識(shí)別帶來(lái)的困難。日本學(xué)者早就利用傅立葉變換研究了日本針葉材和闊葉材橫切面細(xì)胞的排列[4-5];東北林業(yè)大學(xué)通過(guò)構(gòu)建木材解剖特征FFT圖譜,得出對(duì)木材橫切面解剖圖像進(jìn)行特征參數(shù)提取、量化細(xì)胞排列的方向性和周期性的方法[6];多化瓊等[7]利用傅立葉變換分析了垂柳Salix babylonica,閩楠Phoebe bournei的細(xì)胞排列,得出其能量角度分布,為數(shù)字化識(shí)別木材提供了新依據(jù)。獨(dú)立成分分析(independent component analysis,ICA)是一種基于高階統(tǒng)計(jì)特性的分析方法,具有較好的局部表征能力,而且在應(yīng)用中以非高斯分布為前提,更符合自然數(shù)據(jù)的分布,能更加全面地揭示圖像的本質(zhì)結(jié)構(gòu)[8-10]。筆者采用得到廣泛應(yīng)用的FastICA算法,提取木材顯微圖像FFT功率譜圖特征,并結(jié)合多類別支持向量機(jī)(support vector machine,SVM)實(shí)現(xiàn)木材識(shí)別。
令f(x,y)表示一幅大小為M×N的木材顯微圖像,f(x,y)的離散傅里葉變換可表示為:
式(1)中:x,y是空間域中圖像的橫坐標(biāo)和縱坐標(biāo);F(u,v)是頻域圖像譜,通常F(u,v)是2個(gè)實(shí)頻率變量u和v的復(fù)值函數(shù),頻率u對(duì)應(yīng)于x軸,頻率v對(duì)應(yīng)于y軸。
變換后功率譜為:
式(2)中: R(u,v), I(u, v)分別表示 F(u, v)的實(shí)部和虛部。
木材橫切面細(xì)胞排列具有顯著的規(guī)律性和周期性,圖像在二維平面上作平移運(yùn)算,其功率譜P(u,v)具有不變性。圖1-a是將楓香Liquidambar formosana的顯微圖像沿上下左右4個(gè)方向隨機(jī)平移得到的圖像,圖1-b是對(duì)應(yīng)的FFT功率譜圖。
圖1 楓香顯微圖像的傅里葉變換功率譜圖Figure1 FFT power spectrum of Liquidambar formosana micrograph
設(shè)混合信號(hào) X= {x1(t),x2(t),…,xn(t)}是未知的、 相互獨(dú)立的源信號(hào) S= {s1(t), s2(t), …, sm(t)}(m≤n)的線性組合, 其模型描述為:
式(3)中:aij(i,j=1,2,…)是未知的模型系數(shù),用矩陣形式描述為:
式(4)中:A是未知的滿秩矩陣,稱為混合矩陣。當(dāng)有k個(gè)采樣數(shù)據(jù)時(shí),上式可進(jìn)一步寫為:
ICA算法就是在S和A都未知的情況下,尋找分離矩陣WT=A-1,并從X中分離源信號(hào),使得分離后的信號(hào)最大程度獨(dú)立。其中A-1為A的逆矩陣,即:
ICA實(shí)際上是一種優(yōu)化問(wèn)題,即如何使得分離出來(lái)的各獨(dú)立分量盡可能逼近各獨(dú)立源信號(hào),它主要包括建立優(yōu)化判據(jù)(目標(biāo)函數(shù))和探尋優(yōu)化算法。優(yōu)化判據(jù)的目標(biāo)函數(shù)是對(duì)所分離的各分量之間獨(dú)立程度的度量,目前常用的判據(jù)有基于非高斯性、互信息最小、極大相似估計(jì)。筆者采用FastICA[11]算法計(jì)算分離矩陣 。該算法又稱為快速不動(dòng)點(diǎn)算法,是一種快速的尋優(yōu)迭代算法,能同時(shí)從多路輸入信號(hào)中分離出高斯源和亞高斯源。該算法所依據(jù)的判斷是負(fù)熵最大化,具有非常快的收斂速度。
選取柏木 Cupressus funebris,檫木 Sassafras tzumu,大葉冬青Ilex latifolia和大葉錐Castanopsis megaphylla等4種木材的顯微圖像作為源信號(hào)(圖2-a),圖2-b是它們的混合圖像,其混合矩陣為在(0,1)范圍內(nèi)隨機(jī)產(chǎn)生的4×4矩陣:
分離結(jié)果見(jiàn)圖2-c。
圖2 FastICA算法測(cè)試結(jié)果Figure2 Performance of FastICA algorithm
目前絕大多數(shù)ICA算法都是針對(duì)一維信號(hào)處理的,為了將ICA用于木材顯微圖像識(shí)別,首先將二維圖像(K行,L列)按行堆疊成N=K×L維的行向量xi,xi∈RN,則M幅圖像構(gòu)成一個(gè)M行N列的矩陣假設(shè)這M幅圖像也是由M幅統(tǒng)計(jì)獨(dú)立的基圖像線性組合而成的,即:X=AS,其中S的每一行都代表一幅大小為K×L的基圖像,A為混合矩陣,用FastICA求出分離矩陣W,使得輸出Y=WX的行向量盡可能地相互獨(dú)立,即Y為S的近似。
由Y可以構(gòu)成一個(gè)子空間,將待識(shí)別圖像投影到這個(gè)空間,即用這組獨(dú)立的基圖像的線性組合來(lái)表示,設(shè)f為待識(shí)別圖像(列向量),則有:
式(7)中:αi稱為f在基向量yi方向上的投影系數(shù),根據(jù)這個(gè)投影系數(shù)就可以設(shè)計(jì)適當(dāng)?shù)姆诸惼鲗?shí)現(xiàn)圖像識(shí)別。經(jīng)上述處理,將原來(lái)的K×L維的圖像降到了M維,實(shí)現(xiàn)了特征提取的功能,接著對(duì)降維后的圖像進(jìn)行分類。具體算法如下:第1步,將圖庫(kù)中的木材顯微圖像進(jìn)行濾波,消除噪聲干擾,然后將其歸一化成K×L大小的圖像;第2步,對(duì)歸一化后的圖像進(jìn)行FFT變換,得到其FFT功率譜圖;第3步,隨機(jī)選取一定數(shù)量的FFT功率譜圖作為訓(xùn)練樣本,用上述的FastICA算法進(jìn)行分解,產(chǎn)生一定數(shù)量的特征向量,并由此向量構(gòu)成一子空間;第4步,將所有的木材顯微圖像FFT功率譜圖投影到上述子空間中,并以投影系數(shù)代替原圖像,實(shí)現(xiàn)特征提?。坏?步,利用多類別支持向量機(jī)[12]對(duì)投影系數(shù)進(jìn)行訓(xùn)練和識(shí)別。
選擇20種木材,在各種木材的不同切片位置采集10幅256灰度級(jí)、128×128的顯微圖像,共200幅。圖3所示為部分木材顯微圖像。為了驗(yàn)證算法性能,每種木材隨機(jī)選擇5幅作為訓(xùn)練樣本,5幅作為測(cè)試樣本。
圖3 部分實(shí)驗(yàn)樣本Figure3 Partial samples used in experiments
由圖4可以看出,對(duì)于訓(xùn)練樣本的平均識(shí)別率達(dá)到100%,對(duì)未經(jīng)過(guò)訓(xùn)練的測(cè)試樣本,平均識(shí)別率也達(dá)到了96%左右。這說(shuō)明筆者設(shè)計(jì)的木材識(shí)別方法具有較高識(shí)別率。隨著參加識(shí)別的木材種類的變化,識(shí)別率出現(xiàn)小幅波動(dòng),但中心值基本保持不變。
圖4 實(shí)驗(yàn)結(jié)果Figure4 Experiment results
由實(shí)驗(yàn)結(jié)果可以看出,由獨(dú)立成分分析(ICA)方法提取的快速傅里葉變換 (FFT)功率譜圖特征具有較強(qiáng)描述能力,結(jié)合分類能力強(qiáng)的多類別支持向量機(jī),能有效識(shí)別木材種類。該方法的不足之處在于添加樣本后,需要對(duì)樣本集重新進(jìn)行訓(xùn)練。進(jìn)一步的研究工作將圍繞顯微圖像預(yù)處理、大樣本空間識(shí)別、獨(dú)立基選擇等方面展開(kāi)。
[1]汪杭軍,張廣群,祁亨年,等.木材識(shí)別方法研究綜述[J].浙江林學(xué)院學(xué)報(bào),2009,26(6):896-902.WANG Hangjun, ZHANG Guangqun, QI Hengnian, et al.A review of research on wood recognition technology [J].J Zhejiang For Coll, 2009, 26 (6): 896-902.
[2]任洪娥,徐海濤.細(xì)胞特征參數(shù)計(jì)算機(jī)的提取理論[J].林業(yè)科學(xué),2007,43(9):68-73.REN Hong’e, XU Haitao.The characteristic parameter extraction of cell in board assortment recognition technology [J].Sci Silv Sin, 2007, 43 (9): 68-73.
[3]劉鎮(zhèn)波.木材顯微圖像特征參數(shù)提取與樹(shù)種判別方法研究[D].哈爾濱:東北林業(yè)大學(xué),2004.LIU Zhenbo.The Research on the Extraction of Wood Micrograph Parameters and the Method of Wood Recognition [D].Harbin: Northeast Forestry University, 2004.
[4]DIAO X M, FURUNO T, UEHARA T.Analysis of cell arrangement in soft woods using two-dimensional fast Fourier transformation [J].Mokuzishi, 1996, 42 (7): 634-641.
[5]FUJITA M, OHYAMA M, SAIKI H.Characterization of vessel distribution by Fourier transform image analysis, recent fast fourier transforms [J].Wood Anat, 1995, 34 (2): 36-44.
[6]李堅(jiān).木材波譜學(xué)[M].北京:科學(xué)出版社,2003:202-232.
[7]多化瓊,王喜明.利用傅立葉變換研究闊葉材纖維細(xì)胞排列利用傅立葉變換研究闊葉材纖維細(xì)胞排列[J].西北林學(xué)院學(xué)報(bào), 2009, 24 (2): 121-123.DUO Huaqiong, WANG Ximing.Analysis of cell arrangements in hardwood by Fourier transform [J].J Northwest For Univ,2009, 24 (2): 121-123.
[8]孔銳,施澤生,郭立,等.獨(dú)立分量分析在圖像特征提取中的應(yīng)用[J].模式識(shí)別與人工智能,2004,17(1):114-118.KONG Rui, SHI Zesheng, GUO Li, et al.Application of independent component analysis in image features extracting[J].Pattern Recognition&Artif Intell, 2004, 17 (1): 114-118.
[9]宦若虹,楊汝良.基于ICA和SVM的SAR圖像特征提取與目標(biāo)識(shí)別[J].計(jì)算機(jī)工程,2008,34(13):24-25,28.HUAN Ruohong, YANG Ruliang.SAR Images feature extraction and target recognition based on ICA and SVM [J].Comput Eng, 2008, 34 (13): 24-25, 28.
[10]丁佩律,梅劍鋒,張立明,等.基于獨(dú)立分量分析的人臉自動(dòng)識(shí)別方法研究[J].紅外與毫米波學(xué)報(bào),2001,20(5):361-364.DING Peilu, MEI Jianfeng, ZHANG Liming, et al.Research of automatic face recognition on based on ICA [J].J Infrared Millim Wave, 2001, 20 (5): 361-364.
[11]HYVARINEN A, OJA E.A fast fixed-point algorithm for independent component analysis [J].Neural Comput, 1997, 9(7): 1483-1492.
[12]萬(wàn)九卿,李行善.基于串行支持向量分類器的模擬電路故障診斷[J].北京航空航天大學(xué)學(xué)報(bào),2003,29(9):789-792.WAN Jiuqing, LI Xingshan.Analog circuits fault diagnose based on serial support vector multi-classifier[J].J Beijing Univ Aeron Astronaut, 2003, 29 (9): 789-792.