杜偉東,李海森,魏玉闊,徐超
(1.哈爾濱工程大學水聲技術(shù)重點實驗室,黑龍江 哈爾濱150001;2.哈爾濱工程大學水聲工程學院,黑龍江 哈爾濱150001)
魚類識別是漁業(yè)資源評估中重要手段之一,雖然目前已有多種方法來進行魚類識別[1-3],然而魚是一個復(fù)雜的聲散射體,魚體及魚鰾的方位、大小、形狀嚴重影響魚的聲散射特征,特別是對于有鰾魚種,魚鰾是散射信號的主要貢獻體,而魚鰾是外表面不規(guī)則的散射體,導致魚在不同聲散射方位上表現(xiàn)的散射特性是不同的[4],因此單一方位探測勢必會丟失魚的散射信息。而且魚在水中是自由游動的,探測時不能預(yù)見魚在波束內(nèi)的具體方位,因此實際環(huán)境下獲得魚的聲散射特性在單一散射方位上表現(xiàn)出一定的隨機性,造成在魚類識別過程中存在由于魚的方位不同引起的分類正確率低、甚至不能正確分類的問題,而多方位聲散射數(shù)據(jù)融合方法同時利用了魚在多個方位的聲散射特性,這種方法在水下目標識別領(lǐng)域有所應(yīng)用[5-6],本文結(jié)合魚聲散射特性的研究,從多方位聲散射數(shù)據(jù)決策層融合角度出發(fā),利用小波包變換(wavelet packet transform,WPT)、離散余弦變換(discrete cosine transform,DCT)進行基于上述特性的特征提取,利用支持向量機(SVM)對提取的特征做出決策,并通過決策層融合的方法得到最終識別結(jié)果。
對于有鰾魚種,由于魚鰾的存在使得相同魚種在不同方位上表現(xiàn)的散射特性是不同的,但是對于類別上的表現(xiàn)是相關(guān)的,而不同魚種由于魚鰾形狀不同,導致在多個方位上都表現(xiàn)出了不同的聲散射特性。多方位數(shù)據(jù)融合魚類識別方法能同時利用多個方位的魚聲散射信息進行魚類識別,有效解決了在魚類識別過程中只利用單方位聲散射信息存在的問題,進而提高識別率。
選取3種魚作為識別對象,即鯽魚、金鱒、鯉魚,其中鯉魚選取大小不同的2條,定義為小鯉魚、大鯉魚,實驗用魚體照片如圖1所示,實測鯽魚、金鱒、小鯉魚、大鯉魚叉上分別為 26、35、33、41 cm。
圖1 魚體照片F(xiàn)ig.1 Fish body photos
圖2為多方位聲散射數(shù)據(jù)獲取方法示意圖,其中中間黑色點代表發(fā)射換能器,兩側(cè)灰色點代表接收換能器,相鄰換能器之間距離為30 cm。基于現(xiàn)有條件,利用單只標準水聽器代替接收換能器,在不同方位采集魚的聲散射信號,是實際應(yīng)用中,可以利用多個接收換能器組成圖2所示的結(jié)構(gòu),同時獲取魚在不同方位上的聲散射信號。
圖2 多方位聲散射數(shù)據(jù)獲取示意圖Fig.2 Multi-azimuth acoustic scattering data acquisition schematic
針對上述魚種在哈爾濱工程大學水聲技術(shù)重點實驗室消聲水池進行了水池實驗,水池進行了6面消聲處理。主要實驗設(shè)備為發(fā)射換能器、標準水聽器、采集器、激光筆等。實驗現(xiàn)場如圖3所示,發(fā)射換能器朝向魚體發(fā)射聲脈沖信號,水聽器接收魚的聲散射信號,并由采集器進行采集。實驗過程中采用了防水激光筆,利用激光筆發(fā)射出來的綠色細光束強光確保發(fā)射波束中心正對魚中心。發(fā)射換能器中心頻率150 kHz,帶寬40 kHz,換能器沿軸線方向發(fā)射聲CW脈沖信號,波束角度 3.8°,脈寬 0.05 ms。換能器與魚體之間距離4 m,滿足遠場條件。
圖3 實驗現(xiàn)場示意圖Fig.3 Experiment site schematic
如圖4所示,特征提取主要包括小波包變換、小波包子帶能量、離散余弦變換、特征降維等步驟,子帶能量體現(xiàn)了魚在不同頻帶的響應(yīng)信息,離散余弦變換則體現(xiàn)了魚在形狀上表現(xiàn)的散射特征信息。
圖4 特征提取流程圖Fig.4 Flow chart of features extraction
1.3.1 特征提取
小波包變換是獲取信號局部特征的良好工具[7]。不同形狀的魚,其內(nèi)部解剖結(jié)構(gòu)差異較大,其各個部分對散射信號的貢獻是有差異的,散射信號會表現(xiàn)出不同的能量分布特性。因此,對單體魚散射信號進行小波包變換,則小波包子帶能量體現(xiàn)了魚聲散射信號的在不同頻帶內(nèi)的能量分布特性。
離散余弦變換是一種實數(shù)域變換,其變換核為實的余弦函數(shù),并具有算法快速及系數(shù)分布比較集中的特點,且利用很少的系數(shù)集中了信號大部分的能量,其主要用來表征不同形狀目標的特征。
對于魚的聲散射信號x(n),n=0,1,…,N-1,其離散余弦變換定義為
其中,
式中:k=0,1,…,N-1;x(l)為特征量,l=0,1,…,L-1為特征量個數(shù)。對魚散射信號進行Hilbert變換,求解信號包絡(luò),對包絡(luò)信號進行小波包變換,每個子帶的頻寬為
式中:N為小波包分解層數(shù),采樣率為fs=1 MHz,進行6層小波包分解,計算得出每個子帶頻寬約為7.8 kHz。圖5為第1個方位下3種魚散射信號頻譜,頻域響應(yīng)波動集中在50 kHz內(nèi),由式(3)計算需要6.4個子帶能覆蓋50 kHz的頻寬,6層小波變換共產(chǎn)生64個子帶,此處取6個子帶。
圖5 魚散射信號頻譜Fig.5 Fish scattering signal spectrum
對包絡(luò)信號進行dB4小波包分解,并進行重構(gòu),設(shè)小波包重構(gòu)序列Sj,k,則各頻帶的能量表示為
式中:j=1,2,…,6 為接收方位號,k=1,2,…,6 為小波包節(jié)點號,則構(gòu)成的特征向量為
圖6 小波包子帶能量Fig.6 Wavelet packets sub-band energy
圖6為提取得到第1個方位聲散射信號的小波包子帶能量,可以看出,3種魚的小波包子帶能量表現(xiàn)出不同的分布特性,相對而言,大鯉魚和小鯉魚有較為相近的能量分布特性。
在得到小波包子帶的基礎(chǔ)上,對子帶進行離散余弦變換,變換后波動主要集中在前14個系數(shù),故取每個子帶的前14個離散余弦變換系數(shù)作為特征量,對于離散余弦變換系數(shù)序列Dj,k,構(gòu)成的特征向量為
式中:j=1,2,…,6 為接收方位號,k=1,2,…,6 為小波包節(jié)點號。
第1個方位下得到的第1個子帶離散余弦變換系數(shù)如圖7所示,可以看出,3種魚的離散余弦變換系數(shù)表現(xiàn)出不同的分布特性,相對而言,大鯉魚和小鯉魚有較為相近的分布特性。
圖7 子帶離散余弦變換系數(shù)Fig.7 Sub-band discrete cosine transform coefficients
將小波包子帶能量與離散余弦變換系數(shù)特征進行組合,共得到90個特征值,特征向量為
1.3.2 特征降維
上述特征提取方法得到的特征維數(shù)較高,高維特征對于魚類識別具有不同貢獻。有些特征對于識別的貢獻較大,有些特征則不是。因此,對高維特征進行降維處理,保留對識別貢獻大的特征,對提高識別率和結(jié)果穩(wěn)定性具有十分重要的意義。
通過Fisher判別函數(shù)判斷每個類之間對應(yīng)特征的距離[8],從而得到每個特征對識別的貢獻能力,F(xiàn)isher判別函數(shù)表示為
式中:i、j代表類別;分別為類i、j特征樣本的均值與方差。經(jīng)過判別,貢獻能力大的特征被保留下來組成新的特征向量。利用Fisher函數(shù)判別時,小鯉魚、大鯉魚的特征向量各取一部分樣本組成鯉魚特征向量的樣本集合,鯉魚、金鱒、鯽魚特征樣本集合樣本數(shù)相等,圖8分別為2類魚樣本特征判別比、3類魚樣本特征判別比。
其中,前6個結(jié)果為小波包子帶能量特征量判別比,后84個結(jié)果為小波包子帶離散余弦變換系數(shù)特征量判別比。經(jīng)驗證發(fā)現(xiàn),判別門限設(shè)置為3.84時識別效果最佳,此時保留的特征量總個數(shù)為49個,其中5個子帶能量特征,44個子帶離散余弦變換系數(shù)特征。同時可以看出,鯽魚、金鱒之間特征判別距離整體上略小于二者分別與鯉魚之間的判決距離。
圖8 Fisher判別比Fig.8 Fisher discrimination ratios
在水下目標識別領(lǐng)域,SVM因具有較低的分類誤差而被認為是一種性能較佳分類器[9]。它通過由內(nèi)積函數(shù)定義的非線性變換將低維的輸入空間轉(zhuǎn)化為某個高維空間,將非線性分類問題變換為線性分類問題,并在高維空間中求解廣義最優(yōu)分類面。
圖9為決策融合算法結(jié)構(gòu),A個方位的聲散射數(shù)據(jù)單獨進行提取特征,各個方位的特征量單獨通過SVM分類器,決策結(jié)果表示成后驗概率的形式,將概率融合為一個整體概率向量,輸入至下一級SVM分類器,得出最終分類結(jié)果,這種方法的特點是利用多方位數(shù)據(jù)進行多次決策,得到高精度的魚類識別結(jié)果。
圖9 決策融合算法結(jié)構(gòu)Fig.9 Decision fusion algorithm structure
對于非線性可分SVM,有
存在一個決策邊界,此時SVM的輸出為
如果不考慮其中的符號函數(shù)運算,則SVM輸出了樣本與最大邊緣超平面之間的距離,但是SVM并不能直接得到后驗概率[10]。
SVM實際上是一個2類分類器,在Cl類情況下,可以采用“一對一”或“一對多”方式,在“一對多”方法中,對于k分類則需要訓練k個分類器,則得出k個決策超平面,樣本離第i個決策超平面越遠,分類正確的可能性越大,即屬于第i類。因此,可以將輸出的距離表示為
則每個方位輸出的后驗概率向量為
將每個方位的后驗概率向量進行組合,得到的多方位決策后驗概率為
將組合后的概率作為特征向量,輸入下一級SVM,做出最終類決策。
每個方位1 000組采樣數(shù)據(jù),其中500組作為分類器訓練樣本,剩余500組作為分類器測試樣本,通過隨機抽取樣本的方式構(gòu)建訓練集與測試集。選取徑向基函數(shù)為SVM分類器核函數(shù),代價系數(shù)和高斯濾波器寬度采用基于交叉驗證的網(wǎng)格搜索方法尋找最優(yōu)值。
圖10 不同方位數(shù)下的正確識別率Fig.10 The identification rates under different numbers of azimuths
采用降維后的子帶能量、子帶離散余弦變換系數(shù)組合特征作為特征向量對3種魚進行識別。如圖2所示,自下而上依次取1~6個接收方位,在不同方位數(shù)量情況下識別率如圖10所示。可以看出,隨著方位數(shù)量的增加,識別率呈升高趨勢,其中鯉魚識別率總體高于鯽魚、金鱒識別率,鯽魚、金鱒識別率曲線變化趨勢相似,與Fisher判別函數(shù)對特征的判別結(jié)果相對應(yīng),這也進一步說明特征降維方法的有效性。識別率最終達到90%以上,表明多方位數(shù)據(jù)決策層融合方法具有更優(yōu)的魚類識別性能。
為進一步檢驗識別性能,采用大、小鯉魚樣本互相驗證的方式,即大鯉魚樣本、小鯉魚樣本分別作訓練樣本、測試樣本進行測試,識別結(jié)果如圖11所示??梢钥闯觯篚庺~作訓練樣本、小鯉魚作測試樣本,小鯉魚作訓練樣本、大鯉魚作測試樣本都具有很高的識別率,而且隨著方位數(shù)的增加呈升高趨勢,進一步驗證了方法的有效性。
圖11 鯉魚互相驗證正確識別率Fig.11 The identification rates of carp under cross validation
本文研究了基于小波包子帶能量及離散余弦變換系數(shù)特征的多方位聲散射數(shù)據(jù)決策層融合魚類識別方法,并進行了實驗設(shè)計與驗證,得出如下結(jié)論:
1)通過小波包變換與離散余弦變換得到的特征從不同角度描述了不同種類魚聲散射特性上的差異性,針對特征維數(shù)高的特點,通過Fisher判別方法有效降低了特征降維,可以為有效進行魚類識別提供性能穩(wěn)健的特征。
2)將決策結(jié)果通過SVM的輸出表示成后驗概率的形式,并對后驗概率進行二次決策,通過這種多方位數(shù)據(jù)決策層融合,并進行多次決策的識別方法,三類魚的整體識別率呈升高趨勢,方法效果明顯。
3)方法本質(zhì)是取決于不同魚種魚鰾本身的不同,以及其在多個方位上的聲散射特性,實驗所選擇的目標魚種并沒有特別的針對性,樣本具有完全的隨機性,表明所提出的方法具有一定普遍性。
[1]ROBOTHAM H,BOSCH P,CARLOS J,et al.Acoustic identification of small pelagic fish species in Chile using support vector machines and neural networks[J].Fisheries Research,2010,102(1/2):115-122.
[2]LUNDGREN B,NIELSEN J R.A method for the possible species discrimination of juvenile gadoids by broad-bandwidth backscattering spectra vs.angle of incidence[J].ICES Journal of Marine Science,2008,65(4):581-593.
[3]SLAS-CITAL A,ATKINS P R,F(xiàn)OO K Y.Broadband amplitude and phase sonar calibration using LFM pulses for high-resolution study of hard and soft acoustic targets[C]//OCEANS 2011,Spain,2011:1-8.
[4]LIU G,JAYATHILAKE P G,KHOO B C.Conformal mapping for the Helmholtz equation Acoustic wave scattering by a two dimensional inclusion with irregular shape in an ideal fluid[J].Journal of the Acoustical Society of America,2012,131(2):1055-1065.
[5]CARTMILL J,WACHOWSKI N,AZIMI-SADJADI M R.Buried underwater object classification using a collaborative multi-aspect classifier[J].IEEE Journal of Oceanic Engineering,2009,34(1):32-44.
[6]杜偉東,李海森,陳寶偉,等.一種基于聲散射特性的有鰾魚特征獲取方法[J].應(yīng)用聲學,2014,33(6):505-511.DU Weidong,LI Haisen,CHEN Baowei,et al.Features acquisition of fish with swim bladder baesd on acoustic scattering characteristics[J].Journal of Applied Acoustics,2014,33(6):505-511.
[7]張汝波,張鑫瑜,李雪耀.利用支持向量機和高階累量實現(xiàn)飛機類型識別[J].哈爾濱工程大學學報,2010,31(3):366-370.ZHANG Rubo,ZHANG Xinyu,LI Xueyao.Recognizing aircraft type using a support vector machine and a higher order cumulant[J].Journal of Harbin Engineering University,2010,31(3):366-370.
[8]AZIMI-SADJADI M R,YAO D,JAMSHIDI A,et al.Underwater target classification in changing environments using an adaptive feature mapping[J].IEEE Transactions on Neural Networks,2002,13(5):1099-1111.
[9]LI D,AZIMI-SADJADI M R,ROBINSON M.Comparison of different classification algorithms for underwater target discrimination[J].IEEE Transactions on Neural Networks,2004,15(1):189-194.
[10]石強,陳鳳娥,梅天燦,等.SVM后驗概率結(jié)合改進多尺度MRF的遙感影像分割方法[J].武漢大學學報信息科學版,2013,38(2):195-199.SHI Qiang,CHEN Feng’e,MEI Tiancan,et al.Remote sensing image segmentation based on SVM posterior probability and improved multi-scale MRF[J].Geomatics and Information Science of Wuhan University,2013,38(2):195-199.