王 磊,殷姣姣,余心杰
(1.太原科技大學電子信息工程學院,山西 太原 030024;2.浙江大學寧波理工學院信息科學與工程學院,浙江 寧波 315100)
三文魚[1]也稱為大西洋鮭魚,屬于硬骨魚綱鮭形目鮭亞目鮭科的種類,是生長在加拿大、挪威和美國等高緯度地區(qū)的屬于冷水性的高度洄游魚類。三文魚生長的溫度大致范圍是0℃~30℃。若生長在溫度適宜的環(huán)境下,三文魚會攝取很多的食物,生長速度很快。相反,若生長的環(huán)境不合適,三文魚的攝食量就會大幅度地減少,從而影響其生長的速度。因為三文魚是喜歡逆流生長的魚類,所以多采用流水型養(yǎng)殖。如果生長環(huán)境的水量和水流都是在最佳狀態(tài),則可刺激三文魚,使其保持其良好的物質代謝,促進其生長速度。研究表明,三文魚適宜的溶氧量為6 mg/L以上,最適合的pH 范圍為6.5~7.5。在養(yǎng)殖池中的三文魚主要喂養(yǎng)含有蝦青素的飼料,因此它的魚肉中含有蝦青素,所以其肉色為紅色或鮮橘紅色。
三文魚中富含腦黃金(DHA)、二甲氨基乙醇(DMAE)等主要成分,可預防慢性疾病、糖尿病等疾病,還可有效減輕因風濕、牛皮癬等疾病帶來的痛苦,并且還能降低血液中的膽固醇含量,因此三文魚是世界上最有益健康的魚類之一。此外,三文魚的魚肉中,膽固醇含量很低,熱量低,蛋白質含量高,符合現(xiàn)代食品營養(yǎng)學標準和人們對健康魚類的界定。
三文魚的肉色是消費者判斷其品質的重要標準,對肉色鮮紅的三文魚,要想知道其顏色,就必須將其進行宰殺并解剖。一般只通過觀察魚體本身,不能準確地辨別魚肉的質量,所以需要一種快速無損辨別魚肉質量的方法。因為蝦青素在可近紅外光下的光譜反射比較明顯,因此利用近紅外光譜儀對三文魚進行照射,得到的反射光譜數(shù)據(jù)[2]對三文魚進行肉色分級分類研究。
1)近紅外光譜儀:QE65000 光譜儀由Ocean Optics 研制。光譜儀的測量區(qū)間為350~1100 nm;探測器是CCD 探測器,該探測器總共有15 個光柵,光譜采樣間隔為0.81 nm,采集所用的軟件是配套的Ocean Optics SpectraSuite,該軟件的數(shù)據(jù)采集頁面如圖1 所示。
圖1 軟件的數(shù)據(jù)采集頁面
2)光源:光源是與近紅外光譜儀所對應的一個設備,該設備使用比較簡便,并且耐用、經濟,可測定的波長區(qū)間為300~1050 nm。
3)硬件環(huán)境:一臺PC 計算機,基本配置中等即可。實驗裝置如圖2 所示。
圖2 實驗裝置
1)樣本準備。
實驗所用的三文魚是山東省煙臺市東方海洋養(yǎng)殖基地養(yǎng)殖的。挑選重量在1 kg 左右的三文魚作為實驗目標。首先,在一個裝有干凈海水的小養(yǎng)殖池里,將挑選的三文魚進行麻醉,每次麻醉幾條,然后放在暗箱上。
2)光譜數(shù)據(jù)的獲取。
利用近紅外光譜儀對三文魚進行照射,照射的區(qū)域為圖3 中的虛線區(qū)域,每次測量都做好標記,便于以后進行處理。利用軟件把光譜數(shù)據(jù)存起來,對每條魚的一面進行測量,圖3 中虛線區(qū)域是測量范圍,這樣是為了避開魚體內部和外部因素對數(shù)據(jù)采集產生干擾。最后,剖開魚體的表面,將測量部位的肉色(如圖4 所示)與SalmoFanTM比色卡(圖5 所示)進行比對,并記錄等級。
圖3 魚肉的照射范圍
圖4 對照射部位進行解剖
圖5 三文魚的魚肉和SalmoFanTM比色卡比對
對采集三文魚的近紅外光譜數(shù)據(jù),首先消除樣本不均勻、基線漂移、高頻隨機噪聲等影響,對采集的光譜數(shù)據(jù)進行預處理,只保留300~1 000 nm 的數(shù)據(jù)來研究,其余波段的數(shù)據(jù)都去除;然后進行基線校準,并采用平均平滑法,再進行多元散射校正(MSC),得到預處理后的光譜數(shù)據(jù)(如圖6 所示);根據(jù)蝦青素的反射特點,最后采用350.51~580.05 nm 范圍的光譜數(shù)據(jù)來處理和分析。在實際出售中,以SalmoFanTM進行肉質鑒別,比色卡上等級24 以上的肉質是好的,所以分為2 類,等級大于24 的為第一類,等級小于24為第二類。
圖6 部分樣本預處理后的光譜數(shù)據(jù)
近一些年,在處理模式識別的各類問題上,稀疏表示分類算法是一種很重要的算法。稀疏表示分類算法的優(yōu)點是運用殘差進行數(shù)據(jù)的分類,比傳統(tǒng)的分類算法精確了不少,也提高了分類的準確度。目前,國內外的專家運用稀疏表示分類算法對圖像去噪[3]、自適應權重[4]和音樂流派與樂器分類[5]等方面進行研究,而且對稀疏表示分類器進行分類的范圍越來越多。例如基于和鉉識別在音樂結構和旋律方面的重要性,董麗夢利用稀疏表示分類器進行和弦識別,在識別率上高于傳統(tǒng)的識別方法[6]。
稀疏表示分類器[7]是一種基于l1最小化范數(shù)的分類器,在模式識別的應用中已經取得了很大的成效。在特征上,稀疏表示分類器是用少量的樣本數(shù)據(jù)來構成樣本訓練集,獲得比支持向量機(Support Vector Machine,SVM)和線性分類器等分類方法更好的分類性能[8-10]。下面采用本實驗數(shù)據(jù)來實現(xiàn)稀疏表示分類器的分類。
已知進行分類的光譜數(shù)據(jù)有80 個訓練樣本,訓練樣本數(shù)據(jù)可表示為:其中,Ai構成了i 類的向量空間,矩陣A 構成了1 種光譜數(shù)據(jù)的數(shù)據(jù)詞典,矩陣的行數(shù)表示每個樣本特征參數(shù)的個數(shù),矩陣的列數(shù)表示樣本的總數(shù)。
對于取自第k 類光譜數(shù)據(jù)的測試樣本的向量y,可由它的訓練矩陣A 所構成的空間線性表示:
在理想情況下,假設測試樣本y 是來自第k 類待測樣本,那么x 在其所屬類別的基Ak上的投影系數(shù)不為0,而在其他訓練樣本基(即Ai,i≠k)上的投影為0。但實際情況是,測試樣本的類別是未知的,如果所求的列向量足夠稀疏,根據(jù)壓縮感知理論[11-20],得到如下求解公式:
在光譜數(shù)據(jù)的獲取過程中會包含噪聲,那么y 就很難對A 進行準確的線性表示,因此上述表達式可改寫為:
對于第i 類,定義δi是選取中一個與第i 類有關的系數(shù)向量。因此,如果判別y 為第i 類時,用=Aδi)近似y,即與y 距離越小,屬于i 的可靠性越高。因此,提出識別y 所屬類別的方法如下:
其中,用第i 類訓練樣本重建y 的殘差為ri(y)。
其中L(y)表示y 的標記。
對預處理過的三文魚(其中100 個為訓練樣本,每類50 個;40 個為測試樣本,每類20 個)的光譜數(shù)據(jù)進行如下的操作:
1)稀疏表示算法在MATLAB2013a 下編程實現(xiàn),將數(shù)據(jù)的維數(shù)最終降到100 維。
2)主成分分析算法在MATLAB2013a 下編程實現(xiàn),共提取前100 個主成分。
3)基于線性判別分析的分類算法(LDA)在Matlab2013a 下編程實現(xiàn)。
4)基于最小二乘支持向量機算法(LS-SVM)在MATLAB2013a 下編程來實現(xiàn)。
光譜數(shù)據(jù)分別在主成分分析法和稀疏表示(降維方法)處理的基礎上,利用基于線性判別分析分類算法進行模型建立,通過分析得出結果;光譜數(shù)據(jù)在2 種降維方法處理后,再利用基于最小二乘支持向量機分類算法進行模型建立,通過分析得出結果。
表1 實驗的分類結果
從表1 中可以看出,在第一類中,不管是在LDA還是在LS-SVM 分類處理上,SR 降維處理的分類正確率都比PCA 高;在第二類中,雖然在LDA 分類處理上,SR 和PCA 降維處理后的分類正確率相同,但是在LS-SVM 分類處理上,SR 還是比PCA 降維后的分類正確率高。
因此,利用稀疏表示分類算法降維后的光譜數(shù)據(jù)進行分類的正確率比主成分分析降維后進行分類的正確率要高。因此,與主成分分析法的降維方法相比較,稀疏表示算法能有效地提取高維光譜數(shù)據(jù)中的信息,在此基礎上,能更好地對三文魚的肉質特色進行正確的分類。
本文利用稀疏表示分類算法對三文魚的近紅外光譜數(shù)據(jù)進行降維處理,再利用線性判別分析(LDA)和最小二乘支持向量機(LS-SVM)對三文魚的肉質建立了分類預測模型。實驗結果表明,利用稀疏表示算法對近紅外光譜數(shù)據(jù)進行降維,能取得比傳統(tǒng)的主成分分析法(PCA)光譜降維方法更好的分類預測結果。所以稀疏表示分類算法為近紅外光譜檢測中的海量數(shù)據(jù)降維提供了一種良好的新途徑。
[1]羅剛.大西洋鮭魚營養(yǎng)研究概況[J].畜牧與飼料科學,2009,30(5):23-25.
[2]高榮強,范世福.現(xiàn)代近紅外光譜分析技術的原理及應用[J].分析儀器,2002(3):9-12.
[3]喬雅莉.基于稀疏表示的圖像去噪算法研究[D].北京:北京交通大學,2009.
[4]段剛龍,魏龍,李妮.基于自適應權重的多重稀疏表示分類算法[J].計算機工程與應用,2014,50(8):173-177.
[5]徐星.基于最小-范數(shù)的稀疏表示音樂流派與樂器分類算法研究[D].天津:天津大學,2012.
[6]董麗夢,李鏘,關欣.基于稀疏表示分類器的和弦識別研究[J].計算機工程與應用,2012,48(29):133-136.
[7]Wright J,Yang A Y,Ganesh A,et a1.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,31(2):210-227.
[8]黃敏,萬相梅,朱啟兵,等.基于高光譜成像技術的菜用大豆厚度檢測[J].食品與生物技術學報,2012,31(11):1142-1147.
[9]蔣璐璐,駱美富,張瑜,等.汽車變速箱油的近紅外光譜識別研究[J].光譜學與光譜分析,2014,34(1):64-68.
[10]Wright J,Yang A Y,Ganesh A,et a1.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,31(2):210-227.
[11]杜愎剛,朱毅,朱會田.汽車自動變速器油質異常的原因及預防措施[J].潤滑與封閉,2004(3):104-105,109.
[12]Suykens J A K,Gestel T Van,Brabanter J De.Least Squares Support Vector Machines [M].World Scientific Publishing Company,2002.
[13]程國首,郭俊先,石呰,等.基于高光譜成像技術的新疆紅富士蘋果重量預測[J].新疆農業(yè)大學學報,2011,34(3):249-252.
[14]洪添勝,喬軍,Michael D Ngadi,等.基于高光譜成像技術的雪花梨品質無損檢測[J].農業(yè)工程學報,2007,23(2):151-155.
[15]徐爽,何建國,易東,等.基于高光譜成像技術的長棗糖度無損檢測[J].食品與機械,2012,28(6):168-170.
[16]孫玉寶.圖像稀疏表示模型及其在圖像處理反問題中的應用[D].南京:南京理工大學,2010.
[17]鄧承志.圖像稀疏表示理論及其應用研究[D].武漢:華中科技大學,2008.
[18]浦劍,張軍平.基于詞典學習和稀疏表示的超分辨率方法[J].模式識別與人工智能,2010,23(3):335-340.
[19]Donoho D.Compressive sensing[J].Transaction on Information Theory,2006,52(4):1289-1306.