摘要:利用光譜儀測得三種品牌共150個機(jī)油樣本的光譜數(shù)據(jù),再借助數(shù)據(jù)處理軟件對原始光譜數(shù)據(jù)進(jìn)行處理,處理后的數(shù)據(jù)先采用主成分分析法對機(jī)油品種進(jìn)行定性分類,然后利用小波變換技術(shù)提取光譜特征信息,把光譜特征信息作為人工神經(jīng)網(wǎng)絡(luò)的輸入建立機(jī)油品種識別模型,對機(jī)油品種進(jìn)行定量鑒別。從每種機(jī)油50個樣本共計(jì)150個樣本中隨機(jī)抽取120個樣本(每種40個樣本)用來建立神經(jīng)網(wǎng)絡(luò)模型,剩下的30個機(jī)油樣本用于預(yù)測。品種識別準(zhǔn)確率達(dá)到100%。說明本文提出的方法具有很好的分類和鑒別作用,為機(jī)油的品種鑒別提供了一種新方法。
關(guān)鍵詞:可見-近紅外光譜;信息處理;機(jī)油;主成分分析;小波變換;人工神經(jīng)網(wǎng)絡(luò)
機(jī)油是保證發(fā)動機(jī)正常運(yùn)轉(zhuǎn),減少機(jī)件間摩擦的必需潤滑劑,其內(nèi)在品質(zhì)的檢測及品種鑒別一直是機(jī)油生產(chǎn)研究的重要課題。國內(nèi)外學(xué)者已在機(jī)油品質(zhì)對減少機(jī)械磨損方面做過大量研究[1],也有學(xué)者在機(jī)油添加劑技術(shù)及測量機(jī)油粘度方面進(jìn)行了研究[2],但對機(jī)油的品種鑒別方面研究還很少。研究一種簡單、快速的機(jī)油品種鑒別方法,在目前機(jī)油種類繁多,良莠不齊的市場中防止假冒產(chǎn)品,避免劣質(zhì)機(jī)油進(jìn)入市場是很有必要的。本文以可見-近紅外光譜技術(shù)為基礎(chǔ)研究了機(jī)油的品種鑒別,相對用紅外光譜技術(shù)研究具有容易實(shí)現(xiàn)、快速、高效、低成本的特點(diǎn),便于此項(xiàng)鑒別技術(shù)的普及與推廣。
1 材料與方法
1.1 儀器設(shè)備
實(shí)驗(yàn)使用美國ASD(Analytical Spectral Device)公司的Handheld FieldSpec光譜儀,其光譜采樣間隔(波段寬)1.5nm,測定范圍325~1075nm,掃描次數(shù)30次,分辨率3.5nm。光源是與光譜儀配套的14.5V鹵素?zé)簟9庾V數(shù)據(jù)以ASCLL碼形式導(dǎo)出進(jìn)行處理,分析軟件為ASD(View Spec Pro, Unscramble)和DPS(data procession system for practical statistics)。
1.2 樣本來源及光譜的獲取
從市場買來三種機(jī)油,浙江殼牌化工石油有限公司生產(chǎn)的殼牌白喜力(Shell oil),中國石化公司潤滑油分公司生產(chǎn)的長城福星(Great Wall oil),廣西玉柴高級潤滑油有限責(zé)任公司生產(chǎn)的玉柴牌機(jī)油(Yuchai oil)。為保證實(shí)驗(yàn)樣本的均勻性,每種機(jī)油選用了10個不同的生產(chǎn)批次和日期。機(jī)油用直徑65mm高度14mm的透明器皿盛裝。裝滿1個器皿作為一個實(shí)驗(yàn)樣本。三種機(jī)油按不同生產(chǎn)批次和日期各取50個樣本,共150個樣本。全部樣本隨機(jī)分成建模集和預(yù)測集,建模集有120個樣本(每個品種40個樣本),預(yù)測集有30個樣本(每個品種10個樣本)。光譜儀預(yù)熱20分鐘經(jīng)白板校準(zhǔn)后進(jìn)行測試。光譜儀置于機(jī)油樣本的下方,探頭距離樣本底部10mm,探頭視場角為90度,光線自上而下經(jīng)過機(jī)油樣本垂直透射在光譜儀探頭上,光譜儀對每一個樣本掃描30次,取其采樣透射光譜平均值,并分別保存。
1.3 計(jì)算機(jī)信息處理
信息處理是可以使用計(jì)算機(jī)領(lǐng)域的總稱[3],包括數(shù)據(jù)處理、數(shù)據(jù)通信、過程控制、模式識別等。信息處理的任務(wù)是通過對表示信息的數(shù)據(jù)進(jìn)行解釋加工,確定數(shù)據(jù)的含義和形式,從中得到有用信息。信息處理的主要功能是對各應(yīng)用領(lǐng)域的各種數(shù)據(jù)進(jìn)行采集、存儲、加工、傳輸?shù)炔僮鳌S?jì)算機(jī)處理數(shù)據(jù)時先是把數(shù)據(jù)變換成計(jì)算機(jī)內(nèi)部熟悉的二進(jìn)制代碼,當(dāng)數(shù)據(jù)處理后輸出時,計(jì)算機(jī)自動將其轉(zhuǎn)換成人們熟悉的形式。
2 實(shí)驗(yàn)結(jié)果與討論
2.1 樣本的近紅外反射光譜
三種機(jī)油典型可見-近紅外反射光譜曲線如圖1所示。從圖中可以看出,三種機(jī)油在600nm~700nm光譜范圍內(nèi)有很大的差異,在700nm~1075nm范圍光譜曲線具有相同的趨勢,但是存在較大的基線漂移,運(yùn)用二階求導(dǎo)消除基線漂移,使不同品種的譜線差異更明顯。所以,不同品種機(jī)油的光譜圖有明顯區(qū)別,并具有一定的特征性,這一差異為機(jī)油的不同品種鑒別奠定了數(shù)學(xué)基礎(chǔ)[4]。
2.2 主成分分析對不同品種機(jī)油進(jìn)行聚類
主成分分析不僅能夠?qū)档蛿?shù)據(jù)維數(shù)[5],將多波長下的光譜數(shù)據(jù)壓縮到有限的幾個因子空間內(nèi),使數(shù)目較少的新變量能最大限度的表征原變量的數(shù)據(jù)結(jié)構(gòu)特征,并不丟失信息。而且能夠通過樣本在各因子空間的得分確定所屬的類別,所以新變量能夠更加形象的表征原樣本的品質(zhì)差異,品種區(qū)別等。光譜數(shù)據(jù)經(jīng)預(yù)處理并選擇光譜范圍后,對其做主成分分析。以樣本在第一主成分和第二主成分上的得分作圖,結(jié)果見圖2。
圖2為主成分1、2所作的二維散點(diǎn)得分圖,圖中橫坐標(biāo)表示每個樣本的第一主成分得分值,縱坐標(biāo)表示每個樣本的第二主成分得分值。圖2中三種機(jī)油明顯分成三類,說明主成分1、2對三種機(jī)油有較好的聚類作用。從圖2中可以看出,長城機(jī)油50個樣本聚合度很好,緊密地分布在圖2中坐標(biāo)系的第二象限附近;殼牌機(jī)油50個樣本與其他兩個品種的樣本分界很清楚,它們都位于圖2中坐標(biāo)系的第一象限附近即坐標(biāo)系中縱坐標(biāo)的右邊,而其他兩個品種的樣本大都位于坐標(biāo)系中縱坐標(biāo)的左邊。玉柴機(jī)油的50個樣本的聚合度沒有前兩個品種好,它們分布在圖2坐標(biāo)系中的第三﹑四象限,但是沒有跟另兩個品種混合起來,它們之間的分界線清楚。分析表明主成分分析對三種機(jī)油有一定的聚類作用,能定性區(qū)分不同品種的機(jī)油。
2.3 基于小波分析提取特征信息建立BP品種預(yù)測模型
小波變換是上個世紀(jì)末應(yīng)用數(shù)學(xué)界最杰出的成果之一,其本質(zhì)是信號的時間-尺度分析方法,具有多分辨率分析的特點(diǎn),而且在時頻兩域都具有表征信號局部特征的能力。圖像經(jīng)過小波變換,其低頻部分保留了絕大部分信息和能量。同時,在圖像的敏感位置(如輪廓線,突出點(diǎn)等),小波換變換后生成的特征矢量的模會相對較大。本文選用的小波為Daubechies(db2)正交小波基函數(shù)。原始光譜數(shù)據(jù)經(jīng)二級db2小波變換后,得到圖3所示的圖,變換后的低頻信號,大約是原始數(shù)據(jù)三十二分之一,包含了原始光譜幾乎全部重要的信息。其他的高頻信號包含了大量冗余和雜質(zhì),在品種識別中,起到的作用非常的微弱。圖3直觀地表明,當(dāng)用小波分析提取的數(shù)據(jù)[6]作為機(jī)油品種識別的特征矢量時,送入神經(jīng)網(wǎng)絡(luò)時訓(xùn)練和識別時的好處:有用信息的相對集中、無用信息的剔除和數(shù)據(jù)量的明顯下降。
用小波變換對150個樣本,每個樣本601個光譜數(shù)據(jù)進(jìn)行壓縮得到新的變量,新的變量空間從601維下降到21維,數(shù)據(jù)維數(shù)大大降低。將樣本隨機(jī)分為建模集和預(yù)測集,建模集包含120個樣本,預(yù)測包含30個樣本。把新變量作為神經(jīng)網(wǎng)絡(luò)的輸入[7],品種參數(shù)(1,2,3)作為神經(jīng)網(wǎng)絡(luò)的輸出分別代表不同的機(jī)油品種,建立品種鑒別模型。各層傳遞函數(shù)都用S型(Sigmoid)函數(shù),網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為21,目標(biāo)誤差為0.00001,網(wǎng)絡(luò)指定參數(shù)中最小學(xué)習(xí)速率為0.1,設(shè)定最大迭代次數(shù)為1000次。通過調(diào)整隱含層的節(jié)點(diǎn)數(shù)來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)[8],經(jīng)過反復(fù)試驗(yàn)得到最佳網(wǎng)絡(luò)結(jié)構(gòu)為21(輸入)-12(隱含)-1(輸出)3層BP神經(jīng)網(wǎng)絡(luò)模型,對120個建模樣本的擬合殘差為9.863 10-6,對未知的30個樣本進(jìn)行預(yù)測,預(yù)測準(zhǔn)確率為100%(見表1)。
3 結(jié)論
本文提出的組合主成分分析,小波變換和BP神經(jīng)網(wǎng)絡(luò)的模式識別方法對光譜數(shù)據(jù)進(jìn)行了分析和建模,建立的機(jī)油品種判別模型能有效地從大量光譜信息中提取有用信息,降低數(shù)據(jù)維數(shù),簡化運(yùn)算,能較好并快速地判別機(jī)油的品種。模型不僅能對不同品種機(jī)油進(jìn)行定性聚類分析,而且還能夠定量的預(yù)測出未知樣本的品種,預(yù)測未知樣本的機(jī)油品種識別率達(dá)100%。說明運(yùn)用可見-近紅外光譜技術(shù)可以快速、準(zhǔn)確的對機(jī)油品種進(jìn)行鑒別,具有很強(qiáng)的實(shí)用性,為其他產(chǎn)品的品種識鑒別分析提供了一種新的方法。
參考文獻(xiàn)
[1]孫霞,陳波水,謝學(xué)兵,等.N-油?;彼釢櫥砑觿┑男阅苎芯縖J].石油學(xué)報(石油加工),2008,24(1).
[2]管亮,馮新瀘,熊剛,等.介電譜技術(shù)快速測定車用潤滑油粘度[J].石油煉制與化工,2008,39(2).
[3]陳青果,劉超穎,韋玉堂,等.基于MDT的快速成形技術(shù)計(jì)算機(jī)信息處理[J].機(jī)械設(shè)計(jì)與制造,2008(11).
[4]傅霞萍,應(yīng)義斌,劉燕德.近紅外光譜技術(shù)在水果內(nèi)部品質(zhì)無損檢測中的應(yīng)用[J].農(nóng)機(jī)化研究,2004(2).
[5]徐來,呂效平,韓萍芳.主成分分析法在超聲波乳化柴油制備中的應(yīng)用[J].石油學(xué)報(石油加工),2008,24(2).
[6]管亮,馮新瀘,熊剛,等.介電譜技術(shù)評價柴油的潤滑性能[J].石油學(xué)報(石油加工),2008,24(4).
[7]王洪波,武妍.基于小波變換和BP神經(jīng)網(wǎng)絡(luò)的人臉識別方法[J].計(jì)算機(jī)工程與應(yīng)用,2004(24).
[8]趙琛,瞿海斌,程翼宇.蟲草氨基酸的人工神經(jīng)網(wǎng)絡(luò)-近紅外光譜快速測定方法[J].光譜學(xué)與光譜分析,2004,24(1).