曲 楠
遺傳算法在近紅外光譜分析中的應(yīng)用及在土壤分析中的展望
曲楠
(吉林農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,吉林長春 130118)
隨著近紅外光譜(NIR)分析方法的廣泛應(yīng)用,具有全局優(yōu)化搜索能力的遺傳算法(GA)得到了人們的關(guān)注。應(yīng)用GA可以自動構(gòu)建基于NIR光譜的數(shù)學(xué)校正模型,選擇最優(yōu)的模型參數(shù)和光譜波段,進而提高模型的預(yù)報精度及建模效率。簡要介紹了遺傳算法的基本原理,對該技術(shù)在NIR光譜分析中的具體應(yīng)用進行了評述,并對其在土壤NIR光譜分析中的前景進行了展望。
近紅外光譜;遺傳算法;校正模型;波段選擇
NIR光譜技術(shù)以其簡便、廉價、非破壞等特點,已被廣泛應(yīng)用到眾多領(lǐng)域,并逐漸成為國內(nèi)外學(xué)者研究的重要內(nèi)容。但由于NIR光譜譜峰重疊嚴重,強度較弱,且干擾強烈,須采用化學(xué)計量學(xué)方法解決光譜信息的提取及背景干擾的影響,建立NIR光譜數(shù)據(jù)與被測樣品特征映射關(guān)系的校正模型,進而實現(xiàn)NIR光譜的無損、快速定性及定量分析。
由于校正模型自身的特性,其光譜波段的選擇及模型參數(shù)的選取往往需要憑借分析者的經(jīng)驗,受人為因素影響,因此不易得到最優(yōu)的校正模型。GA是一種建立在自然選擇和種群遺傳學(xué)機理上的自適應(yīng)啟發(fā)式全局搜索算法,該方法借鑒生物界自然選擇和遺傳機制,通過3種遺傳操作:選擇,交叉和變異產(chǎn)生新一代種群,隨著遺傳迭代的進行,適應(yīng)度值高的變量被保留,最終達到最優(yōu)結(jié)果[1]。目前GA已被用于NIR光譜分析中,通過GA可實現(xiàn)對校正模型參數(shù)和光譜波段的自動優(yōu)化,不但降低了模型的復(fù)雜度,同時提高了建模效率和模型預(yù)測性能。為此,本文對GA在NIR光譜分析中的應(yīng)用進行了簡述,并展望了GA在土壤NIR光譜分析中的前景。
20世紀60年代美國Michigan大學(xué)的Holland教授最早提出了GA,它來源于Darwin的進化論和Mendel的生物遺傳學(xué),是一種基于自然選擇和遺傳機制的自適應(yīng)搜索方法[2]。遺傳算法首先產(chǎn)生一個隨機種群,每一個種群則表示一個參數(shù)(或問題的解),并編碼成一個二進制位串(即染色體),而每個染色體都對應(yīng)一個適應(yīng)度值,該值被用于評價對環(huán)境的適應(yīng)性。種群不斷進化直到達到較好的總體適應(yīng)度值。在每一代,使用如選擇、交叉和變異等遺傳操作來獲得一個新的種群。在進化過程中,適應(yīng)度值越大的個體,其生存的可能性也就越大。若干代后,種群中包含的個體具有更好的適應(yīng)度值?;具z傳算法有五大主要組成部分:編碼方案、適應(yīng)度計算、選擇操作、交叉操作和變異操作。近年來,遺傳算法已逐漸引起各國學(xué)者的重視,并廣泛用于處理各種最優(yōu)化問題,在NIR光譜分析中的應(yīng)用也日益增加。
目前,在NIR光譜分析中,GA多與偏最小二乘(PLS)及人工神經(jīng)網(wǎng)絡(luò)(BP/RBF)等模型校正方法結(jié)合,用于NIR光譜波段及校正模型參數(shù)的自動選擇。
2.1NIR光譜波段的選取
NIR光譜數(shù)據(jù)的壓縮及信息變量的提取是NIR光譜分析的熱點,是模型簡化及預(yù)測精度提高的重要手段。基于GA的自適應(yīng)性及全局搜索能力等,其逐漸變成廣泛使用的一種波長選擇方法,且已成功用于NIR的波長選擇[3]。應(yīng)用GA自動搜索有效光譜波段,不但減小了建模和預(yù)測運算時間,而且提高了分析結(jié)果的準確性。陳永明等[4]利用遺傳算法提取近NIR光譜特征波長,結(jié)合主成分分析的BP神經(jīng)網(wǎng)絡(luò)對橄欖油產(chǎn)地成功進行分類。王徽蓉[5]等通過采集玉米種子的NIR光譜數(shù)據(jù),將GA與線性鑒別分析結(jié)合,實現(xiàn)了對玉米品種的快速鑒別。潘璐等[6]提出利用GA進行NIR光譜波段優(yōu)化可以提高砂梨糖度PLS模型精度及提高建模效率。黃常毅[7]等研究了基于GA的NIR光譜波段選擇方法,并建立所優(yōu)選光譜波段的預(yù)測紅曲菌固態(tài)發(fā)酵生物量的PLS模型,該模型實現(xiàn)了對紅曲菌固態(tài)發(fā)酵生物量的快速檢測。
2.2校正模型參數(shù)的選擇
GA除了常作為一種波段選擇工具以外,還被應(yīng)用于校正模型參數(shù)的選擇。如徐冰[8]等采用GA和自適應(yīng)建模策略,建立了能夠?qū)Χ嘟M分同時定量的多目標(biāo)最小二乘支持向量機(LS-SVM),并將其應(yīng)用于玉米中四個組分和連翹中兩個活性成分的NIR分析。多目標(biāo)遺傳算法被用于LS-SVM 模型超參數(shù)(正則化參數(shù)和核函數(shù)參數(shù))的尋優(yōu)搜索。Qu等將GA與RBF神經(jīng)網(wǎng)絡(luò)結(jié)合,實現(xiàn)了對琥乙紅霉素粉末樣品的NIR光譜定量分析,實驗中通過GA同時對RBF神經(jīng)網(wǎng)絡(luò)輸入波段及網(wǎng)絡(luò)拓撲參數(shù)進行自動優(yōu)化,提高了模型的預(yù)報精度。GA以其獨特優(yōu)勢,在NIR光譜分析中將具有廣闊的應(yīng)用前景。
近些年NIR光譜分析法在土壤學(xué)領(lǐng)域的應(yīng)用日益增多,其廣闊的應(yīng)用前景已經(jīng)顯露。而利用GA進行土壤NIR光譜分析也有相關(guān)報道,如方利民[9]等利用土壤樣品的可見/近紅外光譜,將快速獨立分量分析(FastICA)算法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,并通過GA優(yōu)化BP網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),建立的ICAGA-BP分析模型實現(xiàn)了對土壤中有機碳含量和陽離子交換量的快速分析。解宏圖[10]等通過GA對黑龍江農(nóng)田黑土的NIR
光譜進行波長選擇,并結(jié)合PLS校正模型建立了土壤有機碳的預(yù)測模型。GA的應(yīng)用不但提升了模型的穩(wěn)定性,還提高了預(yù)測精度。張瑤[11]等應(yīng)用GA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)參數(shù),所建模型的建模精度及在土壤各個層次的預(yù)測精度都有了顯著的提高,證明了該方法在土壤全氮含量預(yù)測過程中具有明顯的優(yōu)勢。由于在土壤NIR光譜分析中引入GA的時間尚短,目前仍有許多工作需要繼續(xù)開展。如楊愛霞[12]等嘗試用蟻群和遺傳算法結(jié)合區(qū)間偏最小二乘法提取荒漠土壤全磷含量特征波長,建立的土壤全磷區(qū)間偏最小二乘回歸模型可以較好的估算荒漠土壤全磷含量。進一步嘗試GA與各種化學(xué)計量學(xué)方法聯(lián)合,尋求其在土壤分析領(lǐng)域的廣泛應(yīng)用將是今后工作的重點。
[1] 別軍象,趙宇峰.遺傳算法在肉類近紅外光譜分析中波長選擇的應(yīng)用[J].計算機與數(shù)字工程,2014,(1).
[2] Leardi R,Seasholtz M B,Pell R J.Variable selection for multivariate calibration using a genetic algorithm:prediction of additive concentrations in polymer films from Fourier transform-infrared spectral data[J].Analytica Chimica Acta,2002,(2).
[3] 陸婉珍,袁洪福,徐廣通,等.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:中國石化出版社,2001.
[4] 陳永明,林萍,何勇.基于遺傳算法的近紅外光譜橄欖油產(chǎn)地鑒別方法研究[J].光譜學(xué)與光譜分析,2009,(3).
[5] 王徽蓉,李衛(wèi)軍,劉揚陽,等.基于遺傳算法與線性鑒別的近紅外光譜玉米品種鑒別研究[J].光譜學(xué)與光譜分析,2011,(3).
[6] 潘璐,王加華,李鵬飛,等.砂梨糖度近紅外光譜波段遺傳算法優(yōu)化[J].光譜學(xué)與光譜分析,2009,(5).
[7] 黃常毅,范海濱,劉飛,等.近紅外光譜結(jié)合遺傳算法快速檢測紅曲菌固態(tài)發(fā)酵生物量[J].分析測試學(xué)報,2014,(5).
[8] 徐冰,王星,Dhaene Tom,等.基于遺傳算法的多目標(biāo)最小二乘支持向量機在近紅外多組分定量分析中的應(yīng)用[J].光譜學(xué)與光譜分析,2014,(3).
[9] 方利民,馮愛明,林敏.可見/近紅外光譜快速測定土壤中的有機碳含量和陽離子交換量[J].光譜學(xué)與光譜分析,2010,(2).
[10] 解宏圖,宣然然,彭義,等.基于遺傳算法的波長選擇方法對土壤有機碳預(yù)測模型影響[J].土壤通報,2014,(4).
[11] 張瑤,李民贊,鄭立華,等.基于近紅外光譜分析的土壤分層氮素含量預(yù)測[J].農(nóng)業(yè)工程學(xué)報,2015,(9).
[12] 楊愛霞,丁建麗,李艷紅,等.基于可見-近紅外光譜變量選擇的荒漠土壤全磷含量估測研究[J].光譜學(xué)與光譜分析,2016,(3).
Genetic Algorithm and its Prospects in the Near-infrared Spectroscopic Analysis of Soil Analysis
Qu Nan
With the wide application of near-infrared spectroscopy(NIR)analysis method,with global optimization search ability of genetic algorithm(GA)to get people's attention.Application of GA can automatically build the mathematical model based on NIR spectra of calibration,selecting the optimal model parameters and spectral bands,thus improving the accuracy of forecasting and modeling efficiency model.Introduces the basic principles of genetic algorithms,the specific application of this technology in the NIR spectral analysis were reviewed,and its prospects in the soil NIR spectroscopic analysis were discussed.
near infrared spectroscopy;GA;calibration model;band selection
O657.33
A
1003-6490(2016)06-0164-02