■孫丹丹 谷 旭 李 俊 李軍國 董穎超
(中國農(nóng)業(yè)科學(xué)院飼料研究所,北京100081)
三聚氰胺(melamine),化學(xué)名為2,4,6-三氨基-1,3,5-三嗪,是一種重要的氮雜環(huán)有機化工原料,在飼料工業(yè)中作為粘合劑使用,其含氮量約為66.7%。尿素是一種非蛋白含氮化合物,含氮46.7%,被廣泛的應(yīng)用于畜牧業(yè),可代替反芻動物日糧中的部分蛋白質(zhì)飼料。兩者均為白色粉末,容易染色,混在飼料中不易被發(fā)現(xiàn)。飼料廠常用的測定粗蛋白的方法為“凱氏定氮法”,只能測出含氮量,而不能鑒定有無添加違規(guī)化學(xué)物質(zhì),因而這類物質(zhì)被不法分子添加到寵物食品、動物飼料、飼料原料以及其他食品中。豆粕是主要的植物性蛋白飼料原料,是飼糧中蛋白質(zhì)的主要來源,廣泛用于畜禽、水產(chǎn)及特種動物的飼料中,豆粕中粗蛋白的含量對豆粕的價格有一定的影響。因此,這些非蛋白含氮化合物被非法添加在豆粕中以期提高粗蛋白含量。
農(nóng)業(yè)部公告第1218號規(guī)定飼料原料和飼料產(chǎn)品中三聚氰胺限量值定為2.5 mg/kg。自2007年以來,不同的檢測方法用來檢測低水平的三聚氰胺,如酶聯(lián)免疫吸附法、熒光偏振免疫分析法、氣質(zhì)聯(lián)用法、液質(zhì)聯(lián)用法等。目前飼料中三聚氰胺的國家檢測方法為高效液相色譜法和氣相色譜質(zhì)譜聯(lián)用法。尿素常用的方法直接比色法、間接比色法、色譜法、中紅外光譜法等,我國有魚粉中尿素測定方法和限量,AOAC方法有動物飼料中尿素的測定方法。但是這些方法大都需要化學(xué)試劑,操作過程比較繁瑣。
近紅外光譜(near infrared spectroscopy,NIRS)分析技術(shù)是20世紀(jì)80年代發(fā)展起來的一種快速、綠色的定性、定量分析技術(shù),近紅外光譜區(qū)為780~2 526 nm的區(qū)域,光譜區(qū)與有機分子中含氫基團(O-H、N-H、C-H)振動的合頻和各級倍頻的吸收區(qū)一致,主要用于有機質(zhì)定性和定量分析。近紅外光譜分析技術(shù)具有測試簡單、速度快、無損檢測、對測試人員無專業(yè)化要求、多個組分同時測定、重復(fù)性好、適用樣品范圍廣等優(yōu)勢,已廣泛應(yīng)用于飼料檢測行業(yè),成為一種重要的檢測方法。Haughey等對4類摻入了三聚氰胺的豆粕建立定性定量近紅外模型,但文中使用的主成分分析方法定性鑒別摻假豆粕有一定的局限性。顯微近紅外成像技術(shù)應(yīng)用于豆粕中三聚氰胺的檢測,對含有1%三聚氰胺的豆粕進行掃描條件優(yōu)化。馮莉等建立了奶牛精料補充料和奶牛濃縮料這兩種料型中尿素近紅外模型,證明應(yīng)用近紅外光譜分析技術(shù)檢測飼料中尿素的可行性,但樣品的數(shù)量不多,樣品的代表性較差。
本實驗采用近紅外光譜分析技術(shù)結(jié)合模式識別法鑒別非法摻有三聚氰胺和尿素的豆粕,探討其作為一種檢測豆粕摻假物質(zhì)存在的快速、無損的綠色分析技術(shù)的可行性和實用性。
豆粕采自中糧飼料(東臺)有限公司,共30批次180個樣品,樣品于高速旋風(fēng)粉碎機粉碎30 s,并與相應(yīng)濃度的三聚氰胺(北京化學(xué)試劑公司)和尿素(西隴化工股份有限公司)混合均勻。制備三聚氰胺和尿素的濃度范圍為0.1%~5%,共制備214個摻假樣本,驗證集和校正集的比例為4∶1。
MATRIXTM-I型傅立葉變換近紅外光譜儀(BRUKER,德國),帶積分球附件、三維立體角鏡RockSolidTM干涉儀,Pbs檢測器。OPUS光譜采集軟件(version 7.0;Bruker Optik GmbH,Germany),Mat?lab(v2013b,MathWorks,USA)和 Unscrambler(version 10.1;CAMO AS,Trondheim,Norway)化學(xué)計量學(xué)分析軟件。
光譜采集條件為:近紅外掃描范圍為3 598~12 500 cm-1,分辨率為8 cm-1,掃描次數(shù)64次,實驗環(huán)境溫度為(25±2)℃,每個樣本重復(fù)裝樣掃描3次。為了減少隨機誤差,隨機抽取樣本進行光譜數(shù)據(jù)采集。
在原始光譜數(shù)據(jù)采集過程中常會受到高頻隨機噪聲、光散射、樣本不均勻等因素的影響,為消除干擾信號的影響,應(yīng)用化學(xué)計量學(xué)對原始光譜數(shù)據(jù)進行預(yù)處理。結(jié)合本實驗樣本狀態(tài)和建模條件等實際情況,采用平滑、變量標(biāo)準(zhǔn)化、求導(dǎo)等方法對原始光譜數(shù)據(jù)進行預(yù)處理,平滑用來提高分析信號的信噪比,變量標(biāo)準(zhǔn)化用來校正樣品間因散射而引起的光譜的誤差,導(dǎo)數(shù)在消除基線漂移和背景干擾的同時,提高了分辨率和靈敏度。
模式識別是一種很重要的化學(xué)計量學(xué)分類方法,包括有監(jiān)督模式和無監(jiān)督模式的識別組成。有監(jiān)督模式比無監(jiān)督模式在分類上應(yīng)用更為廣泛,在原料確證、產(chǎn)品質(zhì)量控制與分析、品質(zhì)鑒定、真假識別、分類判別等方面廣泛應(yīng)用。本實驗比較了三種常見的有監(jiān)督模式的建模方法,簇類獨立軟模式(SIMCA)、偏最小二乘判別分析(PLS-DA)和支持向量機(SVM)。
SIMCA(soft independent modelling of class analo?gy)是wold于1976年提出的,其思路是為每一類樣本建立獨立的主成分類模型,然后計算未知樣本向量在各類模型的投影距離來判斷未知樣本歸屬于哪些類。SIMCA模型的評價指標(biāo)包括識別率和拒絕率:
拒絕率=拒絕其它類樣品個數(shù)/其它類樣品總個數(shù);
識別率=識別自身樣品個數(shù)/該類樣品總個數(shù)。
PLS-DA算法是基于PLS回歸模型建立的判別分析算法,通過建立光譜數(shù)據(jù)與類別特征之間的回歸模型,進行判別分析?;貧w模型得到的樣本的預(yù)測值不是整數(shù),需要設(shè)置閾值以判斷樣本的歸屬。本實驗中閾值設(shè)置為0.5,即預(yù)測值與實際值之差的絕對值小于0.5,則判別正確,反之,則判別錯誤。
SVM由Vapnik提出的,將待解決的模式識別問題轉(zhuǎn)化成為一個二次規(guī)劃尋優(yōu)問題,它解決了非線性可分問題。通過核函數(shù)和懲罰因子是兩個重要的參數(shù)來建立最優(yōu)分隔超平面,最大化兩類的分隔邊距。四個主要的核函數(shù)有線性函數(shù)、多項式函數(shù)、徑向基函數(shù)和S型。在本研究中,RFB為核函數(shù)來建立SVM模型。
圖1a 原始豆粕樣品近紅外光譜
圖1b 尿素、摻入3%尿素的豆粕及純豆粕的近紅外光譜
由圖1a可知,在12 500~9 000 cm-1區(qū)域,無吸收峰,屬于無信息區(qū),為減少數(shù)據(jù)量提高運算速度,將此區(qū)域的數(shù)據(jù)剔除后再進行處理。圖1b是尿素、豆粕和摻入3%尿素的豆粕原始光譜圖,在5 066 cm-1處的為最大吸收峰,此處摻假豆粕和純豆粕之間的區(qū)別也最為明顯。圖1c是三聚氰胺、豆粕和摻入3%三聚氰胺的豆粕原始光譜圖,摻入三聚氰胺的豆粕在6 812 cm-1處比純豆粕多出一個尖峰。尿素和三聚氰胺中主要的含氫基團是-NH2,N-H鍵在近紅外區(qū)域的主要吸收特點為:6 812~6 555 cm-1范圍內(nèi)的峰是由N-H鍵二級倍頻的伸縮振動引起的,6 580~6 490 cm-1和6 670~6 580 cm-1是由于NH2一級倍頻的對稱和非對稱伸縮振動引起,N-H的伸縮和彎曲振動在5 080~4 980 cm-1范圍內(nèi)。
圖1c 三聚氰胺、摻入3%三聚氰胺的豆粕及純豆粕的近紅外光譜
去除樣本光譜前段無信息區(qū),以9 000~3 598 cm-1光譜范圍預(yù)處理數(shù)據(jù)作為變量,進行主成分分析,驗證方法為交叉驗證。圖2是對所有校正集的樣品進行主成分分析得到的得分圖,摻假物濃度較高時,摻假豆粕可與純豆粕區(qū)分開,但摻假物濃度較低時,純豆粕和摻假豆粕有一定的重疊。根據(jù)SIMCA原理,分別對校正集中純豆粕、摻入尿素的豆粕和摻入三聚氰胺的豆粕建立主成分分析模型,然后對預(yù)測集樣本進行分類。在顯著性水平為5%時,分類結(jié)果見表1,并比較了原始光譜數(shù)據(jù)和不同預(yù)處理方法對模型分類結(jié)果的影響。
圖2 豆粕樣品主成分得分
SIMCA模型是純豆粕、添加三聚氰胺的豆粕和添加尿素的豆粕各自建立獨立的主成分類模型,從表1可以得出,每個主成分模型對自身類的識別率較高,但拒絕率較低,說明這三類模型有一定程度的重疊。在純豆粕主成分模型中,含有低濃度的三聚氰胺和尿素與純豆粕的光譜相似度極高,被誤判為純豆粕類。在摻有三聚氰胺的豆粕主成分模型中,純豆粕和含有低濃度尿素的光譜與含有低濃度三聚氰胺的光譜相似度極高,因而被誤判為摻有三聚氰胺類,導(dǎo)致識別率高,而拒絕率很低。在摻有尿素的豆粕主成分模型中也是如此。在SIMCA方法中,每個類的模型都是獨立的,提取主成分時只能反映出有限的鑒別信息。當(dāng)多維數(shù)據(jù)不同類中的子空間都非常接近時,由于類之間不必要的重疊,從而存在產(chǎn)生非優(yōu)化鑒別模型的危險。與SIMCA方法相比,用一階導(dǎo)數(shù)9點平滑的預(yù)處理方法,只對純豆粕進行主成分分析得到的結(jié)果更好,其模型識別率為92.2%,拒絕率為88.5%。
在9 000~3 598 cm-1光譜范圍內(nèi),分別對摻入三聚氰胺的豆粕和摻入尿素的豆粕的校正集樣本進行PLS回歸,即令純豆粕樣本的值為0,摻入三聚氰胺的豆粕樣本值為1,摻入尿素的豆粕樣本值為1,分別建立純豆粕樣本與摻入三聚氰胺樣本和純豆粕樣本與摻入尿素樣本的PLS回歸模型,并采用交叉驗證,用驗證集樣本對建立的模型進行外部驗證。驗證集樣本分類標(biāo)準(zhǔn)為:Y>0.5,且偏差<0.5,判定該樣本屬于摻假樣本;Y<0.5,且偏差<0.5,判定樣本屬于純豆粕;當(dāng)偏差>0.5,該判別模型不穩(wěn)定。本研究中,各驗證集樣品的偏差均小于0.5,校正集和驗證集的準(zhǔn)確率如圖2所示,在三聚氰胺模型中,當(dāng)預(yù)處理方法為一階導(dǎo)數(shù)9點平滑時(圖3),校正集準(zhǔn)確率為96.9%,交互驗證準(zhǔn)確率為96.1%,驗證集準(zhǔn)確率為95.3%,模型的性能最好;在尿素模型中,各模型的預(yù)測準(zhǔn)確率大于校正集準(zhǔn)確率,這是由于驗證集選擇的樣本尿素質(zhì)量濃度比校正集高,當(dāng)預(yù)處理方法為變量標(biāo)準(zhǔn)化+5點平滑時,校正集準(zhǔn)確率為94.5%,交互驗證準(zhǔn)確率為93.8%,驗證集準(zhǔn)確率為94.2%,模型的性能最好。
表1 不同預(yù)處理方法的SIMCA模型對判別分析結(jié)果的影響
圖3a 預(yù)處理為一階導(dǎo)數(shù)9點平滑時三聚氰胺模型校正集結(jié)果
圖3b 預(yù)處理為一階導(dǎo)數(shù)9點平滑時三聚氰胺模型驗證集結(jié)果
表2 不同預(yù)處理方法的PLS-DA模型判斷準(zhǔn)確率(%)
在本研究中,SVM方法用于鑒別三個類,是多分類的問題。多分類問題可以轉(zhuǎn)化成二分類方法。純豆粕為0類,摻入三聚氰胺的豆粕為1類,摻入尿素的豆粕為2類,預(yù)測結(jié)果用預(yù)測值減真實值表示,結(jié)果為0時表示判斷正確,結(jié)果為其他值時,樣品歸屬判斷錯誤。目前,沒有系統(tǒng)的方法來選擇核函數(shù),但是,與其他核函數(shù)相比,徑向基核函數(shù)作為非線性核函數(shù)能夠減少計算復(fù)雜度,處理光譜與目標(biāo)屬性的非線性關(guān)系。因此,本研究使用RBF作為SVM的核函數(shù)。所建SVM模型準(zhǔn)確率見表3,預(yù)處理方法為變量標(biāo)準(zhǔn)化+5點平滑時,訓(xùn)練集和測試集準(zhǔn)確率最好,分別為100%和98.1%。
表3 不同預(yù)處理方法的SVM模型判斷準(zhǔn)確率(%)
綜合SIMCA、PLS-DA和SVM方法建立的判別模型,可以得出SVM建模方法得到的結(jié)果是最好的,PLS-DA其次,SIMCA最差。Guo Tang等應(yīng)用近紅外光譜法檢測魚藤酮制備中的添加劑甲胺磷,比較了SIMCA、PLSDA、ANN和SVM這幾種有監(jiān)督模式識別技術(shù),方法優(yōu)劣順序與本研究是一致的。
利用近紅外光譜分析技術(shù)檢測豆粕中的摻假物質(zhì)三聚氰胺和尿素,結(jié)合三種有監(jiān)督模式識別技術(shù)分別建立了摻假濃度為0.1%~5%的判別分析模型。近紅外光譜預(yù)處理方法影響模型的判別精度,選擇合適的處理方法以扣除干擾信息提取出有用的信息。SVM是檢測摻假豆粕的一種有效方法,能得到相對滿意的判別準(zhǔn)確度,而SIMCA和PLSDA判別準(zhǔn)確度相對較差,這說明SVM方法具有較好的適應(yīng)性和靈活性。
圖4a 預(yù)處理為平滑+變量標(biāo)準(zhǔn)化時訓(xùn)練集結(jié)果
圖4b 預(yù)處理為平滑+變量標(biāo)準(zhǔn)化時測試集結(jié)果
研究結(jié)果表明采用近紅外光譜分析技術(shù)和判別分析法相結(jié)合為豆粕中非蛋白氮的快速鑒別分析提供了一種有效的篩選方法。
(參考文獻22篇,刊略,需者可函索)