高紅秀, 金 萍, 楊 亮, 鄒德堂, 寧海龍
(東北農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院, 黑龍江 哈爾濱 150030)
近紅外光譜分析技術(shù)具有無(wú)需預(yù)處理、分析速度快、不損壞樣品、能同時(shí)測(cè)定多個(gè)成分、安全無(wú)污染等優(yōu)點(diǎn)[1],在許多領(lǐng)域特別是在農(nóng)業(yè)領(lǐng)域得到了廣泛的應(yīng)用,已成為糧食品質(zhì)分析的重要手段。近紅外光譜分析技術(shù)中最重要的是定標(biāo)模型的建立,定標(biāo)的合理性決定了近紅外分析準(zhǔn)確度和穩(wěn)定性。模型初建時(shí)標(biāo)樣的選擇、數(shù)量及其設(shè)計(jì)也影響到預(yù)測(cè)的準(zhǔn)確度[2]。本文著重討論了近紅外光譜分析中的定標(biāo)過(guò)程及定標(biāo)的驗(yàn)證與優(yōu)化。
近紅外光譜分析技術(shù)是一種間接的測(cè)量方法[3],首先需要選擇一批具有代表性的樣品,用該批樣品建立樣品近紅外光譜與化學(xué)值之間的定標(biāo)模型,然后采集未知樣品的光譜數(shù)據(jù),與校正模型相對(duì)應(yīng),計(jì)算出樣品的組分[4]。定標(biāo)過(guò)程見(jiàn)圖1。
圖1 近紅外定標(biāo)流程圖
樣品數(shù)量對(duì)定標(biāo)模型有明顯的影響,樣品數(shù)量不是越多越好,采用合適數(shù)量的樣品進(jìn)行光譜掃描,可以提高模型的預(yù)測(cè)精度[5-6]。樣品應(yīng)具有代表性,樣品范圍要廣,要包含不同季節(jié)、不同區(qū)域、不同品種、不同年份等的樣品[7]。定標(biāo)集樣品應(yīng)盡量覆蓋待分析樣品的變化范圍,分布應(yīng)盡量均勻[8-9],避免定標(biāo)樣品幾乎一致而造成定標(biāo)模型不具代表性。
在做濕化學(xué)分析前,須先對(duì)樣品進(jìn)行掃描。由于現(xiàn)代近紅外光譜分析是通過(guò)化學(xué)計(jì)量學(xué)多元校正方法,依靠樣品間光譜信息的細(xì)微差別來(lái)對(duì)樣品進(jìn)行定性和定量分析,所以對(duì)儀器的性能指標(biāo)有很高的要求。根據(jù)測(cè)量對(duì)象的不同可選擇透射、漫反射和漫透射方式。對(duì)于育種研究而言,希望能夠在不破壞籽粒的情況下就可以得到分析結(jié)果,以便繼續(xù)種植繁育。
掃描過(guò)的樣品(同一份樣)要及時(shí)送交實(shí)驗(yàn)室進(jìn)行濕化學(xué)分析。送交實(shí)驗(yàn)室樣品必需放置于密封的容器中(最好用樣品儲(chǔ)藏罐且罐口需用膠帶密封;封口樣品袋也可接受),以防止水分和揮發(fā)物的損失。所使用的實(shí)驗(yàn)室分析方法必須是官方認(rèn)可的標(biāo)準(zhǔn)方法,對(duì)于濃度極端的樣品,需采用標(biāo)準(zhǔn)方法進(jìn)行雙平行或三平行分析。
并不是所有的樣品都能參與定標(biāo),定標(biāo)集樣品的選擇直接影響所建模型的適用性和準(zhǔn)確性,所以首先要確定哪些樣品是“好”樣品——參與定標(biāo)建模的樣品。“好”樣品是光譜具有總體相似性,并能代表光譜間最大差異的樣品(與其他樣品不重復(fù))。定標(biāo)集樣品的挑選最常用的方法是GN距離法[10]。該方法以全局距離來(lái)界定定標(biāo)集樣品范圍,以鄰域距離來(lái)剔除相似樣品,根據(jù)不同的全局和鄰域距離組合挑選出定標(biāo)集樣品建模。多數(shù)近紅外的化學(xué)計(jì)量學(xué)軟件在進(jìn)行主成分分析過(guò)程中,都使用馬氏距離計(jì)算GH,但只有FOSS的WINISI軟件有計(jì)算任意2點(diǎn)間NH的功能。
得到所有的信息(樣品的掃描數(shù)據(jù)和準(zhǔn)確的濕化學(xué)數(shù)據(jù))后,就可以建立數(shù)學(xué)模型來(lái)預(yù)測(cè)未知樣品已建立定標(biāo)成分的值。近紅外光譜定標(biāo)方法主要有MLR(多元線性回歸);PLS(偏最小二乘法)和ANN(人工神經(jīng)網(wǎng)絡(luò)),3種方法比較見(jiàn)表1。天然樣品近紅外定標(biāo)最常用的定標(biāo)技術(shù)為PLS。
表1 3種定標(biāo)模型方法比較
1.5.1 多元線性回歸
此方法主要用于簡(jiǎn)單樣品,若光譜沒(méi)有疊加,則通常借助所分析成分的純品吸收光譜進(jìn)行定標(biāo)波長(zhǎng)的選定,所選定的波長(zhǎng)具有經(jīng)驗(yàn)性和近似性。此法在全譜帶農(nóng)產(chǎn)品近紅外分析中已不使用,目前主要用于濾光片式近紅外定標(biāo)。由于不同農(nóng)產(chǎn)品各成分隨基體組分的變化產(chǎn)生吸收峰漂移,因此濾光片式近紅外在采用MLR對(duì)農(nóng)產(chǎn)品近紅外定標(biāo)時(shí)誤差較大。
1.5.2 偏最小二乘法
采用主成分分析技術(shù)將光譜數(shù)據(jù)轉(zhuǎn)化為主成分?jǐn)?shù)據(jù),然后和化學(xué)分析數(shù)據(jù)相關(guān)聯(lián)進(jìn)行定標(biāo)建模,是目前近紅外分析較常使用的方法。對(duì)農(nóng)產(chǎn)品分析而言,PLS永遠(yuǎn)優(yōu)于MLR。處理的數(shù)據(jù)庫(kù)大小有一定限度(幾百個(gè)為宜),過(guò)大的樣品數(shù)據(jù)庫(kù)存在吸收非線性,分析存在誤差。
1.5.3 人工神經(jīng)網(wǎng)絡(luò)
處理大樣品數(shù)據(jù)庫(kù),模型的適用范圍廣,減少或降低定標(biāo)模型的調(diào)整工作。大數(shù)據(jù)庫(kù)定標(biāo)可以提高定標(biāo)測(cè)試的適用范圍,原定標(biāo)基本不需要調(diào)整;向原定標(biāo)中添加新樣品時(shí),不影響原定標(biāo)的測(cè)試準(zhǔn)確度。
在定標(biāo)方程建立后,應(yīng)采用一組沒(méi)有參與定標(biāo)的獨(dú)立樣品組(即驗(yàn)證樣品集)對(duì)方程的預(yù)測(cè)性能進(jìn)行驗(yàn)證。驗(yàn)證樣品集樣品應(yīng)具有很好的代表性,成分應(yīng)覆蓋一定的范圍,傳統(tǒng)實(shí)驗(yàn)室參考數(shù)據(jù)必須準(zhǔn)確可靠,以便給出合理的驗(yàn)證結(jié)果。驗(yàn)證樣品集的樣品數(shù)量應(yīng)足夠多以便進(jìn)行統(tǒng)計(jì)檢驗(yàn)[11]。當(dāng)樣本總數(shù)一定時(shí),以70%的樣本建立定標(biāo)模型,其余30%樣本作為驗(yàn)證樣本,可以獲得較好的預(yù)測(cè)效果[4]。
完成定標(biāo)方程后,剛開(kāi)始使用定標(biāo)方程時(shí)要同時(shí)進(jìn)行化學(xué)分析,當(dāng)認(rèn)為定標(biāo)方程性能已經(jīng)可以了,便可以進(jìn)行常規(guī)分析。定期收集每類樣品6~8份,對(duì)所用定標(biāo)模型數(shù)據(jù)庫(kù)進(jìn)行驗(yàn)證。如果樣品的驗(yàn)證效果符合要求,則不需要進(jìn)行定標(biāo)的調(diào)整;如果驗(yàn)證效果不符合要求,則從手工分析的準(zhǔn)確性和定標(biāo)模型的適用性等方面找出原因并作相應(yīng)的再驗(yàn)證,直到符合要求定標(biāo)才能使用。
由于自然樣品(分析樣品)的成分隨著種植季節(jié)、施肥、降雨量和種植條件的不斷變化,可以說(shuō)定標(biāo)方程永遠(yuǎn)都處在調(diào)整狀態(tài)。定標(biāo)方程應(yīng)定期采用新樣品的掃描光譜和化學(xué)分析數(shù)據(jù)進(jìn)行調(diào)整和升級(jí),對(duì)模型進(jìn)行升級(jí)將使模型的預(yù)測(cè)性能更穩(wěn)定。利用所得定標(biāo)進(jìn)行日常分析過(guò)程中,可通過(guò)GH和NH繼續(xù)選擇新的樣品填補(bǔ)原有數(shù)據(jù)庫(kù)中的空白點(diǎn),進(jìn)一步完善定標(biāo),此操作的目的是使定標(biāo)方程不斷適用待測(cè)樣品的變化。
定標(biāo)模型的建立一般采用已有的軟件。在需要測(cè)定未知樣品時(shí),必須使用這一模型及測(cè)定的未知樣品的光譜計(jì)算其組成或性質(zhì)。因此,近紅外光譜分析技術(shù)實(shí)際上是一個(gè)二級(jí)分析方法。它所能得到的準(zhǔn)確度不能超過(guò)在建立模型時(shí)所用測(cè)定組成或性質(zhì)方法的準(zhǔn)確度。同時(shí),模型的建立需要投入很多的人力、物力和財(cái)力[12]。人們希望能長(zhǎng)期使用已有的模型,這樣就要求測(cè)定吸收譜圖的檢測(cè)手段,即光譜在長(zhǎng)時(shí)期(幾年)內(nèi)是不變的,其中包括譜圖的橫軸(波長(zhǎng))及譜圖的縱軸(吸光度)的長(zhǎng)期穩(wěn)定,—般相對(duì)誤差應(yīng)小于1/1000。為了能使同一模型在不同儀器上使用(即模型共享),也就是說(shuō),每臺(tái)儀器間的重現(xiàn)性也要達(dá)到上述要求,當(dāng)然這對(duì)硬件的要求似乎過(guò)分苛刻。近年來(lái),人們?cè)诹η髢x器的穩(wěn)定性和重現(xiàn)性接近上述要求的同時(shí),也在軟件方面做了大量工作,稱作模型傳遞技術(shù)。例如,經(jīng)典校正模型傳遞、分段直接傳遞、有限脈沖響應(yīng)(FTR)等,但如何實(shí)現(xiàn)更有效的模型傳遞,則仍是大量推廣近紅外光譜技術(shù)的研究課題之一。
[1] 吳海云,劉洋,左月明.近紅外光譜數(shù)據(jù)分析方法的研究進(jìn)展[J].農(nóng)產(chǎn)品加工·學(xué)刊, 2010(3):76-79.
[2] 汪慶平,董寶生.綠色快速分析技術(shù):近紅外及其應(yīng)用[J].云南農(nóng)業(yè)科技,2003(6): 11-13.
[3] 李軍會(huì),秦西云,張文娟,等.局部偏最小二乘回歸建模參數(shù)對(duì)近紅外檢驗(yàn)結(jié)果的影響研究[J].光譜學(xué)與光譜分析,2007,27(2):262-264.
[4] 韓春亮,鄭利宇,崔鳳霞.近紅外光譜的原理及應(yīng)用[J].河南教育學(xué)院學(xué)報(bào):自然科學(xué)版,2009,18(4):19-21.
[5] 黨文新,盧曉宇,龔紅菊.樣本集選擇對(duì)稻谷千粒重NIR模型預(yù)測(cè)精度的影響[J].江西農(nóng)業(yè)學(xué)報(bào),2011,23(5):22-24.
[6] 陳斌,葉靜,顏輝,等.定標(biāo)集樣品數(shù)對(duì)茶葉近紅外光譜分析精度的影響[J].江蘇大學(xué)學(xué)報(bào):自然科學(xué)版,2009,30(4):330-333.
[7] 李軍會(huì),秦西云,張文娟,等.樣品年份、化學(xué)值分布參數(shù)對(duì)近紅外檢測(cè)結(jié)果的影響[J].光譜學(xué)與光譜分析,2007,27(2):1754-1756.
[8] 蘆永軍,曲艷玲,樸仁官,等.近紅外光譜分析技術(shù)定標(biāo)和預(yù)測(cè)中的相似樣品剔除算法[J].光譜學(xué)與光譜分析,2002,4(2):158-161.
[9] 林家永.近紅外光譜分析技術(shù)在玉米品質(zhì)分析中的研究進(jìn)展[J].中國(guó)糧油學(xué)報(bào),2010, 25(4):108-115.
[10] 吳靜珠,王一鳴,張小超,等.近紅外光譜分析中定標(biāo)集樣品挑選方法研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006,37(4):80-82.
[11] 褚小立,王艷斌,陸婉珍.近紅外光譜定量校正模型的建立及應(yīng)用[J].理化檢驗(yàn):化學(xué)分冊(cè), 2008,44(8):796-800.
[12] 徐坤,劉鵬起,張玉娜,等.近紅外光譜分析技術(shù)及應(yīng)用[J].萊陽(yáng)農(nóng)學(xué)院學(xué)報(bào),2001,18 (3):237-240.