于翠紅,樊翠芹,張麗,徐俊杰,劉朝芳,蔣春志,唐曉東
(河北省農(nóng)林科學院糧油作物研究所,河北省作物遺傳育種實驗室,河北 石家莊 050035)
玉米是我國重要的糧食作物之一,也是飼料和加 工業(yè)原料的主要來源。近年來,隨著人們生活水平的提高和膳食結(jié)構(gòu)的改變,玉米的用途發(fā)生了重大變化,玉米品質(zhì)也變得越來越重要。國家標準中玉米粗蛋白含量測定采用常規(guī)的化學分析法,不僅需要一系列的前處理,操作繁瑣,還破壞了被測定樣品的子粒結(jié)構(gòu),使樣品不能再作為種子利用。而且針對不同的化學成分需要不同的分析方法和程序,分析速度慢,不適于作物品質(zhì)育種工作中大批量早代育種材料的篩選。因此,選擇一種快速、無破壞測定玉米品質(zhì)性狀的方法尤為重要。
近紅外光譜(near-infrared reflectance spectroscopy,NIRS) 分析技術是利用化學物質(zhì)在近紅外光譜區(qū)內(nèi)的光學特性,快速測定樣品中一種或多種成分含量和特性的物理測試技術。該技術是20 世紀80 年代后期迅速發(fā)展起來的,具有檢測樣品用量少、檢測速度快、無污染、非破壞性測定以及測定一次光譜可同時獲得多種品質(zhì)成分含量等優(yōu)點,目前廣泛應用于工業(yè)[1]、農(nóng)業(yè)[2]、食品[3,4]、醫(yī)藥[5,6]等領域,在歐美等國家已成為農(nóng)作物品質(zhì)分析的重要手段[7]。與國外相比,我國NIRS 分析技術在作物育種上研究進展較為緩慢。該技術雖然在一些重要農(nóng)作物的主要品質(zhì)性狀分析上得到了一定程度的應用,并建立了相應的定標模型,但是在實際應用過程中還存在著一些問題。如,建立模型所用的樣本量少,構(gòu)建的模型實際適用性差;模型得不到及時維護和升級,不能適應育種需要等。本研究旨在通過采集適合黃淮海地區(qū)種植的普通玉米雜交種,采用NIRS 分析與常規(guī)化學測定法相結(jié)合的方法,建立一種快速檢測玉米品質(zhì)性狀的定標模型,以實現(xiàn)玉米品質(zhì)育種過程中早代材料的無破壞大批量檢測,提高育種效率。
NIRS 分析技術用于測定玉米品質(zhì)研究已經(jīng)取得了一定進展[8,9],但由于其是一種間接的分析方法,測定樣品成分含量的方法是建立在化學測定法或其它儀器測定基礎之上,是一種“再生”的測定方法[10],因此,任何一臺近紅外光譜儀對每種組分或每種參數(shù)都要單獨定標[11]。利用DA7200 型近紅外光譜分析儀建立玉米子粒粗蛋白定標模型,探討其用于測定玉米子粒粗蛋白含量的可行性,旨為玉米品質(zhì)育種提供一種快速、簡易的測定方法,以適應玉米品質(zhì)育種的工作需要。
試驗材料為適合黃淮海地區(qū)種植的具有代表性的玉米品系,共計598 份。
1.2.1 樣品光譜采集 采用DA7200 二極管陣列近紅外光譜分析儀〔瑞典波通(Perten) 公司生產(chǎn)〕收集光譜數(shù)據(jù)。該光譜儀帶有旋轉(zhuǎn)式樣品檢測盤,在波長950~1 650 nm 范圍內(nèi)采集光譜,采樣間隔為5.0 nm,每個樣品采集2 次做雙平行實驗。取平均光譜值用于NIRS 分析。
1.2.2 樣品化學值測定 粗蛋白含量測定采用UDK159 全自動凱氏定氮儀,按照GB 5009.5—2016進行;水分含量測定采用LSIS-B2V/VC 111 型電熱恒溫干燥箱和CP114 型電子天平,按照GB 5009.3—2016進行。每個樣品重復測定2 次。粗蛋白含量為折干基后含量,指標值取2 次測定結(jié)果的平均值。
1.2.3 玉米粗蛋白定標模型的建立與驗證
1.2.3.1 近紅外漫反射光譜采集和處理分析。對參試玉米材料分別進行光譜掃描,得到598 份玉米近紅外原始光譜。對復雜有機物的光譜分析,要利用其全波長信息,運用化學計量學方法進行研究。在近紅外漫反射光譜中,各種基團存在特定吸收峰,由于不同基團產(chǎn)生的光譜在吸收峰位和強度上不同,隨著樣品組成的變化,光譜特征也將發(fā)生變化,因此,需要根據(jù)測定樣品的NIRS 與它們的組成成分,通過合理的光譜處理及校正方法,建立樣品光譜與組成成分之間的校正模型。本研究中,利用瑞典波通(Perten) 公司生產(chǎn)的Unscrambler 9.8 光譜分析軟件,在軟件提供化學計量方法中選用一階求導與標準正態(tài)變量轉(zhuǎn)換法(SNV) 相結(jié)合的方法進行光譜預處理,得到處理后的NIRS。將常規(guī)化學分析方法測得的數(shù)據(jù)輸入到光譜數(shù)據(jù)中進行分析,回歸統(tǒng)計方法采用偏最小二乘法(partial least square,簡稱PLS)[12,13]。
1.2.3.2 定標模型的建立與衡量。以玉米粗蛋白的化學測定值為橫坐標、近紅外預測值為縱坐標,得到定標集散點圖,并進行一元線性回歸分析。建立定標模型后,利用定標標準差(SEC)、預測標準差(SEP)、定標相關系數(shù)(Rc) 和預測相關系數(shù)(Rp) 衡量模型的預測能力。要求有較小的SEC 和SEP,較大的Rc和Rp。一般情況下,SEC 和SEP 越小,Rc 和Rp 越大,定標模型的預測能力越好。
1.2.3.3 定標模型的驗證。選取90 個具有代表性的玉米品種,采用國家標準中的化學方法測定其粗蛋白含量,利用建立的定標模型進行粗蛋白含量預測。對NIRS 分析結(jié)果與常規(guī)化學分析結(jié)果做線性圖并進行分析。
598 份定標集玉米樣品的粗蛋白含量為7.35%~14.42%,平均值為9.65%,標準差為1.77。樣品的粗蛋白含量范圍基本覆蓋了玉米生產(chǎn)和育種材料中粗蛋白含量的常態(tài)分布范圍,具有良好的連續(xù)性和代表性,滿足NIRS 定標條件的要求。
2.2.1 近紅外漫反射光譜采集和處理分析 對598 份玉米材料分別進行光譜掃描,結(jié)果(圖1) 顯示,在950~1 650 nm 波長范圍內(nèi)存在多個吸收峰。利用Unscrambler 9.8 光譜分析軟件,采用一階求導與SNV 相結(jié)合的方法進行光譜處理,得到處理后的近紅外光譜(圖2)。
圖1 598 份玉米的近紅外原始光譜Fig.1 Near infrared original spectra of 598 corn samples
圖2 一階求導和SNV 處理后的近紅外光譜Fig.2 Near infrared spectroscopy after first-order derivatives and SNV treatment
2.2.2 玉米粗蛋白定標模型的建立 從玉米粗蛋白定標集化學測定值與近紅外預測值的相關散點圖(圖3)可以看出,樣品測定結(jié)果數(shù)據(jù)點基本分布在直線兩側(cè),且偏離很小。通過一元線性回歸,得到定標方程為y=0.886x+1.126,Rc 為0.941 3,SEC 為0.358 7,呈極顯著正相關,說明定標集的預測值與化學測定值具有顯著的線性關系。
對90 個玉米品種粗蛋白含量的化學測定值與預測值(表1) 進行比較,同時,對NIRS 分析結(jié)果與常規(guī)化學分析結(jié)果做線性圖(圖4),得到預測回歸方程為y=0.93x+0.450 7,Rp 為0.972 1,SEP 為0.313 7。表明驗證集各樣品的NIRS 分析結(jié)果與常規(guī)化學分析結(jié)果具有較好的線性關系,樣品較集中地分布在中心線附近,預測值與實測值較吻合,所建模型具有較好的預測效果。
圖3 玉米粗蛋白定標集化學測定值與近紅外預測值的相關散點圖Fig.3 Scatter diagram of correlation between chemical determination value of corn crude protein calibration set and the near infrared predictions
NIRS 分析依靠樣品間光譜信息的細微差別來對樣品進行定量或定性分析,是一種物理的分析方法,其分析結(jié)果受多種因素影響,主要是樣品的代表性和化學分析誤差。本研究所用材料為適合黃淮海地區(qū)種植的玉米雜交種,子粒類型包括馬齒型、硬粒型和中間型,子粒粗蛋白含量變化范圍為7.35%~14.42%,因此,樣品具有較好的代表性。
粗蛋白含量化學值的測定采用國家標準方法,每個樣品進行2 次重復測定,目的在于減少化學分析造成的誤差。其次,掃描時樣品的粒度大小、均勻性等也會造成光譜誤差。本研究中,采取了重復裝樣、取平均光譜的方法,來消除玉米子粒樣品因粒度大小、均勻性不一致等因素造成的光譜誤差。此外,在建模前采用一階求導處理與SNV 相結(jié)合的方法對光譜進行預處理,部分消除了光譜誤差,從而提高了所建模型的質(zhì)量。
王鐵固等[14]以玉米完整子粒為試驗材料,采用偏最小二乘回歸法建立近紅外反射光譜測定其蛋白質(zhì)和淀粉含量的數(shù)學模型,模型預測結(jié)果與化學測定值的相關系數(shù)分別達到了0.946 9 和0.924 0,校正后模型預測的準確性與化學測定方法相當。趙環(huán)環(huán)等[15]利用付里葉近紅外漫反射光譜技術與PLS 法相結(jié)合對玉米子粒樣品的蛋白質(zhì)含量進行分析,預測樣品相關系數(shù)為0.982,預測標準差為0.587,預測模型對樣品的預測結(jié)果比較理想,可以滿足農(nóng)產(chǎn)品品質(zhì)分析的要求。本研究中,驗證集NIRS 的測試值與化學方法實測值相關系數(shù)為0.972 1,預測標準差為0.313 7,絕對差值介于-0.35~0.77,符合粗蛋白含量測定允許的誤差范圍,說明定標模型的預測值與化學測定值具有較高的一致性,預測效果較好,達到了品質(zhì)分析對準確度的要求。與傳統(tǒng)分析技術相比,利用NIRS 分析技術進行測定時不需要對分析樣品進行破壞,分析過程中不消耗試劑和耗材,且檢測速度快(檢測1 個品種只需3 min)。因此,用所建定標模型進行玉米子粒粗蛋白品質(zhì)分析適用于大批量育種早代材料的篩選。
表1 玉米粗蛋白含量化學測定值與近紅外預測值的比較Table 1 Comparison of chemical determination values and near infrared predicted values of corn crude protein content (%)
圖4 玉米粗蛋白驗證集化學測定值與近紅外預測值的相關散點圖Fig.4 Scatter diagram of correlation between chemical determination value of corn crude protein validation set and the near infrared prediction
雖然本研究所用材料具有較好的代表性,粗蛋白含量范圍基本覆蓋了玉米生產(chǎn)和育種材料的常態(tài)分布范圍,所得定標模型的驗證結(jié)果表明模型的預測值與化學測定值的相關系數(shù)達到0.972 1,可以利用該模型對玉米子粒粗蛋白含量進行無損檢測,指導玉米品質(zhì)育種早代材料的篩選,但是,樣品中粗蛋白含量的變化范圍尚不夠?qū)挿?,所收集的材料中缺少含量低?%和高于15%的樣品。因此,應在現(xiàn)有研究的基礎上,增加一些有代表性的樣品,使樣品中粗蛋白成分的變化范圍足夠?qū)挿翰⒛芨采w今后玉米生產(chǎn)或育種材料中粗蛋白含量的變化范圍,同時對所建定標模型做進一步優(yōu)化,以提高模型的質(zhì)量,擴大其應用范圍。