王純陽 馬玉涵,3 劉斌美 郭盼盼 黃 青,*
(1 中國科學(xué)院合肥物質(zhì)研究院技術(shù)生物與農(nóng)業(yè)工程研究所,安徽 合肥 230031;2 中國科學(xué)技術(shù)大學(xué) 生命科學(xué)學(xué)院,安徽 合肥 230026; 3安徽科技學(xué)院生命與健康科學(xué)學(xué)院,安徽 鳳陽 233100;4中國科學(xué)院合肥物質(zhì)研究院智能研究所,安徽 合肥 230031)
稻米(Oryzasativa)屬禾本科植物,是世界上主要糧食作物和四大直接經(jīng)濟作物之一,是人體必需的淀粉、蛋白質(zhì)和礦物質(zhì)等營養(yǎng)成分重要來源,因此,稻米種子的質(zhì)量控制一直是水稻育種工作者、農(nóng)民和消費者極為關(guān)注的問題[1]。蛋白質(zhì)是水稻的主要營養(yǎng)成分之一,也是評價稻米品質(zhì)的重要指標(biāo)[2]。為了能夠更加精確地獲得具有最優(yōu)性狀的種子,育種專家已經(jīng)開始在單粒種子水平上研究個體的性狀差異[3-4]。研究發(fā)現(xiàn)通過單粒種子的檢測技術(shù)可以在篩選優(yōu)質(zhì)突變體方面顯著提高效率[3]。但對單粒種子進行檢測時傳統(tǒng)方法存在相當(dāng)大的困難,工作量巨大且耗時長,檢測過程還會對種子本身造成傷害而無法用于后續(xù)的留種選育。
相比傳統(tǒng)的化學(xué)有損測定方法,如凱氏定氮法(kjeldahl method,KM)[5]、杜馬斯燃燒定氮法(Dumas nitrogen analyzer,DM)[6],近紅外光譜(near infrared spectroscopy,NIRS)技術(shù)具有無損、快速、多成分、無污染的分析特點,同時,在檢測過程中無需進行樣品處理,也提高了谷物的檢測效率[7-9]。目前,NIRS因其經(jīng)濟、方便等特點已被廣泛應(yīng)用于農(nóng)業(yè)[10-11]、食品[12-13]等領(lǐng)域,在單粒大豆[14]、玉米[15]和小麥[16-17]中分別成功檢測了淀粉、蛋白質(zhì)和水分等化學(xué)成分含量。在單粒稻種的NIRS分析中,研究人員均只采用了近紅外透射光譜用于分析各化學(xué)成分[18-21],而NIRS反射光譜僅用于建立米粉[22-23]和群體糙米[24]的蛋白質(zhì)和直鏈淀粉模型。在實際應(yīng)用中常采用近紅外反射光譜代替NIR透射光譜進行水稻種子的在線快速檢測。由于單粒種子體積小,在水稻單粒種子鑒定中,光譜信噪比相對較低,有效地應(yīng)用近紅外反射光譜技術(shù)仍然是一個挑戰(zhàn),同時,稻殼的存在也會對測量過程造成干擾。
本研究試圖將NIR光譜技術(shù)應(yīng)用于水稻種子蛋白質(zhì)含量分析,為此,以獲得的離子束輻照秈稻品種9311突變體庫為定標(biāo)樣本,建立可靠的近紅外定量模型,并嘗試采用不同的近紅外測量模式(包括透射、漫反射和透反射)構(gòu)建和優(yōu)化偏最小二乘回歸模型,以期為高效準(zhǔn)確地評價水稻單粒種子的蛋白質(zhì)含量提供基礎(chǔ)。
用于建模的稻種來自9311水稻離子束輻射突變體庫,是用蘭州近代物理所的HIRF 裝置(heavy ion research facility)通過用碳離子處理(200 Gy,80 MeV)得到的誘變種子,并經(jīng)過多代培育獲得的。其稻谷粒型之間差異明顯,單粒稻種的重量變化范圍為27.6~41.0 mg,較好地避免了其他性狀的干擾。此外,本試驗中用于模型適用性的測試為來自不同地域的稻種,包括Ⅱ伏838、明恢63、華粳秈74、武運粳27、IR36(秈)、9019(秈)、黃華占(秈)和桂朝2號等8個品種。
測定前將水稻種子放置干燥箱內(nèi)平衡約12 h,以避免水分干擾;種殼測定時保持其物理狀態(tài)與種子一致,避免物理變量的干擾。采用近紅外光譜儀(Bruke MPA,德國)分別采集相應(yīng)種子、種殼、米粉和糙米的漫反射、透反射及漫透射光譜。
圖1 單粒糙米(A)及其薄片(B)的漫反射光譜和透射光譜分析Fig.1 Trans-reflectance and diffuse-reflectance spectra of a single brown-rice kernel (A) and brown-rice flake (B)
光譜采集軟件為OPUS7.0。其中,漫反射光譜的光譜采集范圍為4 000~12 000 cm-1,分辨率為16 cm-1,掃描次數(shù)為32次;透反射光譜采集范圍、分辨率和掃描次數(shù)與漫反射光譜相同,但在采集光譜時,需在糙米或水稻種子后放置一片與其大小相似的全反射體;漫透射光譜的光譜采集范圍為5 800~12 500 cm-1,分辨率為16 cm-1,掃描次數(shù)為64次。
人工去除種殼,將糙米壓碎,過100目篩,然后置于80℃烘箱過夜。采用Vario EL cube元素分析儀(德國Elementar)中CHNS模式測定米粉的含氮量。取約5 mg米粉樣品,氧化爐溫度設(shè)置1 150℃,還原爐設(shè)置850℃,通氧時間為90 s,標(biāo)準(zhǔn)品為苯磺酸[24]。用測定的米粉含氮量(以百分分?jǐn)?shù)表示)乘以系數(shù)5.95(對稻米而言,氮換算為蛋白質(zhì)含量的系數(shù)),即為相應(yīng)粗蛋白含量。
建模集樣本數(shù)為60,蛋白質(zhì)含量的變化范圍為6.069%~14.399%;預(yù)測集樣本數(shù)為20,蛋白質(zhì)含量的變化范圍為7.38%~14.10%。建模集和預(yù)測集的蛋白質(zhì)含量跨度較大,具有較好的代表性。模型的分析建立和預(yù)測在Unscramble 9.7上完成,采用偏最小二乘法建立模型,并分別采用標(biāo)準(zhǔn)正態(tài)變換(Standard normal variate,SNV)、多元散射校正(Multiplicative scatter correction,MSC)、Savitzky-Golay一階導(dǎo)數(shù)(SG first deriv)和Savitzky-Golay二階導(dǎo)數(shù)(SG second deriv)光譜預(yù)處理方法優(yōu)化定量模型。評價模型的性能采用決定系數(shù)(R2)、交互驗證均方根誤差(root mean square error of validation,RMSECV)和預(yù)測均方根誤差(root mean square error of prediction,RMSEP)[25]。
單粒糙米的漫反射光譜和透反射光譜的吸收波動區(qū)別較小(圖1-A),為此從單粒糙米的腹部取一塊厚度約1.5 mm的糙米薄片,套一鋁箔制成的近紅外光譜增強反射器,再分別測定其漫反射和透反射光譜(圖1-B)。通過對比發(fā)現(xiàn),糙米薄片的透反射光譜與米粉的漫反射光譜相似,說明透反射光譜用于糙米檢測效果優(yōu)于漫反射光譜采集方式。
基于上述的單粒糙米近紅外光譜特征,分別嘗試了在漫反射、透反射和透射光譜采集方式下建立單粒糙米蛋白質(zhì)定量模型。由表1可知,漫反射光譜采集方式下單粒糙米蛋白質(zhì)各偏最小二乘(PLS)模型的決定系數(shù)(R2)值偏低,難以滿足實際分析;透反射光譜采集方式下SNV光譜預(yù)處理的模型最優(yōu),其R2=0.95,預(yù)測均方根誤差(RMSEP)為0.34%(圖2-A);透射光譜采集方式下SNV光譜預(yù)處理的模型最優(yōu),其R2=0.97,RMSEP=0.27%(圖2-B)。透反射光譜、透射光譜采集方式下SNV光譜預(yù)處理的模型對應(yīng)的最佳主成分?jǐn)?shù)的回歸系數(shù)曲線見圖2-C、-D。綜上,運用近紅外光譜測定單粒糙米的蛋白質(zhì)含量時,透反射和透射光譜采集方式均能滿足分析要求。
表1 單粒糙米蛋白質(zhì)模型的交互驗證和外部檢驗結(jié)果Table 1 Cross validation and external validation statistics for protein content in single brown-rice kernels
實際分析中,完整的稻種分析更具有優(yōu)勢,故本試驗對單粒稻種的NIRS特征作了進一步分析。由圖3可知,8 300 cm-1處吸收峰為糙米和稻種,而稻殼沒有吸收,故8 300 cm-1處吸收峰為糙米的光譜吸收峰,6 500~7 200 cm-1波數(shù)范圍內(nèi)糙米和稻殼均存在吸收,而4 000~6 500 cm-1波數(shù)范圍內(nèi)稻殼吸收更強。此外,單粒稻種的近紅外漫反射光譜和單粒糙米的近紅外漫反射光譜明顯不同,證明稻殼對稻種的近紅外光譜影響較大。為了更有效地去除稻殼對稻種的光譜影響,選用6 500~9 100 cm-1和7 200~9 100 cm-1兩個段波數(shù)范圍建立蛋白質(zhì)模型。
由表2可知,漫反射光譜采集方式下,由于稻殼的影響很難建立滿足實際分析的蛋白質(zhì)定量模型;透反射光譜采集方式下,選擇6 500~9 100 cm-1波數(shù)范圍和SNV光譜預(yù)處理,模型的RMSEP=0.81%(圖4-A);透射光譜采集方式下,選擇7 200~9 100 cm-1波數(shù)范圍和SNV光譜預(yù)處理,模型的RMSEP=0.24%(圖4-B)。圖4-C、D分別展示了透反射和透射光譜采集方式下性能最優(yōu)的蛋白質(zhì)定量模型的回歸系數(shù)曲線。綜上,透射光譜采集方式下,單粒稻種的蛋白質(zhì)定量模型較為準(zhǔn)確。透反射光譜采集方式下,模型具有一定的預(yù)測能力。
圖3 漫反射(A)、透反射(B)和透射(C)光譜采集方式下單粒稻種、糙米和稻殼的近紅外光譜分析Fig.3 The comparison of NIR spectra of single rice kernel, rice grain and husk under (A) diffuse-reflectance, (B) transflectance, and (C) transmittance spectral acquisition modes
為了測試單粒糙米和單粒稻種的蛋白質(zhì)定量模型的適用性,測試了Ⅱ伏838、明恢63、華粳秈74、武運粳27、IR36(秈)、9019(秈)、黃華占(秈)和桂朝2號8種其他來源的種子。由表3、圖5可知,選用合適的模型可以比較準(zhǔn)確地預(yù)測其他稻種的蛋白質(zhì)含量,特別是采用透射光譜方式。此外,在透反射光譜采集方式下,本研究已建立的蛋白質(zhì)含量透射模型對其他稻種的單粒糙米的蛋白質(zhì)預(yù)測能力弱于對9311突變株的糙米蛋白質(zhì)預(yù)測能力。這可能是因為透反射光譜不僅包含了糙米的化學(xué)成分信息,而且包含了單粒種子的物理形態(tài)、新陳度等信息,如何扣除這些因素的影響以提高模型適用性尚有待進一步研究。
表2 單粒稻種蛋白質(zhì)模型的交互驗證和外部檢驗結(jié)果Table 2 Cross validation and external validation statistics for protein content in single rice seeds
目前,研究學(xué)者多采用NIR漫反射光譜分析米粉的蛋白質(zhì)含量[22-23],而鮮見用NIR漫反射光譜分析單粒糙米蛋白質(zhì)含量的報道。糙米的密度高于米粉,且已采用NIR透射光譜成功建立了單粒糙米的蛋白質(zhì)模型[21],故推測漫反射光譜采集方式下漫反射光譜未采集到信號足夠強的化學(xué)成分信息。研究表明,透反射測量不僅比透射測量更為便利,而且比漫反射測量的信噪比更高,尤其適用于近透明樣品的測量[26]。因此,本研究采用透反射光譜采集方式驗證這一推測。為了應(yīng)用透射近紅外光譜,采用鋁箔制成的近紅外光譜增強反射器。本研究結(jié)果表明,單粒糙米的漫反射和透反射光譜吸收波動區(qū)別較小,而糙米薄片的透反射光譜與米粉的漫反射光譜更加相似;對比分析得知,單粒糙米的漫反射光譜沒有足夠的糙米化學(xué)成分信息,而單粒糙米的透反射光譜明顯克服了漫反射光譜的缺點,具有更好的信噪比,且4 000~5 300 cm-1波數(shù)范圍內(nèi)光譜吸收“飽和”。
Rittiron等[21]采用NIR透射光譜構(gòu)建了單粒糙米的蛋白質(zhì)定量模型, 其最低SEP為0.38%,選定的波數(shù)分別為5 753、5 896、5 931、6 053 cm-1。本試驗得到的單粒糙米定量模型優(yōu)于該模型。定量模型構(gòu)建過程中,最優(yōu)變量的回歸系數(shù)分析可用于透反射和透射光譜采集方式下對光譜定量模型選取范圍的有效篩選[27]。
圖4 透反射光譜、透射光譜采集方式下SNV光譜預(yù)處理的單粒稻種蛋白質(zhì)模型的外部檢驗結(jié)果(A、B)及其相應(yīng)回歸系數(shù)曲線(C、D)Fig.4 The external validation results of single rice grain protein content model of NIR trans-reflectance spectra (A) and of NIR transmittance spectra (B) with the SNV pre-treatment, and correspond regression coefficient curves of the optimum number of latent variables (C, D).
注:A、B分別為透反射采集方式下一階導(dǎo)數(shù)光譜、一階導(dǎo)數(shù)+矢量歸一化光譜預(yù)處理結(jié)果;C,D分別為透射采集方式下多元散射校正光譜、一階導(dǎo)數(shù)+多元散射校正光譜預(yù)處理結(jié)果。Note:A and B are the predicted results based on transflectance spectra under first-derivative and first-derivative + SNV pre-treatment.C and D are the predicted results based on transmittance spectra under MSC and first-derivative + MSC pre-treatment, respectively.圖5 單粒糙米蛋白質(zhì)模型的預(yù)測結(jié)果Fig.5 The predicted results of single brown-rice protein content models
名稱NameN%N%×5.95糙米-透反射Brown ricetransflectance稻種-透反射Rice seedtransflectance糙米-透射Brown rice transmittance稻種-透射Rice seedtransmittanceⅡ伏8381.166.907.716.177.257.74Ⅱ伏8381.076.377.216.256.357.24Ⅱ伏8381.247.387.887.127.317.37Ⅱ伏8381.468.698.128.728.629.24明恢631.297.687.598.657.848.20明恢631.368.098.117.838.008.26明恢631.267.507.377.307.507.63明恢631.539.108.787.178.768.80IR361.277.569.148.957.938.76IR362.0912.4411.1111.8312.2412.40IR361.9011.3010.419.6211.7911.53華粳秈741.126.667.277.316.636.75華粳秈741.599.468.779.759.029.45桂朝2號1.337.919.517.627.747.93桂朝2號1.659.829.227.938.828.98黃華占1.197.087.617.466.957.47黃華占0.965.716.796.045.616.00武運粳271.378.159.359.278.949.4290191.227.268.568.747.188.09當(dāng)粳101.508.938.667.658.268.81
本研究中,單粒糙米的透射光譜中6 050~7 610 cm-1和8 440~8 800 cm-1區(qū)域?qū)ζ涞鞍踪|(zhì)模型影響較大,而這兩個區(qū)域分別為一級倍頻區(qū)和二級倍頻區(qū)[28],這些區(qū)域中6 094、7 251、8 440、8 763 cm-1與蛋白質(zhì)中C-H鍵的伸縮和彎曲振動的一級倍頻、二級倍頻和組合頻相關(guān),6 603、6 657、6 958 cm-1分別與蛋白質(zhì)中N-H鍵的伸縮振動的一級倍頻和組合頻相關(guān),6 900、8 620 cm-1分別為C=O的伸縮振動的三級倍頻和四級倍頻[29];單粒糙米的透反射光譜中,4 400~4 600、5 600~6 050、8 300~8 800 cm-1對其蛋白質(zhì)模型影響較大,其中C=O、N-H和C-H的分子振動主要在4 400~4 600 cm-1波數(shù)范圍[30],這一結(jié)果與米粉的回歸系數(shù)分析相一致。此外,Rittiron等[21]在建立單粒糙米的蛋白質(zhì)模型時采用了5 754、5 896、5 931、6 053 cm-1波數(shù)(R2=0.96),也證明了5 600~6 050 cm-1波數(shù)范圍的合理性。
在實際生產(chǎn)和新品種選育過程中,單粒稻種的分析對稻種品質(zhì)的分析更有科研意義和應(yīng)用價值。Oido等[20]利用NIR透射光譜對單粒稻種蛋白質(zhì)含量(參考值范圍為5.9%~7.9%)進行了定量分析,選定的波數(shù)區(qū)域為5 880~12 500 cm-1,成功構(gòu)建的該單粒稻種蛋白質(zhì)含量模型的SEP為0.53;Kawamura等[31]利用NIR透射光譜對未干糙米蛋白質(zhì)含量(參考值為7.%~9.4%)進行定量分析,選用的波數(shù)范圍為9 300~12 100 cm-1,構(gòu)建的蛋白質(zhì)含量模型SEP為0.24。本試驗結(jié)果(圖4)表明,稻種在透反射和透射光譜采集方式下具有性能最優(yōu)的蛋白質(zhì)定量模型的回歸系數(shù)曲線,該結(jié)果糙米蛋白質(zhì)含量的影響范圍一致。8 300~8 800 cm-1波數(shù)范圍對單粒稻種的蛋白質(zhì)定量模型影響較大,該波數(shù)范圍主要為C-H的二級倍頻和C=O的四級倍頻[29]。單粒稻種透反射光譜的6 500~8 100 cm-1波數(shù)范圍對其蛋白質(zhì)模型的建立存在影響,但由于稻殼的干擾,該波段與蛋白質(zhì)含量間的相關(guān)性較差。本研究構(gòu)建的蛋白質(zhì)含量NIR光譜定量模型,稻種蛋白質(zhì)含量參考值在6.07%~14.4%之間,比Oido等[20]和Kawamura等[31]建立的單粒稻種的蛋白質(zhì)含量模型測量范圍更寬。本研究通過比較3種NIR光譜采集方式發(fā)現(xiàn),基于透射測量的蛋白質(zhì)含量模型預(yù)測能力更優(yōu),甚至更接近透過測量的預(yù)測能力,透射光譜采集方式下,選用光譜范圍為7 200~9 100 cm-1,預(yù)處理方式為標(biāo)準(zhǔn)正態(tài)變換,維數(shù)為7時,定量效果最佳,交互驗證R2=0.96,RMSECV=0.26%,外部驗證R2=0.98、RMSEP=0.24%。
為對單粒糙米和稻種的蛋白質(zhì)含量進行高效無損定量分析,本研究以蛋白質(zhì)含量為6.07%~14.4%的水稻突變體庫為分析對象,對比分析了漫反射、透射、透反射3種采集模式對單粒糙米和稻種NIR光譜及定量模型的影響。通過對比發(fā)現(xiàn),在光譜采集方面,透反射光譜采集方式下可以建立相關(guān)性較好的單粒糙米蛋白質(zhì)模型和具有一定相關(guān)性的單粒稻種蛋白質(zhì)模型,且更適合實際中的在線分析。由于稻殼的存在,單粒稻種漫反射光譜采集方式會受到一定的干擾,導(dǎo)致檢測準(zhǔn)確度較低,而透射和透反射光譜可以有效降低這一干擾,透射光譜采集方式下可以建立準(zhǔn)確度較高的單粒稻種蛋白質(zhì)定量模型,其R2=0.96,RMSEP=0.24%。通過對來源不同的水稻種子進行測試,驗證了單粒種子蛋白質(zhì)定量模型具有一定的適用性。本研究結(jié)果為單粒糙米和單粒稻種的近紅外光譜在線無損分析提供了理論基礎(chǔ),也為作物育種行業(yè)快速、高效地篩選和水稻種子質(zhì)量檢測提供了一個實用的范例。