司徒榮貴 鐘歲英 葉威方 司徒文斗 毛積鵬,2
(1. 臺山市紅嶺種子園,廣東 臺山529223;2. 華南農(nóng)業(yè)大學(xué) 林學(xué)與風(fēng)景園林學(xué)院/廣東省森林植物種質(zhì)創(chuàng)新與利用重點實驗室,廣東 廣州 510642)
濕加松Pinus elliottii×P. caribaea是濕地松P.elliottii與加勒比松P. caribaea的雜交后代,具有產(chǎn)脂量高、生長快和適應(yīng)性強等特點,是我國南方適生地區(qū)營建脂材兼用和大徑林的一個重要樹種[1-2]。但是近年來松林面積大幅度減少,勞動力成本不斷提高,使得木材和松脂產(chǎn)業(yè)萎縮。而松針作為松樹的可持續(xù)利用組織部位,其提取物中富含黃酮類、維生素、氨基酸和木脂素等多種活性成分[3]。特別是其中的黃酮類化合物具有抗菌、抗炎、抗氧化、抗癌、抗疲勞、增強免疫力、調(diào)血脂和保護心血管系統(tǒng)等多種功效[4-8]。目前,植物組織中黃酮類成分含量的測定方法主要有高效液相色譜—質(zhì)譜聯(lián)用法和紫外分光光度計法等。但是這些測定方法大多具有前處理復(fù)雜、操作費時和成本高等缺點。難以在濕加松高黃酮含量良種選育工作中廣泛應(yīng)用。而近紅外光譜(Near Infrared Spectroscopy,NIRS)技術(shù)可利用有機化合物在950 ~ 1 650 nm 的特征吸收,分析測定物質(zhì)的組分及其含量、具有快速、高效、低成本、無損和無污染等特點[9-10]。近年來NIRS 技術(shù)已被廣泛應(yīng)用于農(nóng)業(yè)、食品和林產(chǎn)化工等領(lǐng)域[11-12]。例如,大豆油中脂肪酸組分含量的測定[13],大麥籽粒中總淀粉含量的測定[14],花生籽仁中蔗糖含量的測定[15],杉木Cunninghamia lanceolata組織中纖維素和木質(zhì)素含量的測定[16]以及沉香含油量的測定[17]等。但利用NIRS 技術(shù)預(yù)測植物組織中黃酮化合物含量的研究尚未見報道。本研究旨在建立濕加松黃酮類成分含量的近紅外分析模型,以期為濕加松黃酮含量的測定提供快速有效的方法,為高黃酮含量濕加松品系的良種選育工作提供技術(shù)基礎(chǔ)。
以種植于廣東省臺山市紅嶺種子園的6 a 生濕加松子代測定林為研究材料,于2019 年8 月分別隨機采取了110 個生長旺盛且無病蟲害單株的當(dāng)年生松針組織部位鮮樣約100 g。
75℃條件下烘72 h,充分粉碎后過60 目篩,得110 份濕加松松針粉末樣本。隨機選擇其中94 份樣本作為預(yù)測集,其余16 份樣本作為外部驗證集。
各樣本分別稱取100 mg 于10 mL EP 管中,隨后加入5 mL 甲醇溶液,充分混勻后室溫超聲60 min,4℃條件下,12 000 rpm 離心12 min。取上清液濃縮至干后加200 μL 甲醇復(fù)溶,混勻后取上清液過0.22 μm 微孔濾膜,濾液保存于進樣瓶中用于LS-MS 分析。根據(jù)前期預(yù)實驗結(jié)果選取了16種在濕加松松針組織中含量較高的黃酮為測定對象(表1)。分別稱取兒茶素、槲皮素和黃芪苷等16 種黃酮化合物的標(biāo)準(zhǔn)品適量,隨后用甲醇溶液(80%)配制成16 種單標(biāo)母液。取16 種單標(biāo)母液適量配制成混合標(biāo)準(zhǔn)品后,用80%的甲醇溶液倍數(shù)遞減稀釋至合適濃度,制成工作標(biāo)準(zhǔn)液。
表1 16 種黃酮的特征信息及在110 個樣本中的平均含量Table 1 The characteristic information of 16 flavonoids and mean contents in 110 samples
分別利用液相色譜儀(Thermo Ultimate 3000)和質(zhì)譜儀(Thermo Q Exactive HF-X)采集各樣本的色譜和質(zhì)譜數(shù)據(jù)。色譜柱型號及相關(guān)參考按照李賽楠[18]等人的設(shè)置。
利用DA7200 近紅外光譜分析儀采集樣品的近紅外漫反射光譜數(shù)據(jù),首先將儀器室溫度控制在22℃左右,并將樣本提前于儀器室放置24 h。開機后預(yù)熱30 min,光斑直徑3.5 cm,光譜掃描范圍為950~1 650 nm,分辨率為5 nm,光譜采集速度約為100 條光譜/s,掃描次數(shù)為100 次/s。每一個松針粉樣品掃描3 次和重復(fù)裝樣3 次,取其平均近紅外光譜作為樣品的原始光譜。
偏最小二乘法回歸(Partial Least Square Regression,PLS)可以對全波譜數(shù)據(jù)或部分光譜數(shù)據(jù)進行分析,能夠?qū)馍⑸浜推渌M分帶來的干擾做出補償,比對逐個因變量做多元回歸更有效。適用于復(fù)雜體系,而且模型比較穩(wěn)定、分析性能和預(yù)測精度更好[19-20]。因此,本研究采用偏最小二乘法對實驗樣品進行近紅外建模。
主要從相關(guān)性和外部預(yù)測能力兩方面對模型的優(yōu)劣進行評價。在相關(guān)性方面,所建模型應(yīng)具有較高的校正集相關(guān)系數(shù)(Related coefficient of calibration,Rc)和交互驗證集相關(guān)系數(shù)(Related coefficient of Validation,Rv),較低的校正集均方根誤差(Root Mean Square Error of Calibration, RMSEC)和交互驗證集均方根誤差 (Root Mean Square Error of Validation, RMSEV),主要以Rv和RMSEV 作為判斷標(biāo)準(zhǔn)。在外部預(yù)測能力方面,模型的預(yù)測值與實測值應(yīng)該具有較高的相關(guān)系數(shù)(Related coefficient,R)和較低的預(yù)測均方根誤差(Root Mean Square Error of Prediction, RMSEP)。
利用Microsoft Excel 2016 和R3.4 軟件對各樣本中16 種黃酮物質(zhì)的含量進行統(tǒng)計分析,使用軟件The Unscrambler 9.7 對近紅外光譜圖進行處理和模型建立。
利用LC-MS 對所有樣本中的16 種黃酮物質(zhì)分別進行定量檢測,各數(shù)據(jù)集樣本16 種黃酮物質(zhì)總含量的統(tǒng)計結(jié)果如表2 所示。94 個校正集樣本16 種黃酮總含量的分布頻率如圖1 所示。94 個校正集樣本16 種黃酮總含量的最小值為15.28 μg·g-1,最大值為95.70 μg·g-1,平均值為50.04 μg·g-1,標(biāo)準(zhǔn)偏差為15.43 μg·g-1。16 個驗證集樣本16 種黃酮總含量的最小值為28.20 μg·g-1,最大值為80.72 μg·g-1,平均值為56.37 μg·g-1,標(biāo)準(zhǔn)偏差為13.17 μg·g-1。
表2 校正集和驗證集樣本16 種黃酮物質(zhì)總含量的基本統(tǒng)計特征Table 2 Descriptive statistics about total content of 16 flavonoids of calibration set and validation set μg·g-1
圖1 94 個校正集樣品16 種黃酮總含量的分布頻率直方圖Figure 1 Histogram of frequency distribution of total content of 16 flavonoids in 94 calibration set
校正集樣本的近紅外原始反射光譜如圖2 所示,由圖可知,雖然不同樣本的吸收強度有所不同,但變化趨勢基本一致,且均在1 465 nm 處有最強的吸收峰。表明不同濕加松松針樣本中16 種黃酮的總含量具有明顯差異,使得每份樣本在同一吸收峰的吸光度有所不同。
圖2 94 個校正集樣品近紅外原始反射光譜Figure 2 Near infrared original reflection spectrum of 94 correction set samples
除樣本信息外,像儀器響應(yīng)、散射光和雜射光等與待測樣本性質(zhì)無關(guān)的信息和噪音均會對近紅外光譜數(shù)據(jù)的收集分析造成干擾,從而降低預(yù)測模型的準(zhǔn)確度。對光譜進行預(yù)處理在一定程度上可以提高所建模型的準(zhǔn)確性和可靠性[21]。本研究比較了無預(yù)處理(No spectral preprocessing)、歸一化(Normalization)、多元散射校正(Multiplicative Scattering Correction,MSC)、標(biāo)準(zhǔn)正態(tài)變量轉(zhuǎn)換法( Standard Normal Variate Transformation,SNV)、一階導(dǎo)數(shù)(First Deviation,F(xiàn)D)、濾波擬合(Savitzky golay,SG)以及FD+SG 與FD+SNV共8 種光譜預(yù)處理方法。并以校正集相關(guān)系數(shù)Rc、校正集均方根誤差RMSEC、交互驗證集相關(guān)系數(shù)Rv及交互驗證集均方根誤差RMSEV 為評價指標(biāo)。結(jié)果表明,使用FD+SG 法預(yù)處理光譜數(shù)據(jù)所建模型具有最高的Rc和Rv值及最低的RMSEC 和RMSEV 值(表3)。
表3 不同光譜預(yù)處理方法下預(yù)測模型的參數(shù)比較Table 3 Parameters comparison of the prediction models built under different spectral preprocessing methods
主成分數(shù)太少或太多均會影響模型的預(yù)測準(zhǔn)確度,因此最佳主成分數(shù)的確定對模型的構(gòu)建具有重要作用[22]。本研究根據(jù)RMSEV 最小原則,對最佳主成分數(shù)進行了分析。結(jié)果表明,在FD+SG 的光譜預(yù)處理方法下,RMSEV 隨著主成分數(shù)的增加呈現(xiàn)先降低后緩慢增加的趨勢,根據(jù)RMSEV 越小則模型的預(yù)測能力越強的原則,當(dāng)最佳主成分數(shù)為10 時,模型所對應(yīng)的RMSEV 最小,因此本次建模所選擇的最佳主成分數(shù)為10(圖3)。
圖3 模型RMSEV 值隨主成分數(shù)變化趨勢Figure 3 The diagram of RMSEV variation with the number of principal components
使用軟件The Unscrambler 9.7 對近紅外光譜圖進行預(yù)處理和模型建立,采用FD+SG 法預(yù)處理光譜數(shù)據(jù)。在950~1 650 nm 建模波段,主成分數(shù)為10 的條件下所建的16 種黃酮總含量預(yù)測模型如圖4 所示。校正集相關(guān)系數(shù)為0.852 1,校正集均方根誤差為6.361 0,交互驗證集相關(guān)系數(shù)為0.705 9,交互驗證集均方根誤差為9.150 9。16 種黃酮總含量的Rc和Rv均最大,RMSEC 和RMSEV 均最低,說明所建模型預(yù)測性能較好。
圖4 濕加松16 種黃酮物質(zhì)總含量近紅外預(yù)測模型Figure 4 The near-infrared prediction model of total content of 16 flavonoids in P. elliottii × P. caribaea
為檢驗預(yù)測模型的可靠性,本研究利用所建預(yù)測模型對16 個驗證集樣本的16 種黃酮總含量進行了預(yù)測并與其實際測定值進行比較分析。結(jié)果表明,16 個驗證集樣本的預(yù)測值與實際測定值之間的相關(guān)系數(shù)可達0.863 7,預(yù)測均方根誤差為5.867 與校正集均方根誤差接近。此外,對于給定的顯著性水平0.05,外部驗證集樣本預(yù)測值和實際測定值的配對t 檢驗結(jié)果表明兩者差異不顯著(P=0.213 6 > 0.05),表明所建的預(yù)測模型預(yù)測效果好,可信度高。
近紅外光譜技術(shù)主要依靠樣本間光譜信息的細微差別來對樣本進行定量或定性分析,具有分析速度快、效率高、樣本預(yù)處理簡單和適用范圍廣等特點[14],被廣泛應(yīng)用于食品、生物化學(xué)和石油化工等多個領(lǐng)域[23]。在林業(yè)上主要用于木材材性相關(guān)性狀的快速檢測。本研究首次利用近紅外光譜技術(shù)在950~1 650 nm 光譜波段范圍建立了濕加松松針組織中16 種黃酮物質(zhì)總含量的快速預(yù)測模型。建模過程中采取了重復(fù)裝樣,取平均光譜的方法來消除因樣本粒度大小、均勻性不一致等因素造成的光譜誤差,同時建模前采用了FD 與SG 相結(jié)合的方法對光譜進行了預(yù)處理,一定程度上減少了光譜誤差,最后以RMSEV 為評價指標(biāo)確定了最佳主成分數(shù)為10。結(jié)果表明,16 種黃酮物質(zhì)總含量預(yù)測模型的Rc和Rv分別為0.852 1和0.705 9,RMSEC 和RMSEV 分 別 為6.361 0 和9.150 9.
外部驗證結(jié)果表明,所建模型的預(yù)測值與實際測定值具有顯著的相關(guān)性,相關(guān)系數(shù)為0.863 7,且絕對誤差介于-2.67~5.87 之間。配對t 檢驗結(jié)果表明兩組數(shù)值之間無顯著差異。綜合表明本研究所建快速預(yù)測模型具有較高的精確度,達到了較為理想的預(yù)測效果,可用于實際未知樣本16 種黃酮物種總含量的預(yù)測。雖然本研究所用材料對于臺山市紅嶺種子園現(xiàn)有種質(zhì)資源來說具有一定代表性,可利用該模型對現(xiàn)有濕加松資源進行大規(guī)模檢測工作,篩選高黃酮含量的濕加松家系或單株。但缺少分布在其它地域用于生產(chǎn)或育種的代表性濕加松材料。此外,本研究對松針的前處理采用的相對便捷的烘干方法,在黃酮化合物的得率上相對于其它干燥方法可能具有一定的差異。因此,后續(xù)的研究可增加一些分布在其它地域的代表性濕加松樣本,及比對采用冷凍干燥或紅外干燥等其它干燥方法,從而對所建模型進一步優(yōu)化,以提高模型質(zhì)量及應(yīng)用范圍。