朱麗偉,嚴(yán)金欣,黃 娟,石桃雄,蔡 芳,李洪有,陳慶富,陳其皎
貴州師范大學(xué)蕎麥產(chǎn)業(yè)技術(shù)研究中心,貴州 貴陽 550001
蕎麥屬于蓼科蕎麥屬的一年生草本雙子葉植物,因生育期短、抗逆性強(qiáng),在農(nóng)業(yè)生產(chǎn)中經(jīng)常用來補(bǔ)種。金蕎麥?zhǔn)且环N傳統(tǒng)中藥材,研究發(fā)現(xiàn)金蕎麥根莖活性成分通過抑制腫瘤細(xì)胞增殖和遷移,誘導(dǎo)腫瘤細(xì)胞凋亡和自噬等作用而抑瘤,同時還有清熱解毒、消炎抗菌等功效[1-2]。金苦蕎是金蕎麥與苦蕎雜交而培育的新型蕎麥,特征介于雙親之間,再生力強(qiáng)[3],春季主要進(jìn)行營養(yǎng)生長,生產(chǎn)大量苦蕎葉。研究發(fā)現(xiàn)蕎麥葉發(fā)酵茶可提高小鼠免疫功能,還具有防治急、慢性炎癥的功能[4-7]。蕎麥籽粒中還含有豐富的蛋白質(zhì),其蛋白質(zhì)中必需氨基酸含量充足,富含谷類作物中比較缺乏的賴氨酸,使其具有較高的營養(yǎng)價值。本實驗室前期的研究發(fā)現(xiàn),蕎麥葉中各營養(yǎng)成分比籽粒中含量更高[3],因此金苦蕎葉片有極大研究開發(fā)價值。
目前常用的氨基酸測定方法預(yù)處理復(fù)雜、耗時長、價格昂貴。陶琳麗等研究發(fā)現(xiàn),20種氨基酸在1 000~2 502 nm區(qū)域有非常明顯的近紅外光譜吸收且差異顯著[8],這為利用近紅外技術(shù)建立檢測模型提供了可能性。Chang等[9]利用傅里葉變換-近紅外分析技術(shù)建立了可快速測定菊花谷氨酸、天門冬酰胺和天冬氨酸的模型。通常采用偏最小二乘法(partial least squares,PLS)、主成分回歸(principal component regression,PCR)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)等化學(xué)計量學(xué)算法建立識別模型,我們前期應(yīng)用線性相關(guān)系統(tǒng)的PCR法和PLS法嘗試建立模型,所建立的模型維度太高,限制其應(yīng)用。Viyona等[10]利用近紅外光譜技術(shù)檢測百香果中脂肪的方法,預(yù)處理光譜后,建立的前反饋(back propagation,BP)人工神經(jīng)網(wǎng)絡(luò)模型平均方差高達(dá)0.959。因此本工作選用BP人工神經(jīng)網(wǎng)絡(luò)算法建立金苦蕎氨基酸的近紅外光譜預(yù)測模型,從內(nèi)部交叉驗證平均相對誤差(RSD)和相關(guān)系數(shù)(R2)等評價指標(biāo)來看,多數(shù)氨基酸預(yù)測模型取得了令人滿意的效果。
樣品蕎麥自交系葉片粉碎樣采自貴州省貴陽市烏當(dāng)區(qū)貴州師范大學(xué)蕎麥中心實驗基地,為得到化學(xué)值差異較大的樣品,種植了85份遺傳性狀已穩(wěn)定的金苦蕎自交系,常規(guī)栽培管理,選擇生長較為一致的植株,在其開花前采收上三葉、中三葉和下三葉,共255份樣品,將其分別放于紙袋中,先于鼓風(fēng)機(jī)105 ℃殺青,然后80 ℃烘24 h,然后使用高速粉碎機(jī)粉碎并過100目篩,備用。
1.2.1 光譜采集與預(yù)處理
采用德國布魯克光譜儀器公司生產(chǎn)的MPA傅里葉變換近紅外光譜儀,OPUS光譜采集軟件。采用漫反射的方法,掃描樣品的近紅外光譜,單次掃描64次,分辨率4 cm-1,掃描范圍4 000~12 000 cm-1,每個樣品均掃描多次,取平均光譜進(jìn)行計算。原始譜數(shù)據(jù)中不僅包含與樣品有關(guān)的信息,還包含各種干擾和無效信息,影響所建模型的可靠性。為降低儀器噪聲和系統(tǒng)誤差以提升光譜中的有效信息率,在建模前對原始光譜進(jìn)行了數(shù)據(jù)預(yù)處理。本實驗利用光譜分析軟件OPUS執(zhí)行自動優(yōu)化程序,確定各組分建模的譜區(qū)范圍和最佳預(yù)處理方法。
1.2.2 氨基酸的測定
參考程勇杰等的方法測定氨基酸的含量[11],略有改進(jìn)。具體方法如下:稱取0.100 0 g葉片粉末放于干凈的水解管,加入6 mol·L-1鹽酸15 mL,使用氮吹的方法清除管內(nèi)氧氣后封口。然后將水解管放于烘箱中,調(diào)整溫度慢慢升至110 ℃后開始計時,水解24 h關(guān)機(jī)。取出冷卻后的水解管,將水解液輕輕轉(zhuǎn)移至50 mL容量瓶,去離子水沖洗水解管,沖洗液也倒入容量瓶,定容后混勻,然后吸取濾液1 mL,使用旋轉(zhuǎn)蒸發(fā)儀慢慢蒸干,再用1 mL pH 2.2檸檬酸鈉緩沖液溶解,濾膜過濾后上機(jī),所用儀器為日立L-8900氨基酸自動分析儀。
1.2.3 數(shù)據(jù)處理
采用Matlab_R2014b分析軟件,在iMac Pro(2017)計算機(jī)上進(jìn)行模型的建設(shè)。為了驗證模型的性能,使用了交叉驗證(cross-validation)的方法,根據(jù)模型的R2和RSD,選擇最佳模型。當(dāng)RSD小于10%時表明模型效果良好,預(yù)測精度較高,建立的模型可用。
實驗發(fā)現(xiàn)樣品中氨基酸的含量差異較大(表1),其中差異最明顯的是必需氨基酸中的甲硫氨酸,所測樣品的含量最低值為0.308 mg·g-1,最高值達(dá)3.049 mg·g-1,后者是前者的9.9倍;其次是非必需氨基酸中的酪氨酸,所測樣品中含量最低為0.176 mg·g-1,最高達(dá)1.173 mg·g-1,后者是前者的6.7倍。說明所用建模樣品間化學(xué)值差異明顯的可滿足建模需要。賴氨酸被稱為谷物第一限制性氨基酸,高立成等(2019)研究發(fā)現(xiàn),普通苦蕎西農(nóng)9904和黔苦3號籽粒的賴氨酸含量分別為3.4和4.5 mg·g-1,萌發(fā)期其籽粒賴氨酸含量分別升至3.8和5.2 mg·g-1,Bhinder等研究不同品種苦蕎粉中氨基酸的含量,發(fā)現(xiàn)苦蕎粉中賴氨酸含量的最高值為6.55 mg·g-1,其他必需氨基酸如纈氨酸、異亮氨酸、蘇氨酸和亮氨酸的含量最高值分別是3.5,2.55,8.79和12.4 mg·g-1,均遠(yuǎn)低于本實驗中金苦蕎葉片賴氨酸的含量[12-13],證明金苦蕎葉片具有極高的營養(yǎng)價值和開發(fā)潛力。
表1 金苦蕎葉片氨基酸含量化學(xué)測定結(jié)果Table 1 Contents of amino acid in golden tartary buckwheat leaves using chemical method
隱層節(jié)點(diǎn)數(shù)的選擇與研究項目的要求、輸入-輸出節(jié)點(diǎn)的多少存在著直接的關(guān)系,其數(shù)目太少會使網(wǎng)絡(luò)不能收斂,造成網(wǎng)絡(luò)不能正確預(yù)測未知樣本,容錯性差,但太多又易造成網(wǎng)絡(luò)學(xué)習(xí)時間過長及過擬合現(xiàn)象的出現(xiàn)。一般隱層節(jié)點(diǎn)數(shù)是遠(yuǎn)小于訓(xùn)練樣本數(shù)的。通過調(diào)整輸入層、隱層的節(jié)點(diǎn)數(shù)可以優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。經(jīng)過多次預(yù)測模型的建立,得到了相關(guān)系數(shù)較高的結(jié)果,其網(wǎng)絡(luò)結(jié)構(gòu)為(1102-9-1)。
為了提高建模效率,需要預(yù)處理光譜數(shù)據(jù),常用的方法有一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、矢量歸一等。按照4∶1的比例將化學(xué)值和光譜值隨機(jī)生成訓(xùn)練集和測試集后,在處理的過程中發(fā)現(xiàn)光譜值以及化學(xué)值的特征值未在[0,1]的范圍內(nèi),遂對其進(jìn)行數(shù)據(jù)歸一化處理。接著創(chuàng)建9個隱含層神經(jīng)元的神經(jīng)網(wǎng)絡(luò),并設(shè)置迭代次數(shù)為1 000、MSE均方根誤差范圍為[0,1×10-3]即[0,0.001]以及學(xué)習(xí)率為0.01。開始訓(xùn)練網(wǎng)絡(luò)。訓(xùn)練完成后進(jìn)行仿真測試和數(shù)據(jù)的反歸一化,進(jìn)而進(jìn)行性能評價,測試相對誤差以及決定系數(shù)。
采用人工神經(jīng)網(wǎng)絡(luò)建模的方法對17種氨基酸進(jìn)行了數(shù)學(xué)建模后,可直觀的看出運(yùn)用近紅外光譜模型對未知樣品的預(yù)測效果,預(yù)測化學(xué)值與真實值的相關(guān)性及其精確度的提升空間?,F(xiàn)對建立的17種氨基酸數(shù)學(xué)模型進(jìn)行分析。
2.4.1 必需氨基酸的建模效果
從圖1和表2可知,7種必需氨基酸的近紅外模型預(yù)測值與真實值的R2均在0.90以上,其中苯丙氨酸、亮氨酸、蘇氨酸、纈氨酸、異亮氨酸和賴氨酸近紅外模型測試過程,其預(yù)測值與真實值的RSD均低于10%,模型可用。
甲硫氨酸近紅外模型的預(yù)測效果如圖1(b)和表2所示,從測試結(jié)果可知,供試樣品的真實值和預(yù)測值的R2雖然較高,達(dá)到0.914 9,然而參與測試的10組數(shù)據(jù)RSD達(dá)到25.98%,誤差太大,模型不可用。
圖1 必需氨基酸的近紅外模型仿真測試效果(a):苯丙氨酸;(b):甲硫氨酸;(c):亮氨酸;(d):蘇氨酸;(e):纈氨酸;(f):異亮氨酸;(g):賴氨酸Fig.1 Simulation results of near-infrared model of essential amino acids(a):Phenylalanine;(b):Methionine;(c):Leucine;(d):Threonine;(e):Valine;(f):Isoleucine;(g):Lysine
2.4.2 非必需氨基酸的建模效果
從表2和圖2可知,天冬氨酸和精氨酸的建模效果最好,其模型真實值與預(yù)測值的R2均大于0.97,天冬氨酸模型仿真測試的10組數(shù)據(jù),其RSD值為6.67%[圖2(c)];參與精氨酸模型測試的10組數(shù)據(jù),其RSD為4.22%[圖2(e)],兩種模型均較優(yōu)秀。
從表2和圖2還可知,絲氨酸、丙氨酸、組氨酸、甘氨酸和酪氨酸模型的預(yù)測值與真實值R2均較高,達(dá)到0.90以上,且仿真測試過程,5種氨基酸模型的RSD均低于10%,模型較好。脯氨酸模型的仿真測試中,應(yīng)試樣品真實值與預(yù)測值的R2為0.899 1,稍低于其他氨基酸模型,10組供試數(shù)據(jù)的RSD為7.86%,模型也可用。
半胱氨酸近紅外模型的預(yù)測效果如表2和圖2(b)所示,可知應(yīng)試樣品的預(yù)測值與真實值差異較大,二者的R2只有0.788 0,且10組數(shù)據(jù)的RSD為33.23%,該模型預(yù)測結(jié)果不理想,有待進(jìn)一步研究,可設(shè)計更加精細(xì)的實驗,使用代表性更強(qiáng)的樣品,獲得更加精準(zhǔn)的化學(xué)值和光譜值數(shù)值,另外,采用更加合適的算法與光譜預(yù)處理方法,以達(dá)到更好的建模效果。
圖2 非必需氨基酸的近紅外模型仿真測試效果(a):谷氨酸;(b):半胱氨酸;(c):天冬氨酸;(d):絲氨酸;(e):精氨酸;(f):丙氨酸;(g):組氨酸;(h):甘氨酸;(i):脯氨酸;(j):酪氨酸Fig.2 Near infrared simulation of non-essential amino acids(a):Glutamic acid;(b):Cysteine;(c):Aspartic acid;(d):Serine;(e):Arginine;(f):Alanine;(g):Histidine;(h):Glycine;(i):Proline;(j):Tyrosine
表2 氨基酸近紅外模型仿真測試效果Table 2 Simulation results of near-infrared model of amino acids
通過對苦蕎葉氨基酸含量的測定,可知葉中的氨基酸,特別是必需氨基酸的含量遠(yuǎn)高于蕎麥籽粒,使其具有極高的營養(yǎng)價值。常規(guī)氨基酸測定方法限制了高氨基酸苦蕎的育種與開發(fā)工作。本文建立的17種氨基酸的非線性預(yù)測模型中,精氨酸和天冬氨酸建模效果較好,預(yù)測值與真實值R2均高于0.97,其RSD均低于7%;另外丙氨酸、苯丙氨酸、甘氨酸、谷氨酸、精氨酸、賴氨酸、酪氨酸、亮氨酸、絲氨酸、蘇氨酸、纈氨酸、脯氨酸、異亮氨酸和組氨酸的模型預(yù)測值與真實值的R2均大于0.85,RSD均低于10%,可用于氨基酸的預(yù)測工作;而甲硫氨酸和半胱氨酸的近紅外模型,RSD均大于10%,模型不可用,這兩種氨基酸的近紅外光譜非線性預(yù)測模型還需要進(jìn)一步研究。