趙思夢,于宏威,高冠勇,陳 寧,王博妍,王 強*,劉紅芝*
1. 中國農業(yè)科學院農產品加工研究所,農業(yè)部農產品加工綜合性重點實驗室,北京 100193 2. 金勝糧油集團有限公司,山東 莒南 276600 3. 北京農學院,北京 102206
花生是世界上油脂和蛋白的重要來源,其抗營養(yǎng)因子含量少[1],綜合利用價值高。我國2019年花生年產量1737萬噸(農業(yè)農村部統(tǒng)計數據),產量居全球首位?;ㄉ械鞍踪|含量達25%~36%[2],花生蛋白中水溶性蛋白約為10%,鹽溶性蛋白占90%,主要由花生球蛋白、伴花生球蛋白Ⅰ和伴花生球蛋白Ⅱ組成[3],三者的構成和含量影響蛋白質的性能特性。花生球蛋白包含4個亞基,分子量分別為40.5,37.5,35.5和23.5 kDa,其中23.5 kDa亞基含量在18.70%~26.50%,37.5 kDa含量10.50%~17.90%,相對較高[3-4]。王麗[5]等研究表明,亞基組成影響蛋白質功能特性; 劉巖[6]等研究表明花生球蛋白比伴花生球蛋白具有更高的熱穩(wěn)定性、更復雜的空間構象和更差的變性協(xié)同性,伴花生球蛋白具有良好的溶解性和表面疏水性,其乳化活性、氣泡能力和熱凝膠特性皆優(yōu)于花生球蛋白; 楊曉泉[7]等研究表明,亞基的構成、二硫鍵的穩(wěn)定性和親水疏水性等與蛋白的加工性質有密切聯系。
傳統(tǒng)檢測蛋白質組分和亞基含量的方法為聚丙烯酰胺凝膠電泳法(SDS-PAGE),需要對樣品進行脫脂、提取蛋白質進行SDS-PAGE及光密度分析,該法分析速度慢,操作步驟繁多,樣品損耗量大。近紅外光譜分析通過反映分子中含氫元素的化學基團C—H,O—H和N—H分子振動的倍頻和合頻吸收信息[8],可以實現快速無損檢測,已經廣泛應用于花生中水分、脂肪、氨基酸、蛋白質等的檢測。但檢測花生蛋白組分的報道較少,花生蛋白亞基含量的近紅外檢測模型鮮有報道。
對整粒花生樣品作近紅外光譜掃描,將其與化學值擬合,結合偏最小二乘回歸法進行數學模型的構建。通過比較單一和復合光譜預處理方法,對比模型校正集和驗證集相關系數及誤差,確定了花生球蛋白、伴花生球蛋白、23.5 kDa、37.5 kDa亞基含量預測模型的最佳預處理方法,建立了近紅外光譜檢測方法并進行了外部驗證。為育種專家加工專用品種選育和蛋白加工企業(yè)原料選用提供了參考。
采用自然風干花生種子,去除雜質和破損粒,在常溫下放置24 h,使樣品環(huán)境與儀器操作環(huán)境保持一致。選取來自山東、廣東等11個省份的178份花生樣品(來源: 花生產業(yè)技術體系)進行分析。先后采集近紅外反射光譜和測定蛋白質組分及亞基含量。
采用基于MicroNIR光譜儀開發(fā)的便攜式花生品質速測儀(型號: peanut 1.0; 廠家: VIAVI Solutions Inc.,USA),該裝置為一種高通量花生無損檢測裝置(圖1),組成部件包括: 箱體、箱蓋、顯示器和光譜儀。近紅外光譜儀采用漫反射光譜,光譜范圍為900~1 700 nm,光源采取10 W的鹵素燈,性能參數見表1。
便攜式花生品質速測儀開機后常溫下預熱30 min,將花生樣品裝入樣品杯中,輕搖晃保證花生種子均勻分布,每個樣品掃描5次,每掃描一次將樣品杯旋轉一定的角度,重復裝樣掃描三次取平均值。
圖1 本試驗中使用的便攜式花生品質速測儀和檢測配件Fig.1 Portable peanut quality spectrometer and test accessories used in the experiment
表1 速測儀性能參數Table 1 Spectrometer performance specifications
1.3.1 花生球蛋白與伴花生球蛋白的制備
首先將花生脫殼,進行晾曬,置于清水中浸泡脫去紅衣,再用烘箱烘干至水分含量7%左右。采用正己烷對粉碎機粉碎過后的樣品粉末進行脫脂,常溫提取5次,使其脂肪含量少于1%。脫脂后在通風櫥風干粉碎,得到的脫脂花生粉4 ℃冷藏備用[9]。
花生球蛋白和伴球蛋白的制備采用Chiou[10]等報道的提取方法,脫脂后花生粉加硫酸銨至飽和,離心后復溶沉淀,透析后冷凍干燥得到花生球蛋白和伴花生球蛋白。
1.3.2 SDS-PAGE電泳及亞基含量分析
根據Laemmli[11]報道的方法進行電泳。電泳結束后,將凝膠在染色液中染色1 h,置于搖床上脫色采集圖像。凝膠染色液采用考馬斯亮藍溶液,脫色采用高甲醇的醋酸溶液[12]。23.5和37.5 kDa蛋白質亞基相對含量采用光密度分析軟件計算。
模型的構建分析采用The Unscrambler X 10.3軟件(CAMO公司,挪威)。
1.4.1 光譜的預處理
由于近紅外光譜的測量容易受到試驗環(huán)境、儀器設備、光散射效應等因素的影響,因此需要對原始的光譜進行不同的預處理消除噪聲,來提高模型的分析準確性。
常用的光譜預處理方法主要有平滑(Normalization)、基準化(Baseline)、標準正態(tài)變量變換(SNV)、去趨勢(Detrend)、多元散射校正(MSC)、一階導數(1stDerivative,1st-der)和二階導數(2ndDerivative,2nd-der)等[13],選取以上七種單一預處理方法中較優(yōu)的兩種按不同順序組合進行復合光譜預處理,最終選出最佳光譜預處理方法。
1.4.2 模型建立與評價
對預處理后的光譜和化學值進行偏最小二乘回歸法分析(partial least squares regression,PLSR)[14]。PLSR是一種經典的線性建模方法,它將光譜數據壓縮成為潛在變量的正交結構,描述光譜信息與參考含量值之間的最大協(xié)方差。與傳統(tǒng)的多元線性回歸相比,具有綜合篩選光譜數據、充分提取樣品光譜的有效信息、考慮內在聯系等優(yōu)點,所構建的模型能更加準確的識別信息[12]。
為使數據擬合反復進行內部交叉驗證剔除異常值,采用外部驗證評價模型的穩(wěn)健性。通過比較模型的決定系數(R)、標準差(SEC)和測試集標準差(SEP)來篩選最佳模型,相關系數高且標準差低的模型穩(wěn)健性好。
178份花生樣品經主成分分析(PCA)剔除異常值后剩余169份,其原始光譜如圖2所示?;ㄉ鷺藴蕵悠芳慕t外圖譜趨勢大致相同,但不同樣品的吸收峰強度不同,表現出不同的反射率,說明各樣品成分含量不同。結果表示本試驗的花生近紅外光譜數據符合建立近紅外定量分析模型的要求。
圖2 樣品集的近紅外光譜Fig.2 Near-infrared spectra of the sample set
建模所用的169種花生樣品的蛋白組分和亞基含量的化學值如表2所示,收集的花生樣品涵蓋較廣。樣品的花生球蛋白總量變幅為44.30%~71.99%,伴花生球蛋白變幅為28.01%~55.70%,花生球蛋白中 23.5 kDa亞基變化范圍為5.07%~28.42%,37.5 kDa花生蛋白質亞基變化范圍為7.50%~21.60%。
將樣品按照3∶1的比例分為校正集和驗證集,用于建模的樣品127個,驗證集43個。數據分析表明預測集化學值含量位于校正集范圍內,可用外部驗證進行模型的校正。
表2 花生樣品蛋白組分和亞基含量化學值Table 2 Chemical values of protein componentsand subunits in peanut samples
2.3.1 光譜預處理方法的確定
為了從光譜中提取與化學組成相關的信息,消除干擾因素,采用合適的光譜預處理方法建立穩(wěn)定可靠的模型至關重要,研究了多種光譜預處理方法提高信噪比的效果,包括單一和組合預處理方法,對相關系數和標準差進行對比確定最佳預處理方法(表3和表4),花生球蛋白模型的最佳預處理方法為2nd-der with Detrend,伴花生球蛋白模型的最佳預處理方法為Detrend with 1st-der,23.5 kDa模型的最佳預處理方法為Normalization with 2nd-der,37.5 kDa模型的最佳預處理方法為Detrend with Baseline。
表3 不同光譜預處理對蛋白組分模型的影響Table 3 Results of Arachin model with different spectral pretreatment methods
表4 不同光譜預處理對亞基模型的影響Table 4 Results of 23.5 kDa model with different spectral pretreatment methods
2.3.2 模型的構建及驗證
采用2.3.1節(jié)中篩選出的最佳預處理方法對花生球蛋白、伴花生球蛋白、23.5 kDa和37.5 kDa亞基含量進行模型構建,分為校正模型和內部驗證模型。
為驗證蛋白組分和亞基模型的精確性,經43個樣品對所建模型進行外部驗證,結果見表5?;ㄉ虻鞍啄P托U嚓P系數為0.92,誤差為1.41%[圖3(a)]; 伴花生球蛋白含量模型的校正集相關系數為0.85,誤差為1.46%[圖4(a)]; 23.5 kDa亞基含量校正集相關系數為0.91,誤差為0.53%[圖5(a)]; 37.5 kDa亞基含量校正集相關系數為0.91,誤差為0.89 %[圖6(a)]。經外部驗證,花生球蛋白的預測值與化學值的相關系數達0.82[圖3(b)],伴花生球蛋白預測值與化學值的相關系數達到0.94[圖4(b)],23.5 kDa亞基預測含量與化學值相關系數達到0.89[圖5(b)],37.5 kDa亞基預測含量與化學值相關系數達到0.97[圖6(b)]。
表5 模型構建與驗證Table 5 Model construction and validation
目前NIR技術應用于檢測花生蛋白組分的報道較少,王麗分析141個樣品,建立花生球蛋白模型的校正集相關系數為0.80; 伴花生球蛋白模型校正集相關系數為0.78; 本研究中花生球蛋白相關系數0.92和伴花生球蛋白相關系數0.85均優(yōu)于已報道模型。尚未見關于花生蛋白23.5 kDa和37.5 kDa亞基含量的近紅外模型。
圖3 花生球蛋白校正模型(a)和預測模型(b)Fig.3 Results of calibration (a) and prediction (b)of arachin model
圖4 伴花生球蛋白校正模型(a)和預測模型(b)Fig.4 Results of calibration (a) and prediction (b)of conarachin model
圖5 23.5 kDa校正模型(a)和預測模型(b)Fig.5 Results of calibration (a) and prediction (b)of 23.5 kDa model
圖6 37.5 kDa校正模型(a)和預測模型(b)Fig.6 Results of calibration (a) and prediction (b)of 37.5 kDa model
建立了運用便攜式花生品質速測和近紅外光譜技術對花生中蛋白質組分和亞基含量進行快速無損檢測的方法。通過采集的178份數據,對花生蛋白質組分和含量進行建模分析,得出花生球蛋白含量最佳模型預處理方法為2nd-der with Detrend,模型校正集相關系數為0.92,外部驗證SEP為1.07; 伴花生球蛋白含量模型最佳預處理方法為Detrendwith 1st-der,模型校正集相關系數為0.85,外部驗證SEP為0.73; 23.5 kDa含量最佳預處理方法為Normalization with 2nd-der,模型校正集相關系數為0.91,外部驗證SEP為0.47; 37.5 kDa含量最佳預處理方法為Detrend with Baseline,模型校正集相關系數為0.91,外部驗證SEP為0.75。與目前報道比較,本方法能較準確的預測花生蛋白質組分和亞基含量。
實現了對整粒花生進行花生球蛋白、伴花生球蛋白、23.7 kDa和37.5 kDa亞基含量的同步、快速、無損檢測,為育種專家加工專用品種選育和蛋白加工企業(yè)原料選擇提供了依據。