董 歡,吳龍國(guó),賀曉光,王松磊
(寧夏大學(xué)農(nóng)學(xué)院,寧夏銀川 750021)
超氧化物歧化酶(Superoxide dismutase,SOD)又稱肝蛋白,含有金屬銅離子,是存在于生命體中的一種活性球蛋白物質(zhì)。SOD可以消除生物體在新陳代謝過程中產(chǎn)生的有害物質(zhì),免受氧自由基的毒害作用,是生物細(xì)胞保護(hù)體系的一員[1-3]。生物體內(nèi)SOD酶活力的大小能說明其健康程度,因此可以將酶活力作為肉類品質(zhì)檢測(cè)和質(zhì)量評(píng)價(jià)的參考指標(biāo)。一般實(shí)驗(yàn)室進(jìn)行樣本的理化檢測(cè)時(shí),前處理及實(shí)驗(yàn)方法繁瑣,檢測(cè)時(shí)間長(zhǎng),試劑消耗量大,不能滿足批量肉類生產(chǎn)過程中在線快速檢測(cè)的要求。
顯微高光譜成像技術(shù)是將顯微成像與近紅外光譜的官能團(tuán)化學(xué)分析相結(jié)合的一種新型技術(shù),通過顯微成像系統(tǒng)與高光譜系統(tǒng)有機(jī)組合,實(shí)現(xiàn)微觀組織空間分布的可視化及定量分析,從而分析物質(zhì)內(nèi)部結(jié)構(gòu)組分的變化。該技術(shù)是一種快速無損檢測(cè)新技術(shù),可以對(duì)樣本進(jìn)行批量、快速、準(zhǔn)確的測(cè)量;無需化學(xué)試劑和復(fù)雜的樣品前處理,可直接對(duì)鮮活組織細(xì)胞進(jìn)行掃描,大幅降低分析成本和檢測(cè)時(shí)間,直接提取酶相關(guān)的特征波段,為肉類SOD酶活力在線快速無損檢測(cè)技術(shù)的創(chuàng)新提供新途徑。
近幾年,國(guó)內(nèi)外學(xué)者對(duì)植物SOD酶活力及顯微成像技術(shù)分別進(jìn)行了大量的研究,但用顯微高光譜技術(shù)對(duì)肉類樣本中SOD酶活力的研究鮮有報(bào)道。劉婷婷等[4-5]分別對(duì)冬小麥和油菜葉片中SOD酶活力進(jìn)行高光譜檢測(cè),相關(guān)性均能達(dá)到0.8以上,說明基于高光譜模型的SOD生理活性的檢測(cè)是可行的。馬天蘭等[6-7]提取顯微高光譜圖像信息,分別采用菌落總數(shù)、揮發(fā)性鹽基氮對(duì)羊肉和豬肉新鮮度進(jìn)行表征,其判別率均達(dá)到90%以上。石冬冬等[8]應(yīng)用近紅外顯微成像技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法,對(duì)蛋鴨飼料中的蘇丹紅進(jìn)行檢測(cè),判斷飼料中是否非法添加蘇丹紅,準(zhǔn)確率達(dá)89.2%。Matthew等[9]使用顯微高光譜成像系統(tǒng)對(duì)雞肉沙門氏菌進(jìn)行檢測(cè)研究,實(shí)驗(yàn)用100倍物鏡收集并提取450~800 nm之間的細(xì)胞光譜特征,得出細(xì)胞分類準(zhǔn)確度81.8%~98.5%。Luisa等[10]用拉曼顯微光譜研究玻璃化溫度對(duì)體外成熟綿羊卵細(xì)胞皮質(zhì)肌動(dòng)蛋白誘導(dǎo)的變化,結(jié)論證明拉曼顯微鏡可作為研究玻璃化卵細(xì)胞變化的替代分析工具。Santos等[11]采用紅外顯微成像技術(shù)對(duì)牛奶中摻假物質(zhì)進(jìn)行定量檢測(cè)分析,估計(jì)牛奶摻假水平并定位其位置和濃度;Philippe等[12]使用紅外顯微光譜對(duì)小麥胚乳發(fā)育過程中細(xì)胞壁多糖的沉積進(jìn)行分析檢測(cè),并通過評(píng)估二階導(dǎo)數(shù)來進(jìn)行光譜數(shù)據(jù)分析。Baranska等[13]使用顯微拉曼成像技術(shù)檢測(cè)類胡蘿卜素含量,并定位其在細(xì)胞內(nèi)的分布。
本研究以灘羊肉肌細(xì)胞中的SOD酶活力為研究對(duì)象,結(jié)合顯微高光譜成像技術(shù)采集樣品380~980 nm的顯微光譜圖像。首先使用蒙特卡洛方法進(jìn)行異常樣本的剔除,并使用共生距離法、隨機(jī)法和Kennard-Stone法進(jìn)行校正集和預(yù)測(cè)集的劃分;然后對(duì)原始光譜進(jìn)行預(yù)處理,優(yōu)選最佳預(yù)處理方法;使用間隔隨機(jī)蛙跳算法、遺傳偏最小二乘算法、反向區(qū)間偏最小二乘法等六種方法進(jìn)行特征波長(zhǎng)提取;最后對(duì)比分析不同特征波長(zhǎng)下的偏最小二乘回歸、主成分回歸以及多元線性回歸模型,優(yōu)選最佳預(yù)測(cè)模型,為今后顯微高光譜成像技術(shù)在肉品微量成分檢測(cè)方面提供理論和技術(shù)參考。
灘羊 寧夏鹽池縣鑫海食品有限公司;A045-2蛋白定量測(cè)試盒(考馬斯亮藍(lán)法) 南京建成生物工程研究所;A001-1-1總超氧化物歧化酶測(cè)試盒(羥胺法) 南京建成生物工程研究所;生理鹽水 湖南科倫制藥有限公司;冰乙酸 分析純,北京鵬彩化學(xué)試劑有限公司。
Micro-Hyper Spec VNIR顯微高光譜成像系統(tǒng)(380~980 nm,分辨率3.5 nm,176個(gè)波段) 北京卓立漢光儀器有限公司;KD-2508冷凍切片機(jī) 浙江金華市科迪儀器設(shè)備有限公司;FA25 FLUKO間歇式高剪切組織勻漿機(jī) 上海弗魯克科技發(fā)展有限公司;Neofuge15R臺(tái)式高速冷凍離心機(jī) 上海力申科學(xué)儀器有限公司;753N紫外可見分光光度計(jì) 上海儀電分析儀器有限公司;HH-4電熱恒溫水浴鍋 上海比朗儀器有限公司;SQP電子天平 賽多利斯科學(xué)儀器(北京)有限公司。
1.2.1 肌細(xì)胞顯微樣本制備 樣本選取新鮮屠宰1 h內(nèi)的30只健康灘羊的背部(外脊)、前腿和后腿三個(gè)部位,裝入密封袋中,置于低溫采樣箱中運(yùn)輸至實(shí)驗(yàn)室進(jìn)行4 ℃保存。實(shí)驗(yàn)前,將樣本放至室溫,除去脂肪和肌膜,修整切塊(20 mm×10 mm×10 mm),獲得223個(gè)樣本。將樣本放置冷凍切片機(jī)的冷凍平臺(tái)上,冷臺(tái)溫度設(shè)置-40 ℃,刀片溫度設(shè)置-30 ℃,切片厚度15 μm,制備顯微光譜樣本,標(biāo)號(hào)以備光譜采集使用。
1.2.2 顯微高光譜圖像采集 采用Gaia Field-Pro-V10顯微高光譜成像系統(tǒng)及SpecView2.9. 2.10數(shù)據(jù)采集軟件,采集光譜圖像前需要進(jìn)行黑白校正[14-18]及掃描參數(shù)的設(shè)定。經(jīng)過多次預(yù)實(shí)驗(yàn)調(diào)整,最終確定最佳掃描參數(shù):掃描前進(jìn)速度0.1 cm/s,回退速度}起點(diǎn)位置0.6 cm,掃描距離0.5 cm,曝光時(shí)間1.9 ms,增益1,黑白校正如公式(1)所示。
式(1)
式中:R:黑白校正后光譜圖像強(qiáng)度;R0:原始光譜圖像強(qiáng)度;D:黑校正圖像強(qiáng)度;W:白校正圖像強(qiáng)度。
1.2.3 超氧化物歧化酶活力的測(cè)定 稱取1.0000 g樣本,按樣本:生理鹽水1∶9 (g/mL)進(jìn)行冰水浴,使用機(jī)械10000~15000 r/min上下研磨勻漿,勻漿后2500 r/min冷凍離心12 min,取上清液用生理鹽水按體積比1∶9的比例稀釋成1%組織上清液,待測(cè)。
使用蛋白定量測(cè)試盒對(duì)1%濃度的組織上清液中蛋白濃度進(jìn)行測(cè)定,使用紫外分光光度儀在595 nm處讀取吸光度值,根據(jù)公式(2)計(jì)算待測(cè)樣本蛋白濃度;使用總超氧化物歧化酶測(cè)試盒對(duì)1%濃度的肉組織上清液中的SOD酶活力進(jìn)行測(cè)定,使用紫外分光光度儀在550 nm處讀取吸光度值,根據(jù)公式(3)計(jì)算待測(cè)樣本SOD酶活力。
式(2)
式中,標(biāo)準(zhǔn)品濃度為0.563 g/L。
式(3)
1.3.1 樣本異常值剔除 實(shí)驗(yàn)過程中,由于樣本、儀器以及人為等因素的影響,導(dǎo)致少量樣本的光譜信息和理化值存在差異,這些樣本被看作是異常樣本。使用蒙特卡洛采樣法計(jì)算223個(gè)樣本的均值與標(biāo)準(zhǔn)差的大小,分別取樣本均值和標(biāo)準(zhǔn)差值各自平均值的2.5倍作為閾值,將均值或標(biāo)準(zhǔn)差閾值以外的樣本判定為異常值[19]。
1.3.2 樣本集劃分 采用Kennard-Stone(KS)法、Sample Set Partitioning Based on Joint x-y Distance(SPXY)法以及Random sampling(RS)法按3∶1比例對(duì)剔除異常值后樣本進(jìn)行劃分,并建立偏最小二乘回歸模型比較分析。
1.3.3 預(yù)處理方法選擇 由于圖像采集時(shí)儀器噪音和暗電流等因素的影響,以及提取的光譜信息中其他無用信息的干擾,因此需要對(duì)原始光譜進(jìn)行預(yù)處理,以此增強(qiáng)光譜信號(hào),提取有用信息[20-22]。本文使用卷積平滑(Savitzky-Golay,SG)、歸一化法(Normalize)、基線校準(zhǔn)(Baseline)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、去趨勢(shì)化(Detrend)、多元散射校正(MSC)6種方法進(jìn)行預(yù)處理,并建立偏最小二乘回歸模型進(jìn)行分析比較。
1.3.4 特征波長(zhǎng)提取 為了后期建模過程的快速、方便進(jìn)行,減少波段個(gè)數(shù),降低光譜維數(shù),減小數(shù)據(jù)冗余,有利于實(shí)現(xiàn)快速檢測(cè)[23-25]。利用MATLAB軟件,使用間隔隨機(jī)蛙跳算法(Interval Random Frog,IRF)、遺傳偏最小二乘算法(Genetic Algorithms PLS,GA)、反向區(qū)間偏最小二乘法(Backw ard interval PLS,BiPLS)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)法(Competitive Adaptive Reweighted Sampling,CARS)對(duì)剔除異常值后使用MSC預(yù)處理的樣本進(jìn)行特征光譜的提取。數(shù)據(jù)選擇時(shí),根據(jù)所選波段的交互驗(yàn)證均方根誤差(RMSECV)最小決定特征波長(zhǎng),RMSECV越小說明模型穩(wěn)定性越好,預(yù)測(cè)結(jié)果的能力越強(qiáng)。
1.3.5 預(yù)測(cè)模型的建立 使用The Unscrambler X 10.4分析軟件對(duì)提取特征波長(zhǎng)后的光譜反射率進(jìn)行建模。分別建立基于肌細(xì)胞中SOD酶活力定量分析的偏最小二乘回歸(Partial Least Squares Regression,PLSR)、主成分回歸(Principal component regression,PCR)、多元線性回歸(Multiple Linear Regression,MLR)預(yù)測(cè)模型。
采用ENVI4.8軟件進(jìn)行顯微圖像感興趣區(qū)域(Region of Interest,ROI)的提取,每個(gè)樣本圖像選取10個(gè)ROI進(jìn)行提取,計(jì)算其平均反射光譜,將其作為該樣本的反射光譜。實(shí)驗(yàn)提取的肌細(xì)胞原始顯微高光譜圖如圖1所示。
圖1 顯微樣本原始光譜曲線Fig.1 The original spectral curves of the microscopic sample
結(jié)果如圖2所示。模型中的46、164、165、120、73、43、190、30、44、215、176號(hào)11個(gè)樣本明顯位于臨界線之外。剔除上述異常值前后建立的偏最小二乘回歸模型效果見表1。由表1可以看出,所得模型的交互驗(yàn)證均方根誤差及校正模型的均方根誤差(RMSEC)均小于原始樣本模型,同時(shí)模型的校正集相關(guān)系數(shù)Rc為0.8115大于原始樣本模型,說明剔除這些樣本后,模型相關(guān)性變大,穩(wěn)定性增強(qiáng)。因此剔除11個(gè)異常樣本,剩余212個(gè)后續(xù)處理。
表1 異常樣本剔除前后SOD酶活力的PLSR模型Table 1 PLSR model of SOD enzyme activity before and after abnormal sample rejection
圖2 肌細(xì)胞中SOD含量樣本分布圖Fig.2 Distribution of SOD content in muscle cells
由表2可以得出,在三種劃分方法中,僅RS法的預(yù)測(cè)集相關(guān)系數(shù)Rp大于0.8,高于其它兩種方法。除此之外,還可以利用Rc與Rp之和來說明模型總體精確度[26-27],數(shù)值之和越大說明精確度越高。RS法之和為1.6262,KS法為1.6035,SPXY法為1.6082,并且RS法建立的模型中,RMSE值均較小。綜合分析各個(gè)參數(shù),最終選擇RS法劃分灘羊肉中SOD酶活力樣本集。
表2 不同樣本劃分方法對(duì)SOD酶活力的PLSR模型結(jié)果統(tǒng)計(jì)Table 2 Results of different sample partition methods on PLSR model of SOD activity
由表3數(shù)據(jù)可以得出,使用RS法對(duì)樣本中SOD酶活力值進(jìn)行劃分也是可行的。不同部位樣本中SOD酶活力分布范圍廣,并且預(yù)測(cè)集的酶活力值包含在校正集的酶活力值范圍之內(nèi)。校正集和預(yù)測(cè)集的標(biāo)準(zhǔn)偏差也比較理想,由此可以說明所選的樣本數(shù)據(jù)集的劃分具有代表性,是有實(shí)驗(yàn)意義的。同時(shí)樣本數(shù)據(jù)量較大,也滿足了建模的要求,可以對(duì)此數(shù)據(jù)進(jìn)行建模分析。
表3 樣本SOD酶活力統(tǒng)計(jì)表Table 3 Statistics on SOD activity
從表4得出,使用MSC預(yù)處理后建立的PLSR模型具有較好的模型參數(shù),和剔除異常值后的原始數(shù)據(jù)相比,Rc和Rp值均有所提高,RMSEC和RMSEP均減小。綜合各項(xiàng)參數(shù),最終選定MSC為處理樣本的預(yù)處理方法。圖3為經(jīng)過MSC預(yù)處理后的樣本光譜圖像。
表4 不同預(yù)處理方法對(duì)SOD酶活力的PLSR模型結(jié)果統(tǒng)計(jì)Table 4 Results of the PLSR model of different pretreatment methods for SOD activity
圖3 MSC預(yù)處理后的樣本光譜圖Fig.3 Spectral image of sample after MSC pretreatment
由表5可知,6種特征波長(zhǎng)提取方法中,CARS提取的特征波長(zhǎng)共20個(gè),占總波長(zhǎng)的11.4%;GA提取21個(gè),占11.9%;BiPLS提取94個(gè),占53.4%;IRF提取出59個(gè),占33.5%。由于BiPLS和IRF提取的特征波長(zhǎng)較多,因此將二者與CARS聯(lián)合使用,方法的疊加使用,可以在保證相關(guān)性的基礎(chǔ)上減少光譜的維數(shù)。BiPLS-CARS提取的特征波長(zhǎng)數(shù)最少,共有11個(gè),占總波長(zhǎng)的6.3%;IRF-CARS提取的特征波長(zhǎng)有23個(gè),占總波長(zhǎng)的13.1%。6種方法所選波長(zhǎng)分布均勻,各個(gè)波段均有挑選,降低了光譜的維數(shù),方便后期建立模型。
表5 特征波長(zhǎng)選取統(tǒng)計(jì)表Table 5 Characteristic wavelength selection statistics
2.5.1 偏最小二乘回歸模型 由表6得出,BiPLS-PLSR和BiPLS-CARS-PLSR模型的參數(shù)指標(biāo)較為接近,但后者的波長(zhǎng)數(shù)只有11個(gè),遠(yuǎn)遠(yuǎn)低于BiPLS-PLSR模型,因此說明利用BIPLD-CARS提取特征波長(zhǎng)的方法是可行的,IRF-PLSR和IRF-CARS-PLSR模型的情況同上。GA挑選出的波長(zhǎng)建立的模型具有較高的Rc、Rcv值,較低的RMSEC和RMSECV值,校正模型優(yōu)于其他三種模型;從預(yù)測(cè)能力上看,GA-PLSR擁有最高的Rp值和較低的RMSEP值,說明該模型預(yù)測(cè)能力較好較穩(wěn)定。綜合各個(gè)參數(shù),對(duì)于PLSR的6種模型,GA挑選出來的波長(zhǎng)所建立的是最優(yōu)模型。
表6 不同特征波長(zhǎng)的肌細(xì)胞中SOD酶活力定量分析 PLSR模型Table 6 PLSR model of SOD enzyme activity in cells with different characteristic wavelengths
2.5.2 主成分回歸模型 從表7得出,同時(shí),BiPLS-PCR與BiPLS-CARS-PCR模型相比,后者雖然只有11個(gè)波長(zhǎng),但參數(shù)性能較低,穩(wěn)定性不高,預(yù)測(cè)能力不及BiPLS-PCR,不能作為替代模型,說明在BiPLS-CARS聯(lián)合使用時(shí),貢獻(xiàn)率較大的波長(zhǎng)被忽略,挑選出來的波長(zhǎng)不足以代表所有信息。IRF-PCR和IRF-CARS-PCR模型的性能指標(biāo)接近,后者只有23個(gè)波長(zhǎng),因此IRF-CARS-PCR模型可以作為替代模型。在6種模型中,GA-PCR的R值均較大,RMSE值最低,說明模型校正能力強(qiáng),穩(wěn)定性優(yōu)于其他模型,預(yù)測(cè)也較為準(zhǔn)確。因此GA-PCR是最優(yōu)模型。
表7 不同特征波長(zhǎng)的肌細(xì)胞中SOD酶活力定量分析 PCR模型Table 7 PCR model of SOD enzyme activity in cells with different characteristic wavelengths
2.5.3 多元線性回歸模型 由表8得出,BiPLS-CARS-MLR模型的相關(guān)性系數(shù)R均大于0.8,且均方根誤差較小。說明該模型與BiPLS-MLR相比,穩(wěn)定性更好,預(yù)測(cè)能力也較強(qiáng),波長(zhǎng)數(shù)也只有11個(gè),大大降低了模型的維數(shù)。IRF-CARS-MLR模型的波長(zhǎng)數(shù)只有23個(gè),是IRF-MLR模型波長(zhǎng)數(shù)的一半,但是模型參數(shù)整體不如IRF-MLR,穩(wěn)定性較低。CARS-MLR模型的R值均大于0.8,RMSE值較低,是6種模型中建模效果最佳的。因此綜合比較,選用CARS-MLR模型為最優(yōu)模型。
表8 不同特征波長(zhǎng)的肌細(xì)胞中SOD酶活力定量分析 MLR模型Table 8 MLR model of SOD enzyme activity in cells with different characteristic wavelengths
2.5.4 全波段與最優(yōu)特征波長(zhǎng)模型比較 由表9得出,GA法的PLSR模型和PCR模型相比,二者特征波長(zhǎng)數(shù)相同,但前者模型性能參數(shù)較好,擁有較高的R值和較低的RMSE值;CARS模型的R值為四種模型中最高,RMSE值最小,說明模型的校正能力和預(yù)測(cè)能力均為最好;綜合各個(gè)參數(shù),和全波段所建立的PLSR模型相比,CARS-MLR模型的各個(gè)參數(shù)均有所提高,說明其模型代表全波段建模是具有可行性的。CARS-MLR模型的結(jié)果見圖5。
表9 全波段與特征波長(zhǎng)模型結(jié)果比較Table 9 Comparison of the results of full band and characteristic band models
圖4 CARS-MLR建模結(jié)果Fig.4 CARS-MLR modeling results注:a:CARS-MLR光譜校正模型; b:CARS-MLR光譜預(yù)測(cè)模型。
針對(duì)可見顯微高光譜檢測(cè)靈敏度高,放大倍數(shù)大,定位準(zhǔn)確等優(yōu)勢(shì),結(jié)合化學(xué)計(jì)量學(xué)方法,對(duì)灘羊肉肌細(xì)胞中超氧化物歧化酶活力進(jìn)行檢測(cè)并建立相關(guān)模型。選擇380~980 nm波段采集223個(gè)顯微樣本圖像,對(duì)原始數(shù)據(jù)進(jìn)行異常值剔除及樣本的劃分,剔除11個(gè)異常值,采用RS(3∶1)法進(jìn)行樣本劃分;預(yù)處理后選定MSC為最優(yōu)方法;應(yīng)用GA、IRF、BiPLS等6種方法提取特征波長(zhǎng);建立并分析全波段和基于特征波長(zhǎng)的PLSR、PCR、MLR預(yù)測(cè)模型。對(duì)比多種預(yù)測(cè)模型,得出CARS-MLR最優(yōu),GA-PLSR、全波段的PLSR次之,GA-PCR最低。結(jié)果表明,利用CARS提取特征波長(zhǎng)建立的MLR模型代表全波段建模具有可行性,這為顯微高光譜成像技術(shù)在灘羊肉肌細(xì)胞內(nèi)超氧化物歧化酶活力的快速檢測(cè)提供借鑒。