摘 要:本研究基于近紅外(NIR)光譜技術(shù)與變量篩選-線性判別分析(LDA)方法,建立了一種砂糖橘產(chǎn)地無損鑒別方法。在25、45 ms和65 ms三個積分時間下,分別采集了廣西、云南和廣東砂糖橘的近紅外光譜。利用光譜預處理消除干擾,采用主成分分析(PCA)和LDA方法建立砂糖橘產(chǎn)地的鑒別模型。此外,通過競爭性自適應重加權(quán)采樣法(CARS)、蒙特卡羅非信息變量消除法(MCUVE)、連續(xù)投影算法(SPA)和隨機檢驗(RT)等變量篩選方法進一步簡化模型,提高模型的鑒別率。結(jié)果表明,光譜預處理方法可以消除光譜中的干擾,僅依靠無監(jiān)督模式識別無法實現(xiàn)對不同產(chǎn)地砂糖橘的準確鑒別;45 ms和65 ms積分時間下的模型優(yōu)于25 ms下的模型,基于優(yōu)化預處理的LDA模型可以獲得95.10%的鑒別率;采用變量篩選方法的模型鑒別率得到明顯提升,其中65 ms積分時間下,去偏移(de-bias)-RT-LDA、標準正態(tài)變量變換(SNV)-RT-LDA、原始光譜-SPA-LDA和一階導(1st)-SPA-LDA模型,以及45 ms積分時間下,原始光譜-MCUVE-LDA模型鑒別率均達到99.02%。以上結(jié)果表明,基于便攜式NIR光譜技術(shù)與變量篩選-LDA方法可實現(xiàn)砂糖橘產(chǎn)地準確無損鑒別。
關(guān)鍵詞:砂糖橘;便攜式近紅外光譜;產(chǎn)地;變量篩選;無損鑒別
中圖分類號:O657.33 文獻標志碼:A 文章編號:1008-1038(2025)03-0006-06
DOI:10.19590/j.cnki.1008-1038.2025.03.002
Nondestructive Identification of ‘Shatangju’ Mandarin from Different Origins Based on Near-infrared Spectroscopy Combined with"the Variable Screening Strategy
QIU Xiwen1, YANG Qinghua2, ZHAN Jiaqi1, TANG Hui3, LI Pao1,3*, DU Guorong4*
(1. College of Food Science and Technology, Hunan Agricultural University, Changsha 410128, China; 2. China Certification amp; Inspection Group Hunan Co., Ltd., Changsha 410021, China; 3. Guangdong Provincial Key Laboratory of Utilization and Conservation of Food and Medicinal Resources in Northern Region, Shaoguan 512005, China; 4. Shanghai Tobacco Group Co., Ltd. Technical Center Beijing Workstation, Beijing 101121, China)
Abstract: A non-destructive traceability method for ‘Shatangju’ mandarin (Citrus reticulata Blanco cv. Shatangju) from different origins was established based on near-infrared (NIR) spectroscopy technology and variable screening-linear discriminant analysis (LDA) method. Spectra of ‘Shatangju’ mandarin from Guangxi, Yunnan, and Guangdong at the integration times of 25, 45 ms, and 65 ms were collected. Spectral preprocessing was used to eliminate interferences, while principal component analysis (PCA) and LDA methods were used to establish identification the models for ‘Shatangju’ mandarin from different origins. Competitive adaptive reweighted sampling (CARS), Monte carlo non informative variable elimination (MCUVE), continuous projection algorithm (SPA), and randomized trial method (RT) were used to further simplify the model and improve the identification accuracy. The results indicated that spectral preprocessing methods could eliminate the interferences in spectra. The unsupervised pattern recognition could not achieve the identification of ‘Shatangju’ mandarin from different origins. The models of 45 ms and 65 ms were better than those of 25 ms. 95.10% identification rate could be obtained with LDA and spectral preprocessing methods. The accuracies of model identification using variable screening method were significantly improved. 99.02% identification rate could be obtained with 65 ms-debias correction (de-bias)-RT-LDA, 65 ms-standard normal variate transformation (SNV)-RT-LDA, 65 ms-original spectra-SPA-LDA, 65 ms-first-order derivative (1st)-SPA-LDA models, and 45 ms-original spectra-MCUVE-LDA models. The above results indicated that the portable NIR spectroscopy technology and variable screening-LDA method could achieve accurate and non-destructive identification of ‘Shatangju’ mandarin from different origins.
Keywords: ‘Shatangju’ mandarin; portable near infrared spectroscopy; origin; variable screening; nondestructive identification
柑橘(Citrus reticulata Blanco)屬于蕓香科柑橘亞科植物,是世界上最重要的水果作物之一,也是我國種植面積最大的水果,在我國農(nóng)業(yè)生產(chǎn)中占有重要地位[1-3]。砂糖橘是一種著名的柑橘類水果,因其艷麗的外觀和鮮甜多汁的口感在秋冬季節(jié)非常受歡迎[4]。由于不同地區(qū)土壤特征、氣候、水分管理和肥料使用等因素不同,不同產(chǎn)地砂糖橘品質(zhì)存在一定差異,但消費者很難準確鑒別[5-6]。常見的水果產(chǎn)地鑒別方法主要有頂空固相微萃取-氣相色譜-質(zhì)譜法、DNA條形碼法、化學元素指紋分析方法等,但這些方法需要破壞樣品,且預處理周期長,成本較高[7-9]。因此,迫切需要開發(fā)一種綠色、無損、快速的方法來實現(xiàn)砂糖橘產(chǎn)地的準確識別。
近紅外(NIR)光波長范圍為700~2 500 nm,主要是由近紅外光譜中的C—H、O—H和N—H化學鍵振動的倍頻和倍頻吸收反映的信息[10],憑借高效、無損、綠色環(huán)保等特點已被應用于柑橘類水果及其副產(chǎn)物的產(chǎn)地溯源和內(nèi)部品質(zhì)分析。但在光譜采集過程中常因環(huán)境和樣品自身特性等因素影響,容易出現(xiàn)光譜基線漂移、噪聲過大等干擾問題,因此通常需要結(jié)合化學計量學方法消除干擾。張欣欣等[5]利用NIR光譜技術(shù)結(jié)合線性判別分析(LDA)方法建立了沃柑產(chǎn)地的鑒別模型。Amenta等[11]采用NIR結(jié)合兩種有監(jiān)督模式識別方法建立了意大利西西里島檸檬產(chǎn)地溯源模型,其變量篩選-偏最小二乘判別分析模型可以獲得95%的鑒別率。然而,現(xiàn)階段這些研究多集中在蘋果[12]和葡萄[13]等薄皮類水果上,缺乏對砂糖橘產(chǎn)地的無損鑒別研究。
現(xiàn)階段多數(shù)鑒別模型復雜,且可能存在模型過度擬合的風險。因此常采用無監(jiān)督和有監(jiān)督模式識別方法挖掘樣品類別信息,并結(jié)合變量篩選方法選擇特征變量以簡化模型,提高模型鑒別率[14-16]。競爭性自適應重加權(quán)采樣法(CARS)[17]、蒙特卡羅-非信息變量消除法(MCUVE)[18]、連續(xù)投影算法(SPA)[19]以及隨機檢驗(RT)[20]是目前常用的變量篩選方法。本研究旨在采用NIR光譜技術(shù)采集三個產(chǎn)地砂糖橘光譜信息,利用光譜預處理方法消除干擾,利用變量篩選-LDA建立鑒別模型以實現(xiàn)砂糖橘產(chǎn)地的準確無損鑒別。此外,首次探究了不同積分時間對砂糖橘產(chǎn)地溯源模型的影響,以期實現(xiàn)砂糖橘產(chǎn)地的無損準確鑒別。
1 材料與方法
1.1 樣品準備
采集廣西、云南和廣東三個產(chǎn)地的砂糖橘樣品各100份,共300份樣品。所有樣品置于20~25 ℃的環(huán)境下保存。
1.2 儀器與光譜采集
儀器:i-Spec Plus光柵型便攜式近紅外光譜儀,必達泰克光電科技(上海)有限公司。
光譜采集:將砂糖橘置于近紅外光譜儀光斑的中心位置,利用漫反射模式分別在25、45 ms和65 ms積分時間下對砂糖橘的果梗部、果頂部以及赤道線(取4個點)進行光譜采集,每個樣品共采集6個點的光譜,取平均值作為原始光譜數(shù)據(jù)。根據(jù)Kennard-Stone方法將300個砂糖橘樣品按照2∶1的比例分為校正集和驗證集。
1.3 數(shù)據(jù)處理
在光譜采集過程中,儀器常常會受到環(huán)境中各種因素的干擾,采用多種光譜預處理方法消除干擾。本試驗采用了去偏移(de-bias)、去趨勢(DT)、一階導數(shù)(1st)、二階導數(shù)(2nd)、連續(xù)小波變換(CWT)、最大最小歸一化(Min-Max)、多元散射校正(MSC)和標準正態(tài)變量變換(SNV)光譜預處理方法,以消除光譜中存在的干擾[21-22]。采用無監(jiān)督主成分分析方法(PCA)和有監(jiān)督LDA模式識別建立砂糖橘模型,結(jié)合CARS、MCUVE、SPA和RT變量篩選方法簡化模型,進一步提高模型鑒別能力。以上數(shù)據(jù)分析程序由MATLAB R2022a實現(xiàn)。
2 結(jié)果與分析
2.1 不同產(chǎn)地砂糖橘原始光譜和PCA分析
圖1分別為25、45、65 ms積分時間下廣西、云南和廣東砂糖橘的原始光譜圖。由圖可知,三個積分時間下譜線趨勢一致,分別在980、1 190、1 450 nm附近存在明顯的吸收峰,為O—H二級倍頻、C—H二級倍頻和N—H一級倍頻所引起。此外,原始光譜存在較為嚴重的基線漂移和譜峰重疊的干擾,無法找到不同產(chǎn)地砂糖橘光譜之間的差異。因此,采用PCA挖掘砂糖橘潛在的差異信息。圖2為三個積分時間下廣西、云南和廣東砂糖橘原始光譜對應的PCA結(jié)果。從圖中可以看出,3個積分時間下置信橢圓都存在嚴重重疊,隨著積分時間的增加,3個產(chǎn)地置信橢圓重疊范圍逐漸變大。因此,PCA方法無法實現(xiàn)砂糖橘的產(chǎn)地鑒別。
2.2 基于PCA-LDA的砂糖橘鑒別分析
由于PCA結(jié)果不佳,采用有監(jiān)督LDA方法進行建模,通過PCA對數(shù)據(jù)進行降維后再結(jié)合LDA建立鑒別模型。圖3是25、45、65 ms三個積分時間下砂糖橘的PCA-LDA結(jié)果,不難看出,在45、65 ms積分時間下PCA-LDA模型的砂糖橘產(chǎn)地整體鑒別率結(jié)果優(yōu)于25 ms積分時間。其中,45 ms積分時間下未經(jīng)預處理的原始光譜結(jié)果最佳,整體鑒別率達到95.10%,但在65 ms積分時間下,模型原始光譜的鑒別率為93.14%,經(jīng)過2nd預處理后鑒別率提高到了95.10%。因此選擇合適的預處理方法可以提高模型鑒別率。
2.3 基于CARS-LDA、RT-LDA砂糖橘鑒別分析
圖4、5分別是25、45、65 ms積分時間下砂糖橘的CARS-LDA和MCUVE-LDA結(jié)果。如圖所示,采用變量篩選方法選擇特征變量后,模型鑒別結(jié)果明顯提高。在45 ms積分時間下CARS-LDA鑒別模型中,原始光譜結(jié)果最好,其鑒別率達到98.04%,65 ms積分時間下經(jīng)過SNV和2nd預處理后的模型鑒別率也能達到98.04%。RT-LDA模型優(yōu)于MCUVE-LDA鑒別模型。在RT-LDA模型中,在65 ms積分時間下,原始光譜的鑒別結(jié)果為98.04%,而經(jīng)過de-bias、SNV預處理后其鑒別率均提高到了99.02%。
2.4 基于SPA-LDA、MCUVE-LDA的砂糖橘鑒別分析
圖6、7分別是25、45、65 ms積分時間下砂糖橘的SPA-LDA和MCUVE-LDA模型鑒別結(jié)果。
由圖可知,在SPA-LDA鑒別模型中,最佳鑒別模型是基于65 ms積分時間下原始光譜-SPA-LDA和1st- SPA-LDA,其鑒別率均達到99.02%。其中,在MCUVE-LDA鑒別模型中,45 ms積分時間下原始光譜-MCUVE-LDA的鑒別率達到99.02%。在三個積分時間下,MCUVE-LDA比SPA-LDA模型更為穩(wěn)健。
2.5 變量篩選結(jié)果
經(jīng)過變量篩選方法后,砂糖橘鑒別模型得到了簡化,鑒別率得到了一定的提高,有效降低了模型過擬合風險。圖8為25、45、65 ms積分時間下4種變量篩選的變量數(shù)圖。由圖可知,CARS和SPA方法所選的變量數(shù)最少,25 ms-SNV-CARS(鑒別率91.18%)變量數(shù)為5,而MCUVE和RT的變量數(shù)一致。其中,65 ms-原始光譜-SPA-LDA(鑒別率99.02%)和65 ms-1st-SPA-LDA(鑒別率99.02%)的變量數(shù)分別為39和38。
3 結(jié)論
本研究基于便攜式近紅外光譜技術(shù)結(jié)合變量篩選-模式識別,建立了不同產(chǎn)地砂糖橘的無損、快速、準確鑒別方法。結(jié)果表明,光譜預處理能在一定程度上消除光譜中存在的干擾;基于45 ms和65 ms積分時間下的模型鑒別結(jié)果優(yōu)于25 ms模型;采用變量篩選方法可以有效提高模型的鑒別能力,其中,最佳的鑒別模型為65 ms-原始光譜-SPA-LDA、65 ms-1st- SPA-LDA 和45 ms-原始光譜-MCUVE-LDA,鑒別率均達到99.02%。以上結(jié)果表明,便攜式光譜技術(shù)結(jié)合變量篩選-模式識別方法可以實現(xiàn)不同產(chǎn)地砂糖橘的快速無損鑒別,維護地理標志水果的品質(zhì)和品牌聲譽。
參考文獻:
[1] ZHANG H, ZHAN B, PAN F, et al. Determination of soluble solids content in oranges using visible and near infrared full transmittance hyperspectral imaging with comparative analysis of models[J]. Postharvest Biology and Technology, 2020, 163: 111148.
[2] ABDEL-SATTER M, Al-OBR EED S, ABOUKARIMA A M. Yield and heat unit requirements for several citrus cultivars over several seasons in Egypt[J]. Horticulturae, 2024, 10(7): 712-712.
[3] 楊紅, 伍小雨, 全津瑩, 等. 四川柑橘產(chǎn)業(yè)現(xiàn)狀及發(fā)展對策[J]. 東南園藝, 2021, 9(3): 55-60.
[4] 王秋萍. 廣西: 金秋砂糖桔上市價高[J]. 中國果業(yè)信息, 2022, 39(10): 56.
[5] 張欣欣, 李尚科, 李跑, 等. 近紅外光譜的不同產(chǎn)地柑橘無損鑒別方法[J]. 光譜學與光譜分析, 2021, 41(12): 3695-3700.
[6] ElBASIOUNY H, El-RAMADY H, ElBEHIRY F, et al. Plant nutrition under climate change and soil carbon sequestration[J]. Sustainability, 2022, 14(2): 914.
[7] FARAG M A, DOKALAHY E U, EISSA T F, et al. Chemometrics-based aroma discrimination of 14 Egyptian mango fruits of different cultivars and origins, and their response to probiotics analyzed via SPME coupled to GC-MS[J]. American Chemical Society Omega, 2022, 7(2): 2377-2390.
[8] 方潔, 呂群丹, 陳正道, 等. 市售覆盆子藥材DNA條形碼鑒定研究[J]. 中國現(xiàn)代應用藥學, 2020, 37(4): 437-442.
[9] WANG Y, ZHANG Y, YUAN Y, et al. Nutrient content prediction and geographical origin identification of red raspberry fruits by combining hyperspectral imaging with chemometrics[J]. Frontiers in Nutrition, 2022, 9: 980095.
[10]" SONG J, LI G, YANG X, et al. Rapid analysis of soluble solid content in navel orange based on visible-near infrared spectroscopy combined with a swarm intelligence optimization method[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2020, 228: 117815.
[11]" AMENTA M, FABRONI S, COSTA C, et al. Traceability of “Limone di Siracusa PGI” by a multidisciplinary analytical and chemometric approach[J]. Food Chemistry, 2016, 211: 734-740.
[12]" 姜小剛, 何聰, 姜楠, 等. 基于多模型決策融合的蘋果產(chǎn)地判別及糖度含量預測[J]. 光譜學與光譜分析, 2024, 44(10): 2812-2818.
[13]" 呂晨菲, 楊靜慧, 劉艷軍, 等. 基于NIRS與PLS-DA的紅提產(chǎn)地鑒別研究[J]. 天津農(nóng)學院學報, 2020, 27(1): 21-23, 27.
[14]" KIM M J, YU W H, SONG D J, et al. Prediction of soluble-solid content in citrus fruit using visible-near-infrared hyperspectral imaging based on effective-wavelength selection algorithm[J]. Sensors, 2024, 24(5): 1512.
[15]" LI P, LI S, DU G, et al. A simple and nondestructive approach for the analysis of soluble solid content in citrus by using portable visible to near-infrared spectroscopy[J]. Food Science amp; Nutrition, 2020, 8(5): 2543-2552.
[16]" 李嘉儀, 余梅, 李脈泉, 等. 近紅外光譜和模式識別的菊花品種無損鑒別[J]. 光譜學與光譜分析, 2022, 42(4): 1129-1133.
[17]" 路皓翔, 張靜, 李靈巧, 等. 最小角回歸結(jié)合競爭性自適應重加權(quán)采樣的近紅外光譜波長選擇[J]. 光譜學與光譜分析, 2021, 41(6): 1782-1788.
[18]" SHAO Y, LIU Y, XUAN G, et al. Detection and analysis of sweet potato defects based on hyperspectral imaging technology[J]. Infrared Physics amp; Technology, 2022, 127: 104403.
[19]" LI B, HOU B, ZHOU Y, et al. Detection of waxed chestnuts using visible and near-infrared hyper-spectral imaging[J]. Food Science and Technology Research, 2016, 22(2): 267-277.
[20]" XU H, LIU Z, CAI W, et al. A wavelength selection method based on randomization test for near-infrared spectral analysis[J]. Chemometrics and Intelligent Laboratory Systems, 2009, 97(2): 189-193.
[21]" 余梅, 李尚科, 易智, 等. 柑橘內(nèi)部品質(zhì)近紅外光譜無損檢測研究進展[J]. 中國果菜, 2020, 40(6): 83-86, 100.
[22]" 李跑, 譚惠珍, 謝叔娥, 等. 基于近紅外光譜技術(shù)有監(jiān)督模式識別的青皮產(chǎn)地溯源分析[J]. 輕工學報, 2024, 39(2): 54-59.
收稿日期:2024-12-13
基金項目:湖南省自然科學基金(2023JJ30290);2024年度湖南省大學生創(chuàng)新訓練計劃一般項目(s202410-537029);廣東省食藥資源利用與保護重點實驗室2023年度開放基金課題重點項目(FMR2023012Z);湖南農(nóng)業(yè)大學2024年學科交叉研究青年引導項目(2024XKJC10)
第一作者簡介:邱熙文(1999—),女,在讀碩士,研究方向為食品無損檢測
*通信作者簡介:李跑(1989—),男,副教授,博士,主要從事食品分析與化學計量學的研究與教學工作
杜國榮(1983—),男,高級工程師,博士,主要從事化學計量學的研究工作