摘要:為建立油莎豆塊莖含油率的近紅外光譜快速無損檢測(cè)模型,提高育種材料的早代選擇效率,本研究以109份油莎豆塊莖樣本為實(shí)驗(yàn)材料,采集波長(zhǎng)范圍為950-1 650 nm、分辨率為1 nm的近紅外光譜,并通過索氏提取法測(cè)定塊莖粗脂肪含量,剔除異常樣本后共得到103份樣本,使用SPXY法將其按3:1的比例劃分為校正集與驗(yàn)證集。分別采用標(biāo)準(zhǔn)正態(tài)變換、多元散射校正、一階導(dǎo)、二階導(dǎo)、sc平滑以及混合方法對(duì)原始光譜進(jìn)行預(yù)處理,并基于此建立偏最小二乘回歸(PLSR)模型,通過對(duì)模型性能的對(duì)比分析,篩選出在校正集和驗(yàn)證集上預(yù)處理效果均較好的MSC+SC法,用于油莎豆含油率檢測(cè)模型的構(gòu)建;然后用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣(CARS)、無信息變量消除(UVE)算法以及MIP神經(jīng)網(wǎng)絡(luò)進(jìn)行特征波長(zhǎng)提取,并構(gòu)建PLSR模型,結(jié)果顯示,用CARS和UVE算法分別提取出115個(gè)和251個(gè)特征波段,建模效果均比全波段建模效果好,其中CARS-PLSR模型預(yù)測(cè)性能最優(yōu),校正集交叉驗(yàn)證均方根誤差(RMSEcv),決定系數(shù)分別為1.328、0.903,驗(yàn)證集RMSEp.RP分別為1.206、0.888,驗(yàn)證集相對(duì)分析誤差(RPDp)為3.040;而MIP-PLSR模型的預(yù)測(cè)精度與CARS-PLSR模型接近,RMSEcv.R分別為1.387、0.903,RMSEp、R2分別為1.207、0.887,RPDp為3.040,但提取的特征波長(zhǎng)僅77個(gè),是3種方法中最少的,說明MLP法能夠更有效地降低光譜信息重疊,濾除無關(guān)信息,MLP-PLSR更適合用于油莎豆含油率檢測(cè)。綜上,本研究初步建立了基于近紅外光譜的油莎豆含油率快速無損檢測(cè)模型,可為提高育種工作中的檢測(cè)效率提供有效方法,并為油莎豆含油率無損檢測(cè)提供技術(shù)支持。
關(guān)鍵詞:油莎豆;含油率;近紅外光譜;偏最小二乘回歸(PLSR);MLP神經(jīng)網(wǎng)絡(luò);特征波長(zhǎng)提取
中圖分類號(hào):S126:S565.9 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):1001-4942(2025)01-0166-08
油莎豆是一種原產(chǎn)于非洲和地中海沿岸的高能作物,耐鹽堿、干旱,適宜在沙壤土中種植;其塊莖橢圓形或類球形,成熟時(shí)含油量在20%-36%之間,單位面積產(chǎn)油量非??捎^,并且油脂中富含維生素E和維生素C,營(yíng)養(yǎng)價(jià)值較高。因此,油莎豆作為新型油料作物,有著極高的發(fā)展?jié)摿?,是《全?guó)種植業(yè)結(jié)構(gòu)調(diào)整規(guī)劃(2016-2020年)》重點(diǎn)推薦種植的油料作物之一,可作為進(jìn)口大豆重要的替代性原料,在不與主糧爭(zhēng)地的政策背景下對(duì)提高我國(guó)食用油自給自足率起著重要作用。
含油率是油料作物的重要品質(zhì)性狀,也是育種改良的主要目標(biāo)性狀,建立一套能規(guī)?;瘧?yīng)用且快速準(zhǔn)確的含油率測(cè)定方法對(duì)于加快育種進(jìn)程具有重要意義。通常實(shí)驗(yàn)室中使用索氏提取法測(cè)定樣品中的粗脂肪含量,這也是我國(guó)糧油分析首選的標(biāo)準(zhǔn)方法。但該方法實(shí)際操作過程中耗時(shí)較長(zhǎng)且需要消耗大量試劑,不適用早代育種材料的大規(guī)模篩選分析。近紅外光譜分析技術(shù)是一種融合了光譜技術(shù)、信息學(xué)、化學(xué)計(jì)量學(xué)和計(jì)算機(jī)技術(shù)的高效快速分析技術(shù),利用有機(jī)分子中含氫基團(tuán)(如0-H、C-H、N-H等)的震動(dòng)吸收頻率與780-2 526 nm近紅外光譜的對(duì)應(yīng)關(guān)系,通過獲取和分析不同分子的光譜信息,實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品中蛋白質(zhì)、氨基酸、脂肪等的檢測(cè)分析,已廣泛用于花生、玉米、谷物等的品質(zhì)分析以及肉類摻假鑒定和乳飲料品質(zhì)分析等領(lǐng)域,但在油莎豆含油率檢測(cè)方面的應(yīng)用研究還較少。
本研究選用103份油莎豆樣本構(gòu)建數(shù)據(jù)集,采用SPXY算法按照3:1的比例將數(shù)據(jù)集劃分為校正集和驗(yàn)證集,對(duì)比分析一階導(dǎo)、二階導(dǎo)、標(biāo)準(zhǔn)狀態(tài)變換、多元散射校正、SG平滑以及混合處理等多種光譜預(yù)處理方法的降噪效果,采用CARS和UVE算法以及MIP人工神經(jīng)網(wǎng)絡(luò)進(jìn)行特征波長(zhǎng)選擇,初步建立了基于PLSR和MIP人工神經(jīng)網(wǎng)絡(luò)的油莎豆含油率近紅外無損分析模型,以提高油莎豆育種工作中的檢測(cè)分析效率,為油莎豆品質(zhì)無損檢測(cè)分析提供一定的理論參考。