王 雪,張海榮,吳丹丹,王偉寧,王立琦, ,羅淑年,2, ,于殿宇
(1.哈爾濱商業(yè)大學(xué),黑龍江 哈爾濱 150028;2.九三食品股份有限公司,黑龍江 哈爾濱 150060;3.東北農(nóng)業(yè)大學(xué)食品學(xué)院,黑龍江 哈爾濱 150030)
大豆原油是大豆種子原料經(jīng)過(guò)壓榨或浸提后得到的,除含有甘油三酯外,通常還含有磷脂、蛋白質(zhì)、黏液質(zhì)和糖基甘二酯等膠溶性雜質(zhì)[1],其中,磷脂含量最多[2]。膠溶性雜質(zhì)的存在不僅會(huì)對(duì)油脂品質(zhì)及其儲(chǔ)藏穩(wěn)定性有較大影響,還會(huì)影響油脂精煉和深加工程度[3],因此,脫膠作為去除大豆原油中磷脂等膠溶性雜質(zhì)的重要手段在油脂精煉中是必不可少的[4]。傳統(tǒng)脫膠工段包括水化脫膠和酸化脫膠,水化脫膠去除的是水化磷脂[5],酸化脫膠去除的非水化磷脂,通過(guò)添加磷酸將非水化磷脂轉(zhuǎn)化為水化磷脂而去除[6]。在企業(yè)實(shí)際生產(chǎn)中,由于傳統(tǒng)檢測(cè)方法不能實(shí)時(shí)監(jiān)測(cè)大豆原油中的含磷量,為保證生產(chǎn)的連續(xù)性及生產(chǎn)效率,在酸化脫膠工段通常根據(jù)生產(chǎn)經(jīng)驗(yàn)添加過(guò)量的磷酸去除非水化磷脂,隨后在堿煉工段再添加過(guò)量的堿液中和過(guò)量的磷酸,這會(huì)使油脂加工生產(chǎn)成本增加。因此,如果在精煉生產(chǎn)線上能夠在線實(shí)時(shí)反饋大豆原油中的含磷量,則可根據(jù)大豆原油中含磷量的多少精準(zhǔn)控制添加的酸堿量,從而起到降本增效的作用。
目前測(cè)量油脂中磷脂含量的方法很多,國(guó)家標(biāo)準(zhǔn)中有鉬藍(lán)比色法和重量法兩種[7]。鉬藍(lán)比色法準(zhǔn)確性較高,但該方法耗時(shí)長(zhǎng)且操作繁瑣,重量法只適用于粗略定量分析,準(zhǔn)確性較差[8]。此外,在實(shí)驗(yàn)室研究中檢測(cè)油脂中的磷脂常采用薄層色譜法[9]和高效液相色譜法[10],薄層色譜法干擾因素多,實(shí)驗(yàn)條件嚴(yán)苛,重復(fù)性較差[11],高效液相色譜法成本昂貴,前處理復(fù)雜[12]。以上幾種方法共性問(wèn)題是耗時(shí)長(zhǎng),因此,迫切需要開(kāi)發(fā)一種能夠快速、精準(zhǔn)、易于實(shí)現(xiàn)在線檢測(cè)大豆原油中磷脂含量的方法,用于指導(dǎo)生產(chǎn)企業(yè)在加工生產(chǎn)線上精準(zhǔn)調(diào)控精煉過(guò)程中酸堿添加及產(chǎn)品質(zhì)量控制。
近紅外光譜(near-infrared spectroscopy,NIR)技術(shù)因其具有操作簡(jiǎn)單、分析速度快、靈敏度較高、能夠?qū)崿F(xiàn)無(wú)損、無(wú)污染的在線快速檢測(cè)等優(yōu)點(diǎn)[13],特別適合生產(chǎn)過(guò)程中的質(zhì)量控制[14],在化學(xué)領(lǐng)域[15]、中藥領(lǐng)域[16]、生物學(xué)領(lǐng)域[17]以及食品領(lǐng)域得到廣泛應(yīng)用[18-19],其中利用NIR分析磷含量也有報(bào)道,李軍山等[20]運(yùn)用NIR技術(shù)中的漫反射技術(shù)和化學(xué)方法針對(duì)大豆磷脂粉的含磷量進(jìn)行快速檢測(cè)分析。周秀娟等[21]利用近紅外光譜儀的光學(xué)處理、光譜數(shù)據(jù)處理和改進(jìn)偏最小二乘方法,建立了快速測(cè)定高、低磷大豆油中磷含量的近紅外模型,其中部分大豆油樣是由不同含磷量的大豆油在實(shí)驗(yàn)室調(diào)配而成,模型在實(shí)際生產(chǎn)線上的適用性需要進(jìn)一步研究。
因此,本研究提出一種基于NIR快速檢測(cè)大豆原油中含磷量的方法,從大豆油脂加工企業(yè)生產(chǎn)線上直接采集不同含磷量的大豆原油樣品,建立近紅外分析模型,以期用于大豆油實(shí)際加工過(guò)程中的快速檢測(cè),指導(dǎo)生產(chǎn)過(guò)程中工藝參數(shù)調(diào)整,避免因含磷量檢測(cè)結(jié)果滯后造成的資源浪費(fèi)及成本增加,與此同時(shí)也能夠?qū)崟r(shí)監(jiān)控大豆油的品質(zhì),為百姓的食品安全提供保障。
大豆原油樣品 九三食品股份有限公司。
T-N5000S紫外-可見(jiàn)分光光度計(jì) 上海佑科儀器儀表有限公司;SZ-2.5-10型箱式電阻爐 天津市泰斯特儀器有限公司;NIRFlex N-500近紅外分析儀 瑞士步琦有限公司;AB265-S分析天平 梅特勒托利多科技(中國(guó))有限公司。
1.3.1 含磷量化學(xué)值測(cè)定
本研究目的是實(shí)現(xiàn)加工過(guò)程中大豆原油中含磷量的快速檢測(cè)及調(diào)控,因此直接從大豆油生產(chǎn)企業(yè)精煉生產(chǎn)線的脫膠工段上,采集水化脫膠前后具有代表性的大豆原油樣品220 個(gè),依據(jù)GB/T 5537—2008《糧油檢驗(yàn) 磷脂含量的測(cè)定》中的鉬藍(lán)比色法,測(cè)定大豆原油樣品的含磷量范圍為17.9~90.9 mg/100 g。
1.3.2 光譜數(shù)據(jù)采集
將樣品分別注入到儀器配備的內(nèi)直徑為8 mm的透明玻璃小管,然后依次在環(huán)境濕度小于7%的室溫條件下進(jìn)行NIR采集,采集波數(shù)范圍4 000~10 000 cm-1,掃描次數(shù)32,分辨率為4 cm-1[22]。NIR采集系統(tǒng)如圖1所示,液體測(cè)量池是通過(guò)透射模式測(cè)量大豆原油,偏振干涉儀采用模塊一體化配置,內(nèi)有鹵鎢燈光源及InGaAs檢測(cè)器,具有抗機(jī)械干擾的性能,特別適用于放置于車(chē)間精煉生產(chǎn)線實(shí)時(shí)在線監(jiān)測(cè)。
圖1 NIR采集系統(tǒng)Fig.1 NIR acquisition system
1.3.3 光譜數(shù)據(jù)預(yù)處理
原始光譜數(shù)據(jù)會(huì)受到外界的干擾和噪聲信息的影響。為減少這種干擾,需在保證光譜數(shù)據(jù)有用信息的原始真實(shí)性前提下,最大程度地去除各種隨機(jī)噪聲。本實(shí)驗(yàn)分別采用數(shù)據(jù)中心化、歸一化、多元散射校正、標(biāo)準(zhǔn)正態(tài)變換和3 種小波閾值去噪方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,提高模型的精度與穩(wěn)定性。
1.3.4 樣本分集與模型評(píng)價(jià)
本實(shí)驗(yàn)使用基于聯(lián)合x(chóng)-y距離的樣本集劃分(sample set partitioning based on jointx-ydistances,SPXY)算法進(jìn)行分集[23],保證最大程度表征樣本分布。數(shù)據(jù)分集后,采用基于偏最小二乘(partial least squares,PLS)算法構(gòu)建近紅外分析模型。模型采用決定系數(shù)(R2)、均方根誤差(root mean square error,RMSE)和相對(duì)標(biāo)準(zhǔn)偏差(relative standard deviation,RSD)對(duì)預(yù)測(cè)模型評(píng)價(jià)[24]。
1.3.5 最優(yōu)波段的選擇
NIR采集的是4 000~10 000 cm-1近紅外全譜光譜數(shù)據(jù),其中包含很多與磷脂的特征波段不相關(guān)的光譜數(shù)據(jù),如果使用全譜數(shù)據(jù)進(jìn)行建模,模型的計(jì)算量較大,不利于后期將算法固化進(jìn)產(chǎn)品,影響模型的穩(wěn)定性[25],因此本實(shí)驗(yàn)使用組合區(qū)間偏最小二乘(synergy interval partial least squares,SiPLS)對(duì)磷脂進(jìn)行最優(yōu)波段的選擇[26-27],使用PLS建模結(jié)果比較效果后,選出建模效果較好的一部分波長(zhǎng)用于后續(xù)建模。
1.3.6 BP模型的建立
由于大豆原油樣本的各向異性,光譜數(shù)據(jù)與含磷量間呈現(xiàn)較為復(fù)雜的非線性關(guān)系,使用模型相對(duì)簡(jiǎn)單的線性分析方法難以從復(fù)雜變動(dòng)的光譜中提取到足夠的有效特征和有效特征之前的非線性關(guān)系,無(wú)法保證大豆原油含磷量定量校正模型的精確性和適用性[28]。因此本研究采用非線性表征能力更強(qiáng)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行模型的構(gòu)建。
光譜預(yù)處理、SiPLS篩選、PLS和BP神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)處理和計(jì)算采用Matelab-R2022a分析軟件,數(shù)據(jù)統(tǒng)計(jì)和圖表繪制使用Origin 9.5。
采用SPXY方法將大豆原油樣本按含磷量進(jìn)行分集,分出170 組校正集和50 組預(yù)測(cè)集。由表1可以看出,校正集和預(yù)測(cè)集的平均值基本一致,預(yù)測(cè)集樣品的含量包含于校正集的范圍內(nèi),即預(yù)測(cè)集的樣品可以使用校正集建立模型進(jìn)行分析[29]。
表1 大豆原油中的含磷量Table 1 Phosphorus content of crude soybean oil
220 個(gè)樣品的原始NIR數(shù)據(jù)經(jīng)過(guò)7 種不同降噪預(yù)處理,結(jié)果如圖2所示。圖2a為220 個(gè)大豆原油樣品的NIR原始圖譜,圖2b~h為不同的預(yù)處理方法降噪處理后的NIR圖。降噪處理后的數(shù)據(jù)分別使用PLS建模得到的結(jié)果如表2所示。
表2 不同去噪方法處理的全譜數(shù)據(jù)建模效果對(duì)比Table 2 Comparison of modeling effects of full spectral data processed by different denoising methods
圖2 NIR圖Fig.2 NIR spectra
校正均方根誤差(root mean square error of calibration,RMSEC)、預(yù)測(cè)均方根誤差(root mean square error of prediction,RMSEP)越小,證明模型的擬合度越高,RMSEC和RMSEP越接近,證明模型的穩(wěn)定性越高。由表2可以看出,對(duì)原始數(shù)據(jù)采用標(biāo)準(zhǔn)正態(tài)變換進(jìn)行去噪的效果最好,其預(yù)測(cè)集的R2、RMSEP、RSD分別為0.954 7、1.814 9、4.06%,有效消除了光譜中的常數(shù)偏移和表面散射帶來(lái)的干擾,提高了光譜分辨率[30],因此選擇標(biāo)準(zhǔn)正態(tài)變換去噪處理后的數(shù)據(jù)進(jìn)行特征波段優(yōu)選及模型優(yōu)化。
應(yīng)用SiPLS法將4 000~10 000 cm-1的全譜范圍分別等分為20、30、40、50 個(gè)光譜子區(qū)間,然后聯(lián)合其中的2~4 個(gè)光譜子區(qū)間分別進(jìn)行PLS建模,篩選出與磷脂密切相關(guān)的特征吸收波段如圖3所示,利用這些波段不同組合建模的結(jié)果如表3所示。
表3 SiPLS不同波段組合的建模結(jié)果Table 3 Modeling results of different band combinations with SiPLS
圖3 不同子區(qū)間數(shù)對(duì)應(yīng)的特征波段范圍圖Fig.3 Feature bands corresponding to different subinterval numbers
從表3可以看出,用SiPLS進(jìn)行波段選擇在子區(qū)間數(shù)為20,入選區(qū)間為4 304~4 604、4 904~5 204、6 704~7 004 cm-1和7 904~8 204 cm-1時(shí),建模效果最好,R2、RMSEP、RSD分別為0.955 7、1.641 8、3.67%,因此,后續(xù)選擇此波段組合進(jìn)行建模。
2.4.1 BP神經(jīng)網(wǎng)絡(luò)模型參數(shù)設(shè)置
為確保BP模型性能良好,必須確定BP模型的學(xué)習(xí)速率和訓(xùn)練次數(shù),本研究通過(guò)大量實(shí)驗(yàn)得出數(shù)據(jù)進(jìn)行對(duì)比分析,確定BP回歸模型的最佳參數(shù)并進(jìn)行建模。由圖4可以看出,當(dāng)學(xué)習(xí)速率為0.005、訓(xùn)練次數(shù)為108時(shí),BP模型的RSD最低,建模效果最好,因此BP神經(jīng)網(wǎng)絡(luò)模型參數(shù)設(shè)置為學(xué)習(xí)速率0.005、訓(xùn)練次數(shù)108。
圖4 學(xué)習(xí)速率(a)及訓(xùn)練次數(shù)(b)的選擇Fig.4 Selection of learning rate (a) and training frequency (b)
2.4.2 BP模型與PLS模型的比較分析
為了比較建模效果,分別采用BP和PLS兩種算法對(duì)全譜、優(yōu)選出的特征波段建立回歸模型,建模效果如表4所示,預(yù)測(cè)結(jié)果如圖5所示。無(wú)論是對(duì)全譜建模還是對(duì)特征波段建模,BP神經(jīng)網(wǎng)絡(luò)模型效果均優(yōu)于PLS,同時(shí)在BP神經(jīng)網(wǎng)絡(luò)模型結(jié)果中,特征波段建模效果又優(yōu)于全譜模型,其校正集的R2、RMSEC、RSD分別為0.979 7、0.859 3、1.89%,預(yù)測(cè)集的R2、RMSEP、RSD分別為0.978 5、0.963 8、2.15%。
表4 基于BP和PLS建模的效果比較Table 4 Comparison of modeling effect based on BP and PLS
圖5 預(yù)測(cè)模型Fig.5 Prediction models
為進(jìn)一步驗(yàn)證本研究建立BP神經(jīng)網(wǎng)絡(luò)特征波段模型檢測(cè)結(jié)果的準(zhǔn)確性以及在實(shí)際生產(chǎn)中的適用性,在大豆油精煉生產(chǎn)線上隨機(jī)選取6 個(gè)大豆原油樣品,采用GB/T 5537—2008中的鉬藍(lán)比色法與本研究建立的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值進(jìn)行比較,其結(jié)果如表5所示。與鉬藍(lán)比色法測(cè)得的含磷量結(jié)果相比,BP神經(jīng)網(wǎng)絡(luò)模型測(cè)得結(jié)果的相對(duì)誤差均在5%以內(nèi),絕對(duì)誤差處于穩(wěn)定可接受水平,表明基于NIR分析技術(shù)建立的含磷量預(yù)測(cè)模型整體檢測(cè)準(zhǔn)確度較高,適用于于大豆加工企業(yè)的實(shí)際生產(chǎn)。
表5 模型的驗(yàn)證結(jié)果Table 5 Verification results of the model
本研究提出一種運(yùn)用NIR分析技術(shù)在精煉生產(chǎn)線上實(shí)現(xiàn)快速、精準(zhǔn)、無(wú)損檢測(cè)含磷量的方法。對(duì)標(biāo)準(zhǔn)正態(tài)變換法降噪后的光譜數(shù)據(jù)進(jìn)行SiPLS特征波段提取,優(yōu)選出含磷量建模的最佳波段,減少光譜冗余信息,降低模型的計(jì)算復(fù)雜度,提高模型效率。建立大豆原油含磷量的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,通過(guò)與PLS對(duì)比分析,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型效果最佳,其含磷量的預(yù)測(cè)RSD為2.15%,表明基于BP神經(jīng)網(wǎng)絡(luò)的NIR分析用于大豆原油含磷量的快速檢測(cè)可行,將其應(yīng)用于大豆原油工業(yè)化精煉加工過(guò)程中含磷量的實(shí)時(shí)檢測(cè),不僅不存在人為誤差及系統(tǒng)誤差,有效提高檢測(cè)結(jié)果的準(zhǔn)確性。與國(guó)家標(biāo)準(zhǔn)中鉬藍(lán)比色法相比(檢測(cè)時(shí)長(zhǎng)約5 h),無(wú)任何試液制備前處理以及比色上機(jī)等流程,安全環(huán)保的同時(shí)大幅度縮減含磷量檢測(cè)的時(shí)間(僅需16 s),提高檢測(cè)效率,為油脂精煉后續(xù)的酸化脫膠及堿煉工段中酸堿添加量的精準(zhǔn)調(diào)控及時(shí)提供數(shù)據(jù),對(duì)大豆油脂企業(yè)生產(chǎn)加工過(guò)程中實(shí)現(xiàn)節(jié)本降耗及產(chǎn)品質(zhì)量監(jiān)控具有一定的指導(dǎo)意義。