摘要 為了實(shí)現(xiàn)對(duì)復(fù)烤下機(jī)煙葉含水率的準(zhǔn)確預(yù)測(cè),提出了基于主成分分析法和BP神經(jīng)網(wǎng)絡(luò)的煙葉含水率預(yù)測(cè)模型。首先,采用主成分分析法提取最具表征意義的復(fù)烤煙葉含水率特征因子,獲得特征矩陣。然后將特征矩陣輸入BP神經(jīng)網(wǎng)絡(luò),構(gòu)建包括特征矩陣與復(fù)烤下機(jī)煙葉含水率的預(yù)測(cè)模型。仿真結(jié)果表明,提出的模型在復(fù)烤煙葉含水率預(yù)測(cè)方面呈現(xiàn)出顯著的預(yù)測(cè)能力,決定系數(shù)達(dá)0.92。文中方法可輔助優(yōu)化煙葉復(fù)烤控制參數(shù),提升復(fù)烤煙葉品質(zhì)。
關(guān)鍵詞 煙葉;含水率;主成分分析;神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)模型
中圖分類號(hào) TP183;TS44+3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 0517-6611(2024)14-0219-04
doi:10.3969/j.issn.0517-6611.2024.14.045
Research on the Prediction of Tobacco Water Content Based on PCA-BP Neural Network
WU Hong1,KONG Ze-dong2,WANG Ruo-fang1 et al
(1.Huahuan International Tobacco Co., Ltd., Chuzhou, Anhui 239000;2. School of Smart City and Transportation, Southwest Jiaotong University, Chengdu, Sichuan 611730)
Abstract In order to realize the accurate prediction of the water content of the tobacco under the re-roasting machine, a tobacco water content prediction model based on principal component analysis and BP neural network was proposed. First, principal component analysis was used to extract the most characteristic factors of water content of re-roasted tobacco, and the feature matrix was obtained. Then, the feature matrix was input into BP neural network to construct a prediction model including the feature matrix and the water content of tobacco under re-roasting. The simulation results showed that the proposed model presented significant prediction ability in the prediction of water content of re-baking tobacco, and the coefficient of determination reached 0.92. By using this method, we could assist in the optimization of the control parameters of tobacco re-baking and the improvement of the quality of re-baking tobacco.
Key words Tobacco leaves;Moisture content;Principal component analysis;Neural network;Prediction model
作者簡(jiǎn)介 吳宏(1980—),男,安徽無(wú)為人,工程師,從事煙草信息化研究。
收稿日期 2023-08-23;修回日期 2023-10-19
在打葉復(fù)烤生產(chǎn)過(guò)程中,煙葉含水率是重要的質(zhì)量指標(biāo)之一,復(fù)烤工序則是決定煙葉含水率的主要環(huán)節(jié)[1-3]。煙葉復(fù)烤過(guò)程具有大時(shí)滯、強(qiáng)耦合等特點(diǎn),且面臨連續(xù)生產(chǎn)的實(shí)時(shí)性要求,因此在實(shí)際操作中需要依賴人工經(jīng)驗(yàn)設(shè)置控制參數(shù),這使得煙葉含水率存在達(dá)不到生產(chǎn)要求的風(fēng)險(xiǎn)。煙葉含水率過(guò)高會(huì)導(dǎo)致煙葉無(wú)法滿足倉(cāng)儲(chǔ)要求,煙葉含水率過(guò)低則會(huì)劣化煙葉品質(zhì),因此精準(zhǔn)預(yù)測(cè)煙葉含水率對(duì)復(fù)烤工序控制參數(shù)的科學(xué)制定具有指導(dǎo)意義。
過(guò)去幾年,多篇文獻(xiàn)探索了BP神經(jīng)網(wǎng)絡(luò)在煙葉含水率預(yù)測(cè)方面的作用。郭奇等[4]在研究中提出了一種基于多層感知器的煙絲含水率預(yù)測(cè)方法,通過(guò)隨機(jī)森林算法提取輸入特征,提高了預(yù)測(cè)模型的泛化能力。劉大衛(wèi)等[5]在研究中對(duì)多個(gè)基于大數(shù)據(jù)算法的煙絲含水率預(yù)測(cè)模型性能進(jìn)行了對(duì)比試驗(yàn)。結(jié)果表明,BP網(wǎng)絡(luò)在煙絲含水率預(yù)測(cè)方面具有顯著的優(yōu)勢(shì)。高立秀等[6]利用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型,通過(guò)反向傳播算法進(jìn)行訓(xùn)練,取得了較好的預(yù)測(cè)效果。此外,王龍柱等[7]在煙絲含水率預(yù)測(cè)中使用了RBF神經(jīng)網(wǎng)絡(luò),探討了特征選擇和模型參數(shù)調(diào)整對(duì)預(yù)測(cè)性能的影響。上述研究成果為理解神經(jīng)網(wǎng)絡(luò)在含水率預(yù)測(cè)中的作用提供了有益信息,表明通過(guò)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型可以實(shí)現(xiàn)煙葉含水率準(zhǔn)確預(yù)測(cè)。盡管上述研究在煙葉含水率預(yù)測(cè)方面取得了顯著成果,但是這些研究成果大多集中在烘烤煙絲含水率模型的建立與應(yīng)用領(lǐng)域,并未在復(fù)烤煙葉的含水率預(yù)測(cè)方面進(jìn)行針對(duì)性探索,且上述研究仍然存在一些挑戰(zhàn)和不足之處,如沒(méi)有針對(duì)數(shù)據(jù)特征提取及模型泛化性能進(jìn)行深入研究。鑒于此,筆者運(yùn)用主成分分析方法(principal components analysis, PCA),基于復(fù)烤過(guò)程中采集的傳感數(shù)據(jù)進(jìn)行特征提取,然后將提取特征輸入BP神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)對(duì)復(fù)烤后煙葉含水率的準(zhǔn)確預(yù)測(cè)。
1 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)通過(guò)誤差反向傳播,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)中大量互相聯(lián)結(jié)神經(jīng)元之間聯(lián)結(jié)權(quán)值的優(yōu)化,具有優(yōu)異的非線性擬合性能[8-9]。BP神經(jīng)網(wǎng)絡(luò)拓?fù)湟妶D1。
2 PCA-BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)的輸入樣本涉及多維數(shù)據(jù),存在多重共線性和冗余性,這將導(dǎo)致模型的訓(xùn)練時(shí)間增加、工作效率降低以及預(yù)測(cè)精度下降[10-11]。為了有效應(yīng)對(duì)這些問(wèn)題,采用PCA進(jìn)行特征提取。
特征提取的目標(biāo)是從眾多數(shù)據(jù)中提取與問(wèn)題最相關(guān)的信息,以創(chuàng)建1個(gè)僅包含最少自由參數(shù)的特征矩陣[12-13]。這些參數(shù)與關(guān)鍵特征相關(guān)聯(lián),能夠生成具有良好泛化能力的模型。特征提取通常通過(guò)降維來(lái)實(shí)現(xiàn),這是處理高維特征數(shù)據(jù)的預(yù)處理方法。降維的目標(biāo)是保留主要特征,同時(shí)消除噪聲和不重要的特征,以提高數(shù)據(jù)處理速度。
基于PCA的特征提取基本做法是通過(guò)線性變換將由n個(gè)初始變量組成的n維隨機(jī)向量轉(zhuǎn)化為d(d<n)個(gè)新變量,即變換生成d個(gè)最終主成分因子,實(shí)現(xiàn)初始特征矩陣的降維。
PCA-BP神經(jīng)網(wǎng)絡(luò)拓?fù)淙鐖D2所示。
3 主成分分析
3.1 構(gòu)建輸入樣本集
以安徽某復(fù)烤廠為研究對(duì)象,梳理該廠工藝流程,發(fā)現(xiàn)整個(gè)煙葉復(fù)烤工段分為9個(gè)工藝區(qū)域,即5個(gè)干燥區(qū)、1個(gè)冷卻區(qū)和3個(gè)回潮區(qū)。
每個(gè)干燥區(qū)設(shè)置獨(dú)立控制回路,維持區(qū)域內(nèi)的熱風(fēng)溫度。溫度傳感器測(cè)量通過(guò)加熱器后的熱風(fēng)溫度,將測(cè)量信號(hào)傳輸至電控系統(tǒng)。電控系統(tǒng)比較測(cè)量值和設(shè)定值后,輸出4~20 mA的電信號(hào)至氣動(dòng)薄膜調(diào)節(jié)閥的電氣轉(zhuǎn)換器,后者通過(guò)電信號(hào)和氣壓信號(hào)的轉(zhuǎn)換實(shí)現(xiàn)對(duì)氣動(dòng)薄膜閥開度的實(shí)時(shí)調(diào)整,從而精確控制加熱器蒸汽進(jìn)量,進(jìn)而維持熱風(fēng)溫度。
冷卻區(qū)的循環(huán)風(fēng)溫度是通過(guò)控制冷熱風(fēng)的混合比例實(shí)現(xiàn)的。溫度變送器監(jiān)測(cè)循環(huán)風(fēng)的溫度,并向電控系統(tǒng)發(fā)送信號(hào)。電控系統(tǒng)比較測(cè)量值與設(shè)定值后,通過(guò)調(diào)整伺服氣缸來(lái)實(shí)時(shí)調(diào)節(jié)風(fēng)門開度,實(shí)現(xiàn)對(duì)冷熱風(fēng)混合比例的控制。
操作人員主要通過(guò)手動(dòng)或自動(dòng)方式來(lái)控制混合噴嘴霧化水的流量來(lái)實(shí)現(xiàn)每個(gè)回潮區(qū)溫濕度的調(diào)整,并最終影響復(fù)烤下機(jī)煙葉含水率。
由上述復(fù)烤工藝流程可知,每個(gè)區(qū)域的溫濕度是影響烤后煙葉含水率的主要因素,同時(shí)環(huán)境溫濕度、烤前煙葉含水率、煙葉流量等也是不可忽視的因素,因此該研究選取與之相關(guān)的15個(gè)參數(shù)作為輸入樣本參數(shù)。
輸入樣本取自該廠MES系統(tǒng)實(shí)時(shí)采集數(shù)據(jù),一共30條數(shù)據(jù),其中部分樣本數(shù)據(jù)如表1所示。
輸入樣本共有14類數(shù)據(jù),數(shù)據(jù)大小和量綱各不相同,在進(jìn)行PCA之前,要進(jìn)行歸一化處理。歸一化計(jì)算公式為:
xi=xi-xminxmax-xmin(1)
式中:xi是任意樣本;xmin是該類樣本中的最小值;xmax是該類樣本中的最大值。
3.2 PAC分析 在MATLAB平臺(tái)中對(duì)17個(gè)原始輸入樣本進(jìn)行PCA分析,結(jié)果如表2所示。
由表2可知,前4個(gè)因子的累計(jì)方差值已經(jīng)達(dá)到95.21%,因此取前4個(gè)因子作為BP神經(jīng)網(wǎng)絡(luò)的輸入樣本。PCA處理中輸入樣本從原始的7個(gè)特征變量降到優(yōu)化后的4個(gè),這使BP神經(jīng)網(wǎng)絡(luò)模型得到簡(jiǎn)化,有助于提升模型預(yù)測(cè)精度。
主成分與原始特征的相關(guān)系數(shù)矩陣如表3所示。
由表3可知,主成分因子PC1主要與干燥區(qū)濕度、烤前水分、冷區(qū)水分和環(huán)境濕度相關(guān),其相關(guān)系數(shù)大于0.90;主成分因子PC2主要與干燥區(qū)溫度相關(guān),其相關(guān)系數(shù)均大于0.80,主成分因子PC3和PC4主要與環(huán)境溫度相關(guān),相關(guān)系數(shù)分別為0.84和0.32。
使用表3系數(shù)對(duì)原始樣本進(jìn)行計(jì)算,得到PCA變換后樣本。變換后的部分樣本如表4所示。
4 構(gòu)建BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層組成。輸入層
有4個(gè)神經(jīng)元,對(duì)應(yīng)4個(gè)主成分因子,隱含層神經(jīng)元數(shù)為10,輸出層神經(jīng)元數(shù)為1,對(duì)應(yīng)烤后煙葉含水率。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
在訓(xùn)練前將30個(gè)輸入樣本數(shù)據(jù)分為3類: 訓(xùn)練樣本20個(gè)、驗(yàn)證樣本數(shù)據(jù)5個(gè)、測(cè)試樣本數(shù)據(jù)5個(gè)。 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程如圖4所示。由圖4可知,神經(jīng)網(wǎng)絡(luò)在經(jīng)過(guò)10次迭代后, 訓(xùn)練樣本數(shù)據(jù)的均方誤差(MSE)接近于0, 網(wǎng)絡(luò)完成收斂,最佳驗(yàn)證樣本數(shù)據(jù)的均方誤差(MSE)為0.000 2。
BP神經(jīng)網(wǎng)絡(luò)的回歸分析結(jié)果如圖5所示,4 個(gè)回歸分析的窗口分別代表訓(xùn)練樣本、測(cè)試樣本、 驗(yàn)證樣本與所有樣本。由圖5可知,表征全部樣本數(shù)據(jù)回歸分析的相關(guān)性R值等于0.917 28,說(shuō)明BP神經(jīng)網(wǎng)絡(luò)輸出的煙葉含水率數(shù)值與實(shí)測(cè)值具有極高的相關(guān)性。
統(tǒng)計(jì)BP神經(jīng)網(wǎng)絡(luò)輸出含水率數(shù)值與實(shí)測(cè)值之間的誤差,繪制誤差柱狀圖如圖6所示。由圖6可知,大于90%的預(yù)測(cè)誤差值在零誤差線附近,這表明BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)性能良好。
5 結(jié)語(yǔ)
針對(duì)復(fù)烤后煙葉含水率預(yù)測(cè)問(wèn)題,該研究提出了PCA-BP神經(jīng)網(wǎng)絡(luò)模型。該模型利用PCA對(duì)輸入數(shù)據(jù)進(jìn)行變換,得到表征性最強(qiáng)的4個(gè)主成分因子,使用3層BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)建模,模型決定系數(shù)R達(dá)到了92%。通過(guò)該模型能準(zhǔn)確預(yù)測(cè)復(fù)烤后煙葉的含水率,可為復(fù)烤控制參數(shù)的科學(xué)制定提供了一種創(chuàng)新的數(shù)據(jù)驅(qū)動(dòng)方法。
參考文獻(xiàn)
[1] 王懷宇,王立華,蔣維,等.煙葉復(fù)烤回潮有限元分析及工藝參數(shù)優(yōu)化[J].科學(xué)技術(shù)與工程,2023,23(16):6993-7001.
[2] 包秀萍,王超,劉煜宇,等.打葉復(fù)烤不同工藝強(qiáng)度對(duì)煙葉自然醇化品質(zhì)的影響[J].西南農(nóng)業(yè)學(xué)報(bào),2022,35(3):647-654.
[3] 李善蓮,陳良元,李華杰,等.復(fù)烤方式對(duì)煙片加工質(zhì)量的影響[J].煙草科技,2012,45(10):5-8.
[4] 郭奇,鄧為權(quán).基于RF-MLP的烘絲出口含水率預(yù)測(cè)[J].信息技術(shù),2023(5):115-120.
[5] 劉大衛(wèi),夏永明,章立,等.建立基于大數(shù)據(jù)分析的葉絲切絲含水率預(yù)測(cè)模型[J].輕工科技,2022,38(4):1-4.
[6] 高立秀,陳得麗,萬(wàn)興淼,等.基于機(jī)器學(xué)習(xí)的切絲后含水率預(yù)測(cè)及控制方法[J].食品與機(jī)械,2021,37(4):189-194,211.
[7] 王龍柱,馬洪晶,孫欽蘭,等.基于RBF神經(jīng)網(wǎng)絡(luò)的葉絲生絲含水率預(yù)測(cè)[J].自動(dòng)化與信息工程,2017,38(2):34-36,42.
[8] 卓鳴,汪鵬,望開奎.基于MIV-BP神經(jīng)網(wǎng)絡(luò)的成品煙絲質(zhì)量預(yù)測(cè)模型構(gòu)建[J].食品與機(jī)械,2021,37(12):161-166,214.
[9] 李崢,王建峰,程小強(qiáng),等.基于BP神經(jīng)網(wǎng)絡(luò)的烤煙外觀質(zhì)量預(yù)測(cè)模型[J].西南農(nóng)業(yè)學(xué)報(bào),2019,32(3):653-658.
[10] 許永,李超,楊乾栩,等.基于BP神經(jīng)網(wǎng)絡(luò)建立初烤煙葉主流煙氣中氫氰酸釋放量的預(yù)測(cè)模型[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2018,33(1):72-78.
[11] 陸玉浩,王彬彬,萬(wàn)云飛,等.基于神經(jīng)網(wǎng)絡(luò)的煙絲填充值預(yù)測(cè)模型研究[J].中國(guó)煙草科學(xué),2016,37(5):82-86.
[12] 梁海玲,白森,李堅(jiān).基于魯棒稀疏PCA的工業(yè)異常檢測(cè)[J].科學(xué)技術(shù)與工程,2022,22(15):6164-6171.
[13] 姚學(xué)練,賀福強(qiáng),平安,等.基于PCA-GA-SVM的煙葉分級(jí)方法[J].煙草科技,2018,51(12):98-105.