中圖分類號:TS44 文獻標志碼:A 文章編號:2095-2945(2025)14-0054-06
Abstract:Thepreciseandstablecontrolofwaterflowduringtheloosening stageisapivotalaspectintobacco primary procesing,significantlyinfluencingthemoisturecontrolattedryinginletandultimatelythequalityofthefinishedtobaco shreds.Using productionbatchdatafromabrandatChenzhou CigareteFactory,thisstudyappliedPearsoncorelationanalysis, followedbytheextractionoftreeprincipalcomponentsusingPrincipalComponentAnalysis(PCA).Subsequentlymultivariate regresionmodelwasestablishedtocapturetherelationshipbetweenthewaterflowduringloseningandtheinletmoistureunder theinfluence of ambient temperature and humidity,achieving an R2 of O.873 with all Variance Inflation Factors(VIF) remaining below 1O. Validation results indicated an average error of 8.24% between the predicted and actual water flow during loosening, effectivelyenhancing theprecisionandstabilityofthiscontrolprocessacrossbatchesundervaryingenvironmentalconditions.
Keywords:silkmakingprocess;multipleregresionmodel;;waterflowprediction;temperatureandhumidity;principal component analysis
煙葉制絲是卷煙生產的重要工序,煙葉制絲的質量對卷煙的質量起著決定性的作用,煙絲含水率是最為重要的一個質量指標,而烘絲入口水分是卷煙制絲生產中的關鍵銜接水分控制點,其穩(wěn)定性反映了對水分的控制能力。目前,國內制絲線主要通過調整松散回潮機加水量實現對烘絲機入口含水率的控制,大量的實踐表明,制絲室內環(huán)境溫濕度對制絲煙葉水分控制有顯著影響。而在設置加水流量參數時僅僅根據人工經驗未考慮環(huán)境溫濕度對后續(xù)煙葉含水率的影響,導致烘絲入口水分批間出現較大偏差。針對此,謝升等采用相關性分析對烘絲入口水分的影響因素進行定性和定量分析,然后利用多元回歸分析模型建立了環(huán)境溫濕度影響下,加料出口水分與烘絲入口水分的關系模型;唐軍等重點研究制絲環(huán)境溫濕度對關鍵工序間煙草物料流轉過程中煙草含水率的影響規(guī)律;劉穗君等通過對松散回潮工序歷史數據進行統(tǒng)計回歸分析,建立了松散回潮出口含水率精準控制模型,并采用自學習算法對控制模型進行了自適應優(yōu)化調整;文廣球等提出一種基于BP神經網絡和主元回歸方法的主元神經網絡松散出口含水率預測模型;何毅等提出一種基于梯度提升樹方法的煙草回潮機出料含水率預測方法。
以往研究中均在一定程度上提高了松散加水流量控制精度,但仍缺乏在環(huán)境溫濕度影響下,松散加水流量對烘絲入口水分影響的研究。為此,本研究利用Pearson相關性分析對松散加水流量的影響因素進行定性和定量分析,然后利用主成分分析法提取主成分,并基于多元回歸分析模型建立了環(huán)境溫濕度影響下,松散加水流量與烘絲入口水分的關系模型,旨在實現烘絲入口含水率的精準控制,提高制絲生產批間水分的穩(wěn)定性。
1數據處理
1.1 數據樣本
基于卷煙企業(yè)制造執(zhí)行系統(tǒng)(Manufacturing exe-cutionsystems,MES),采集郴州卷煙廠在2023年8月至2024年7月期間,制絲工序某品牌的生產數據,共計涵蓋251個生產批次。數據中有各批次松散回潮入口水分、松散回潮工序控制參數、烘絲干燥入口水分以及各批次生產時對應區(qū)域的環(huán)境溫度和濕度等信息。按照 80% 的樣本數據為訓練數據集, 20% 的樣本數據為測試數據集進行劃分。
1.2 數據分析
1.2.1 正態(tài)性檢驗
為保證數據分析的有效性和結果的準確性,對訓練數據集數據進行正態(tài)檢驗[]。這里僅對松散加水流量及烘絲人口水分2項數據進行正態(tài)性檢驗。
由表1可知,分析項松散加水流量樣本 N<5000 采用S-W檢驗,顯著性 P 值為 0.000** ,水平呈現顯著性,拒絕原假設,因此數據不滿足正態(tài)分布。其峰度(-0.745)絕對值小于10并且偏度(0.326)絕對值小于3,可以結合正態(tài)分布直方圖 、P-P 圖進行進一步分析。分析項烘絲入口水分樣本 N<5000 ,采用S-W檢驗,顯著性 P 值為0.193,水平不呈現顯著性,不能拒絕原假設。
由圖1、圖2可知松散加水流量與烘絲人口水分正態(tài)性檢驗直方圖基本呈現出鐘形(中間高,兩端低),由圖3、圖4可知松散加水流量與烘絲入口水分計算觀測累計概率 (P) 與正態(tài)累計概率 (P) 的擬合程度較高,綜上所述該2項樣本數據服從正態(tài)分布。
1.2.2 數據相關性分析
1)Pearson相關分析。Pearson相關分析常用于評估變量之間的線性相關性,對于樣本 Xi(i=1,2,?,n) 和樣本 Yi(i=1,2,?,n) ,其相關系數 Ri 的計算公式如下
式中: 為樣本均值。
相關系數 Ri 的絕對值大小,可用來衡量2個變量之間的相關程度大小,符號位表示正負相關性。一般認為: |Ri|>0.7 時,說明變量之間的關聯(lián)十分密切; 位于0.4\\~0.7時,說明變量之間的關聯(lián)密切; |Ri| 位于0.2~0.4 時,說明變量之間的關聯(lián)一般;確定采集樣本數據之間的相關性,采用Pearson相關性分析。
相關性分析必須在變量間明確存在相關性的前提下進行,因此需要對相關系數 R 進行顯著性檢驗。用相關系數 R 構建 Φt 分布統(tǒng)計量
查閱 χt 分布表得到變量間不存在相關性的概率值 P ,一般認為當 P?0.05 時,變量之間存在顯著的線性關系;當 P?0.01 時,變量之間存在較強的顯著線性關系。
2)數據的相關分析。為確定松散加水流量的關鍵影響因素,利用Pearson相關分析對樣本數據進行相關分析,相關性檢驗結果見表2。
由表2可知,葉片段溫度和葉絲段溫度與松散加水流量具有顯著的正相關關系,其他因素與松散加水流量相關程度較低。另外,葉片段溫度與葉絲段溫度相關系數達到0.957,有較強的顯著性關系,葉片段溫度與葉絲段溫度存在共線性問題。如果僅僅通過Pearson相關性來分析數據,可進一步分析葉片段溫度與松散加水流量的線性關系。
3)葉片段溫度與松散加水流量關系。定義松散加水流量為 yQ ,葉片段溫度為 xT° 對 yQ 與 xT 進行線性關系驗證及回歸分析。
由圖5可知,葉片段溫度與松散加水流量有顯著的線性關系,一元回歸擬合公式為
Pearson相關系數反應了輸人變量與松散加水流量之間的線性相關性,不能反應輸入變量之間是否存在線性相關。因此,僅通過Pearson相關系數法減少冗余變量,降低數據維度來分析是不夠嚴謹的。
1.2.3 數據主成分分析
為更好地處理變量之間的相關性,降低輸入數據的維度和復雜度,采用主成分分析(PCA)對數據進行處理。PCA可通過分析提取新的特征,降低數據之間的相關性,優(yōu)化預測模型的輸人樣本,提高預測模型的準確性和可靠性。
1)主成分分析(PCA)。PCA算法的主要計算步驟如下。
① 指標數據標準化。設樣本總數為 q ,指標數為p,xij(i=1,2,?,q;j=1,2,?,p) 表示第 i 組樣本的第 j 項指標的平均值, Sj 表示第 j 項指標樣本標準差,對樣本數據進行標準化處理,計算出標準化矩陣
② 求出相關系數矩陣 。根據式求出相關系數
為
式中: rij 為相關系數矩陣對應項的值; Coν(Xi,Xj) 為 Xi 與 Xj 的協(xié)方差; Var(Xi) 為 Xi 樣本方差; Var(Xj) 為 Xj 樣本方差。
③ 計算主成分的貢獻率和累計貢獻率。根據式(5)式(6)計算
式中: λi 為相關系數矩陣的特征值; ei 為主成分 Fi 的貢獻率; P 為主成分 Fi 的累計貢獻率, m 為主成分數量。通常如果有 ?m 個主成分的累計貢獻率大于 80% 時,可以認為該 m 個主成分能表示所有主成分。
④ 計算主成分表達式。根據式(5)式(6)計算
式中: νiT 為 λi 相應的正交單位化特征向量矩陣; Xi 為樣本數據矩陣。
2)樣本數據主成分分析。由于水分鏈影響因素的量綱不盡相同,數據變化范圍相差較大,所以需要對原始樣本數據進行標準化處理。然后進行KMO和Bartlett檢驗,見表3,判斷是否可以進行主成分分析。而后根據PCA算法的原理進行對樣本數據進行主成分分析,可得主成分分析數據,見表4。
由表3可知:KMO的值為0.607,Bartlett球形檢驗的結果顯示,顯著性 P 值為 0.000*** ,水平上呈現一定顯著性,各變量間具有相關性,可以認為主成分分析有效。
特征值的大小和累計貢獻率反映了主成分影響力的大小,提取累計貢獻率大于 80% 且特征值小于1.0的前3個主成分 F1?F2?F3° 選取的前3個主成分的特征向量見表5。每個主成分的特征向量表示對各個因素的影響能力。
注: X1 為葉片段溫度, C;X2 為葉片段濕度, IORH;X3 為松散入口水分, %;X4 為松散蒸汽流量, kg?h-1;X5 為葉絲段溫度, C;X6 為葉絲段濕度, IORH;X7 為烘絲入口水分, % 。
由表5可得出3個主成分的表達式
F1=0.198X1+0.257X2+0.265X3-0.008X4+0.204X5+ 0.271X6+0.177X7
F2=-0.438X1+0.258X2+0.196X3+0.273X4-0.428X5+ 0.122X6+0.138X7
F3=0.239X1+0.017X2+0.175X3+0.844X4+0.191X5- $0 . 2 1 1 X _ { 6 } – 0 . 4 1 2 X _ { 7 } 。$
2 數學建模
多元回歸是一種基于統(tǒng)計的建模方法,通常用于探究因變量與多個自變量之間的關系,模型表達式為
通過主成分分析法將樣本數據降維后的3個主成分為輸入,松散加水流量為輸出,進行多元回歸分析。
由表6結果分析可以得到,顯著性 P 值為0.000** ,水平上呈現顯著性,拒絕回歸系數為0的原假設,因此模型滿足要求。 R2 為0.873,較接近于1,模型擬合效果較好。對于變量共線性表現,VIF全部小于10,因此模型沒有多重共線性問題,模型構建良好。
模型的公式如下
Y=42.094+3.444F1-6.839F2+2.109F3
進行模型轉換
Y=42.094+4.181445X1-0.843501X2-0.058709X3- 0.114603X4+4.032487X5-0.346033X6-1.203102X7° 式中: X1 為葉片段溫度, C;X2 為葉片段濕度, IORH;X3
為松散入口水分, %;X4 為松散蒸汽流量, kg?h-1;X5 為葉絲段溫度, 為葉絲段濕度, IORH;X7 為烘絲入口水分, %
該模型轉換公式預測效果見圖6、表7及表8。由圖6可知擬合預測值曲線與實際值曲線吻合度較高,由表7可知,訓練數據集的平均誤差率為 7.11% ,由表
8可知測試數據集的平均誤差率為 8.24% 。