張雷,李金學(xué),堵勁松,李龍飛,鄒嚴(yán)頡,張二強(qiáng),李善蓮
1.鄭州輕工業(yè)大學(xué) 電氣信息工程學(xué)院,河南 鄭州 450001;2.中國(guó)煙草總公司鄭州煙草研究院,河南 鄭州 450001;3.河南中煙工業(yè)有限責(zé)任公司 技術(shù)中心,河南 鄭州 450000;4.陜西中煙工業(yè)有限責(zé)任公司 技術(shù)中心,陜西 西安 710065
葉絲干燥是卷煙制絲生產(chǎn)的核心工序,卷煙成品的品質(zhì)控制十分重要,其任務(wù)是改善煙絲物理特性、提高感官品質(zhì)。滾筒烘絲機(jī)是葉絲干燥的關(guān)鍵加工設(shè)備,煙絲經(jīng)入料口定量進(jìn)入烘絲筒內(nèi),滾筒轉(zhuǎn)動(dòng)向前傳送物料,在加熱筒壁和熱風(fēng)的共同作用下,經(jīng)一系列復(fù)雜的物理化學(xué)變化,將煙絲干燥至含水率符合規(guī)范要求。筒壁溫度是過(guò)程控制的重要參數(shù),由于滾筒式烘絲機(jī)特殊的設(shè)備結(jié)構(gòu)和密閉生產(chǎn)空間,實(shí)際筒壁溫度難以直接在線檢測(cè)和控制,造成葉絲含水率的波動(dòng),進(jìn)而影響卷煙品質(zhì)。
目前,常見(jiàn)的烘絲干燥過(guò)程建模研究方法是機(jī)理模型[1],該方法從化學(xué)、熱工等角度構(gòu)建物質(zhì)反應(yīng)場(chǎng),對(duì)滾筒內(nèi)部的物料運(yùn)動(dòng)和溫度場(chǎng)分布進(jìn)行仿真,但機(jī)理模型大多建立在理想條件下,且需要專家經(jīng)驗(yàn)積累,難以適應(yīng)復(fù)雜多變的工況。數(shù)據(jù)驅(qū)動(dòng)建模方法無(wú)需任何專家經(jīng)驗(yàn),僅依賴工業(yè)過(guò)程數(shù)據(jù)質(zhì)量,借助人工智能技術(shù)飛速發(fā)展,該方法引起了國(guó)內(nèi)外學(xué)者高度關(guān)注[2]。數(shù)據(jù)驅(qū)動(dòng)建模方法主要有神經(jīng)網(wǎng)絡(luò)(Artificial Neutral Network,ANN)、支持向量機(jī)(Support Vector Machine,SVM)、極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)等[3-4]。神經(jīng)網(wǎng)絡(luò)具備強(qiáng)大的泛化能力,能夠以任意精度逼近復(fù)雜連續(xù)函數(shù),特別適用于解決復(fù)雜工業(yè)過(guò)程的非線性建模問(wèn)題,在鋼鐵、冶金、建材等流程工業(yè)應(yīng)用廣泛。一般神經(jīng)網(wǎng)絡(luò)建模多基于穩(wěn)態(tài)工況假設(shè),然而烘絲干燥過(guò)程是一類穩(wěn)態(tài)、非穩(wěn)態(tài)交替出現(xiàn)的動(dòng)態(tài)工況,傳統(tǒng)方法缺乏對(duì)工業(yè)數(shù)據(jù)動(dòng)態(tài)特征處理能力,建立的軟測(cè)量模型存在一定局限性。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[5-6]是具備內(nèi)部反饋結(jié)構(gòu)的動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)算法,在處理時(shí)序信號(hào)上具有顯著優(yōu)勢(shì),廣泛應(yīng)用于語(yǔ)音識(shí)別、動(dòng)態(tài)建模、故障診斷中。經(jīng)典RNN一般采用跨時(shí)間梯度反向傳播算法(Back Propagation Through Time,BPTT) 優(yōu)化模型參數(shù),然而很容易產(chǎn)生梯度消失或爆炸及長(zhǎng)期依賴問(wèn)題。為解決上述難題,國(guó)外學(xué)者提出了長(zhǎng)短期記憶單元(Long Short Time Memory,LSTM)[7-9]和門控循環(huán)單元(Gated Recurrent Unit,GRU)[10-13],通過(guò)設(shè)計(jì)門函數(shù)調(diào)節(jié)內(nèi)部神經(jīng)元的信息交流,從而更易捕捉時(shí)序數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系。
基于此,本文擬提出一種基于深度門控循環(huán)單元(Deep Gated Recurrent Unit,DGRU)網(wǎng)絡(luò)的烘絲機(jī)建模新方法。該方法在數(shù)據(jù)預(yù)處理和特征選擇基礎(chǔ)上,通過(guò)堆疊門控循環(huán)單元網(wǎng)絡(luò)提取制絲數(shù)據(jù)中深層非線性動(dòng)態(tài)特征,以端對(duì)端方式實(shí)現(xiàn)筒壁溫度動(dòng)態(tài)預(yù)測(cè),以期解決烘絲干燥過(guò)程中筒壁溫度難以準(zhǔn)確進(jìn)行在線測(cè)量的問(wèn)題。
在烘絲機(jī)生產(chǎn)過(guò)程中,采集了物料流量(X1)、入口物料含水率(X2)、HT蒸汽壓力(X3)、蒸汽流量(X4)、烘絲累積量(X5)、入口實(shí)際水分(X6)、工作蒸汽壓力(X7)、區(qū)域1冷凝水溫度(X8)、區(qū)域2冷凝水溫度(X9)、熱風(fēng)溫度(X10)、熱風(fēng)速度(X11)、罩壓力(X12)、烘絲出口溫度(X13)這13個(gè)過(guò)程變量。由于筒體傾斜且不斷旋轉(zhuǎn),現(xiàn)場(chǎng)儀表和傳感器采集數(shù)據(jù)不可避免地含有一定量的隨機(jī)噪聲和離群點(diǎn),工業(yè)原始數(shù)據(jù)品質(zhì)通常較差,影響模型預(yù)測(cè)精度。為了保證軟測(cè)量模型的可靠性,有必要對(duì)采集的數(shù)據(jù)作預(yù)處理,主要包括離群點(diǎn)剔除、小波去噪及歸一化處理。
制絲生產(chǎn)現(xiàn)場(chǎng)采集的葉絲干燥數(shù)據(jù)容易受到各種形式干擾(如傳感器故障、過(guò)程擾動(dòng)、狀態(tài)漂移等),故采用基于小波變換的去噪方法消除數(shù)據(jù)隨機(jī)噪聲,如下式所示:
f(t)=s(t)+σ·e(t)
其中s(t)為原始信號(hào),f(t)為含噪聲信號(hào),e(t)為噪聲,σ為噪聲標(biāo)準(zhǔn)差。小波變換去噪的主要目的是抑制信號(hào)中的高頻噪聲,從而在f(t)中恢復(fù)真實(shí)信號(hào)s(t),包括小波分解、高頻系數(shù)的閾值量化處理、信號(hào)重構(gòu)3個(gè)步驟,其中小波變換參數(shù)選擇“Sqtwolog”基函數(shù)。
以入口物料含水率為例,預(yù)處理對(duì)比效果如圖1所示。由圖1可知,采用小波去噪后,在保持?jǐn)?shù)據(jù)主趨勢(shì)同時(shí),能夠減少曲線毛刺,提高建模樣本質(zhì)量。
圖1 物料含水率預(yù)處理效果Fig.1 Preprocess result of material moisture content
烘絲機(jī)干燥過(guò)程變量(控制參數(shù)和狀態(tài)變量)存在一定相關(guān)性和冗余性,如果建模中直接采用全部變量,容易增加模型復(fù)雜度,導(dǎo)致預(yù)測(cè)準(zhǔn)確率下降和收斂速度緩慢。因此,本文采用最大相關(guān)最小冗余算法(Maximum Relevance and Minimum Redundancy,mRMR)[14],選擇與筒壁溫度相關(guān)性最強(qiáng)的特征作為模型初始輸入變量。集合S中變量X和輸出Y的最大相關(guān)性定義為:
其中,S為集合中變量個(gè)數(shù),原始變量間可能存在一定冗余性,因此,最小冗余定義為:
則最終目標(biāo)函數(shù)為:
maxφ(D,R)=D-R
式中φ代表變量相關(guān)性較大同時(shí)與其他特征相似性較小的特征。實(shí)踐中常采用增量式策略搜索最優(yōu)特征集合。
烘絲干燥過(guò)程運(yùn)行工況復(fù)雜多變,傳統(tǒng)淺層GRU網(wǎng)絡(luò)特征提取能力有限,難以準(zhǔn)確反映實(shí)際工況動(dòng)態(tài)變化。本文通過(guò)堆疊GRU提取工業(yè)數(shù)據(jù)中深層非線性動(dòng)態(tài)特征,將其輸入全連接層用于估計(jì)筒壁溫度。GRU 是一種特殊的RNN單元,在RNN基礎(chǔ)上添加更新門zt和重置門rt,通過(guò)門控單元控制內(nèi)部神經(jīng)元信息傳輸。相對(duì)于LSTM算法,GRU網(wǎng)絡(luò)參數(shù)更少,在保證預(yù)測(cè)精度前提下,提高收斂速度。GRU網(wǎng)絡(luò)基本結(jié)構(gòu)如圖2所示。
圖2 GRU網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.2 The structure of GRU network
在GRU中,對(duì)應(yīng)t時(shí)刻隱層的輸入xt,更新門zt,重置門rt,隱層輸出ht,上一時(shí)刻隱層輸出的計(jì)算方式如下所示:
堆疊GRU網(wǎng)絡(luò)提取烘絲機(jī)運(yùn)行數(shù)據(jù)中隱含的動(dòng)態(tài)信息后,將其作為輸入變量送入全連接層網(wǎng)絡(luò),用于建立輔助變量與筒壁溫度之間的預(yù)測(cè)模型,以端對(duì)端方式實(shí)現(xiàn)筒壁溫度在線預(yù)測(cè)。全連接層網(wǎng)絡(luò)定義如下:
oi=g(Wihi+bi)
其中,oi和hi分別代表第i個(gè)全連接層的輸出和輸入,Wi和bi代表第i個(gè)全連接層的權(quán)值和偏置。
基于DGRU的筒壁溫度動(dòng)態(tài)預(yù)測(cè)算法流程如圖3所示,離線訓(xùn)練和在線預(yù)測(cè)步驟如下。
圖3 基于DGRU的筒壁溫度動(dòng)態(tài)預(yù)測(cè)算法流程Fig.3 Flow chart of cylinder wall temperature prediction by DGRU Algorithm
離線訓(xùn)練:
1)采集現(xiàn)場(chǎng)工業(yè)數(shù)據(jù),進(jìn)行預(yù)處理;
2)采用mRMR方法進(jìn)行特征選擇,確定最佳輸入變量;
3)確定合適的延遲時(shí)間,進(jìn)行輸入變量時(shí)序重構(gòu);
4)確定模型結(jié)構(gòu)和參數(shù),將時(shí)序數(shù)據(jù)按一定比例劃分為訓(xùn)練集和測(cè)試集;
5)DGRU算法中采用雙層網(wǎng)絡(luò)結(jié)構(gòu),其中激活函數(shù)為tanh,并采用BTTP算法對(duì)DGRU模型進(jìn)行訓(xùn)練;
6)確定全連接層網(wǎng)絡(luò)參數(shù),采用梯度下降法訓(xùn)練,若精度滿足要求則訓(xùn)練結(jié)束,否則重復(fù)步驟5)。
在線預(yù)測(cè):
7)對(duì)任意測(cè)試數(shù)據(jù)進(jìn)行預(yù)處理、特征選擇、時(shí)序重構(gòu)操作;
8)基于已訓(xùn)練的DGRU模型,計(jì)算模型輸出;
9)反歸一化目標(biāo)輸出值,獲取最終預(yù)測(cè)值。
以河南中煙工業(yè)有限責(zé)任公司的兩段式滾筒烘絲機(jī)(簡(jiǎn)稱烘絲機(jī)) 為實(shí)驗(yàn)對(duì)象,烘絲機(jī)以一定傾斜角(1.5°~5°)轉(zhuǎn)動(dòng)運(yùn)行,煙絲在滾筒前滾動(dòng)前進(jìn),直到出料口落下。物料向前傳送,蒸汽在壓力輸送下,從主管路由旋轉(zhuǎn)接頭進(jìn)入烘絲機(jī),一路進(jìn)入烘筒內(nèi)熱交換裝置,另一路進(jìn)入熱風(fēng)系統(tǒng)的空氣加熱器,熱風(fēng)由管道輸送到前室進(jìn)入烘筒,與煙絲充分接觸。煙絲在蒸汽加熱的筒壁和熱風(fēng)的共同作用下,完成葉絲干燥。
從現(xiàn)場(chǎng)DCS數(shù)據(jù)庫(kù)中采集2020年1月2日至2020年2月28日生產(chǎn)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),在實(shí)際干燥工藝中,一般更注重烘絲機(jī)區(qū)域1的溫度控制,因此本文以區(qū)域1溫度作為模型輸出。此外,原始葉絲干燥數(shù)據(jù)包括料頭、料尾段,這些數(shù)據(jù)不利于建模,因此選取穩(wěn)定生產(chǎn)階段數(shù)據(jù)。采樣間隔10 s,實(shí)驗(yàn)數(shù)據(jù)如表1所示。
實(shí)驗(yàn)測(cè)試環(huán)境如下:OS為 Windows 10教育版 (64 bit);CPU為Intel(R) Core(TM ) i7-11700 2.50 GHz;RAM為16.0 GB;Python版本為3.6.0;TensorFlow-GPU 版本為1.12.0。為了驗(yàn)證本文方法的有效性,將DGRU算法與經(jīng)典ELM、RNN和GRU算法對(duì)比,ELM采用Matlab2018版本,激活函數(shù)為Sigmoid,采用單隱含層結(jié)構(gòu),節(jié)點(diǎn)數(shù)為40。RNN、GRU分別采用單隱含層網(wǎng)絡(luò)架構(gòu),隱含層單元個(gè)數(shù)設(shè)置為140,最大迭代次數(shù)為 100,時(shí)間步長(zhǎng)為1,初始學(xué)習(xí)率為 0.000 1。同時(shí)采用Dropout技術(shù),以避免訓(xùn)練過(guò)程中的過(guò)擬合問(wèn)題。DGRU算法模型參數(shù)見(jiàn)表2。
表1 實(shí)驗(yàn)數(shù)據(jù)信息Table 1 Information of experimental data
此外,滾筒烘絲干燥過(guò)程中采集了大量熱工數(shù)據(jù),但各數(shù)據(jù)(熱風(fēng)溫度、蒸汽壓力、物料流量等)量綱差異較大,對(duì)模型收斂速度和復(fù)雜度有重要影響,需對(duì)數(shù)據(jù)進(jìn)行歸一化消除量綱影響。
根據(jù)1.2節(jié)所述的mRMR算法,計(jì)算各輸入變量與區(qū)域1筒壁溫度之間的互信息值,見(jiàn)表3。采用mRMR算法后,與區(qū)域1滾筒溫度密切相關(guān)的變量排序?yàn)閄8,X2,X9,X3,X5,X6,X7,X11,X13,X10,X4,X12,X1。綜合現(xiàn)場(chǎng)專家知識(shí)和實(shí)踐經(jīng)驗(yàn),最終選取區(qū)域1冷凝水溫度(X8)、入口物料含水率(X2)、HT蒸汽壓力(X3)、入口實(shí)際水分(X6)、工作蒸汽壓力(X7)、熱風(fēng)溫度(X11) 6個(gè)變量作為軟測(cè)量模型最佳輸入。
烘絲機(jī)干燥過(guò)程是個(gè)大滯后的非線性動(dòng)態(tài)系統(tǒng),為了實(shí)現(xiàn)筒壁溫度的準(zhǔn)確預(yù)測(cè),需考慮輸入與輸出變量的時(shí)序及時(shí)滯關(guān)系[15-16],故建立非線性動(dòng)態(tài)映射關(guān)系如下:
Y(t)=fDGRU{X(t),X(t-1),X(t-2)}
其中,延遲時(shí)間為2個(gè)時(shí)刻,代表將當(dāng)前采樣時(shí)刻和前2個(gè)時(shí)刻的輸入變量作為動(dòng)態(tài)模型的綜合輸入。
表2 DGRU算法模型參數(shù)Table 2 Model parameters of DGRU algorithm
表3 輸入與輸出變量之間的互信息值Table 3 Mutual information between input and output variables
為客觀評(píng)價(jià)模型性能,采用均方根誤差 (Root Mean Square Error,RMSE)、平均絕對(duì)誤差 (Mean Absolute Error,MAE)和相關(guān)系數(shù)(Correlation Coefficient,CC)3個(gè)評(píng)價(jià)指標(biāo):
4種算法下筒壁溫度預(yù)測(cè)的對(duì)比結(jié)果見(jiàn)表4。為了更直觀地顯示算法預(yù)測(cè)效果,選取測(cè)試集2的烘絲機(jī)筒壁溫度的預(yù)測(cè)值和真實(shí)值結(jié)果作圖,其對(duì)比曲線詳見(jiàn)圖4。
由表4可知,在3組測(cè)試集上,ELM網(wǎng)絡(luò)的整體評(píng)價(jià)指標(biāo)最差,結(jié)合圖4發(fā)現(xiàn)ELM預(yù)測(cè)曲線與真實(shí)值具有較大偏差,說(shuō)明靜態(tài)網(wǎng)絡(luò)無(wú)法捕捉烘絲干燥過(guò)程的動(dòng)態(tài)特性。而采用RNN和GRU動(dòng)態(tài)遞歸網(wǎng)絡(luò)算法,其評(píng)價(jià)指標(biāo)和預(yù)測(cè)性能均得到明顯改善,這表明遞歸神經(jīng)網(wǎng)絡(luò)能夠有效捕捉烘絲過(guò)程的動(dòng)態(tài)時(shí)序特性,但單層RNN和GRU屬于淺層網(wǎng)絡(luò),泛化能力有限,其預(yù)測(cè)性能不高。本文所提DGRU算法具有最小的RMSE和MAE,以及最大的CC,進(jìn)一步由圖4可知,基于DGRU的筒壁溫度預(yù)測(cè)值相比其他方法能夠更好地?cái)M合真實(shí)值的變化趨勢(shì),模型輸出值與實(shí)際值擬合較好,絕大多數(shù)誤差控制在0.1范圍內(nèi),能實(shí)現(xiàn)較高的預(yù)測(cè)精度。
表4 4種算法下筒壁溫度預(yù)測(cè)的結(jié)果對(duì)比Table 4 Quantitative comparison of cylinder wall temperature prediction by four methods
圖4 4種算法下筒壁溫度預(yù)測(cè)值和真實(shí)值對(duì)比曲線Fig.4 Comparison between predictive and actual curves of cylinder wall temperature by four different methods
此外,測(cè)試集2在4種算法下的預(yù)測(cè)誤差箱體圖如圖5所示。由圖5可以清晰看到ELM和RNN算法的誤差中值及均值距離零刻度線有不同程度的偏離,GRU和DGRU的誤差中值及均值非常接近零刻度線,其中DGRU算法造成的異常點(diǎn)更少,表明其具備更佳的平均預(yù)測(cè)準(zhǔn)確度?;贒GRU算法的筒壁溫度相關(guān)系數(shù)如圖6所示。由圖6可知,筒壁溫度預(yù)測(cè)值和真實(shí)值趨勢(shì)一致,預(yù)測(cè)較準(zhǔn)確。
圖5 4種算法下的預(yù)測(cè)誤差箱體圖Fig.5 Prediction error boxplot by four different methods
圖6 基于DGRU算法的筒壁溫度相關(guān)系數(shù)Fig.6 Correlation coefficient of cylinder wall temperature by DGRU method
針對(duì)烘絲機(jī)筒壁溫度難以準(zhǔn)確進(jìn)行在線檢測(cè)的問(wèn)題,本文提出了基于DGRU的筒壁溫度動(dòng)態(tài)預(yù)測(cè)方法,為烘絲機(jī)筒壁溫度在線檢測(cè)提供了新的技術(shù)手段。該方法先對(duì)現(xiàn)場(chǎng)工業(yè)數(shù)據(jù)進(jìn)行小波去噪、歸一化等預(yù)處理操作;然后采用最大相關(guān)最小冗余選取與筒壁溫度相關(guān)性最大的輸入變量,簡(jiǎn)化模型復(fù)雜度,提高模型性能;最后利用堆疊GRU網(wǎng)絡(luò)和全連接層的深度學(xué)習(xí)方法預(yù)測(cè)在線溫度?;跓煆S實(shí)際烘絲數(shù)據(jù),實(shí)驗(yàn)結(jié)果表明DGRU算法造成的異常點(diǎn)較少,預(yù)測(cè)值和真實(shí)值趨勢(shì)一致,在預(yù)測(cè)準(zhǔn)確性方面明顯優(yōu)于傳統(tǒng)算法,能夠提高筒體壁溫度預(yù)測(cè)精度。在未來(lái)研究工作中,可重點(diǎn)研究注意力機(jī)制方法,以進(jìn)一步提高模型預(yù)測(cè)精度。