朱偉,陳凝,李旺洲,吳宇航
(1.華北理工大學(xué)數(shù)學(xué)建模創(chuàng)新實(shí)驗(yàn)室,河北 唐山 063210;2.華北理工大學(xué)理學(xué)院,河北 唐山 063210;3.河北省數(shù)據(jù)科學(xué)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室,河北 唐山 063210;4.唐山市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室,河北 唐山 063210)
當(dāng)前我國(guó)現(xiàn)存的100噸以下的中小型轉(zhuǎn)爐約有500余座,占全國(guó)煉鋼產(chǎn)能的50%左右,這些轉(zhuǎn)爐在地方骨干鋼鐵企業(yè)中也起著舉足輕重的作用。由于中小型轉(zhuǎn)爐無(wú)法安裝副槍系統(tǒng),終點(diǎn)控制命中率較低,且面臨著“去產(chǎn)能、綠色制造和市場(chǎng)競(jìng)爭(zhēng)”的耦合壓力,因此,突破中小型轉(zhuǎn)爐煉鋼的技術(shù)瓶頸,開(kāi)辟中小型轉(zhuǎn)爐智能煉鋼勢(shì)在必行。現(xiàn)有的轉(zhuǎn)爐煙氣分析系統(tǒng)是在靜態(tài)控制方程控制下在煉鋼的最后階段引入動(dòng)態(tài)檢測(cè),根據(jù)實(shí)時(shí)情況改變控制方程相關(guān)參數(shù),從而引導(dǎo)煉鋼終點(diǎn)的精準(zhǔn)命中。轉(zhuǎn)爐煙氣分析動(dòng)態(tài)控制是通過(guò)連續(xù)檢測(cè)轉(zhuǎn)爐吹煉中產(chǎn)生的煙氣成分(CO、CO2、N2、O2、Ar、H2)和煙氣流量,計(jì)算熔池的瞬時(shí)脫碳速度和脫碳量,并根據(jù)瞬時(shí)供氧量和渣料加入量計(jì)算氧在C、Si、Mn、P、S等元素的分配比,推算出熔池中各元素含量與爐渣成分。在我國(guó)雖然已經(jīng)有一部分轉(zhuǎn)爐采用煙氣分析系統(tǒng),對(duì)煉鋼終點(diǎn)進(jìn)行控制,但是該系統(tǒng)對(duì)鋼水中碳含量和溫度值的動(dòng)態(tài)預(yù)報(bào)精度取決于煙道安裝環(huán)境和數(shù)據(jù)信息同步狀況,魯棒性不高,無(wú)法切實(shí)實(shí)現(xiàn)智能煉鋼。因此,深度挖掘煙氣分析系統(tǒng)采集的煉鋼過(guò)程數(shù)據(jù)信息,獲取魯棒性高的碳溫動(dòng)態(tài)預(yù)報(bào)模型成為了一個(gè)關(guān)鍵問(wèn)題,在實(shí)踐生產(chǎn)中也是一個(gè)關(guān)鍵技術(shù)。
通過(guò)實(shí)驗(yàn)獲取了5組在不同轉(zhuǎn)爐情況下5次煉鋼進(jìn)程中(靜態(tài)控制模型預(yù)設(shè)的累計(jì)耗氧比例)70%~100%過(guò)程中時(shí)間同步的氧氣消耗比例PQ、氧氣消耗總量Q、煙氣中的CO含量[CO]、煙氣中的[CO2]和該時(shí)刻對(duì)應(yīng)的實(shí)際情況下鋼水中的碳含量[C]和鋼水溫度值[T],其中由于煙氣分析系統(tǒng)硬件與安裝的客觀原因[CO]和[CO2]指標(biāo)值與其余的幾個(gè)標(biāo)值雖然在時(shí)間上同步對(duì)應(yīng),但在實(shí)際反映上有一定的延遲,也就是說(shuō)當(dāng)前采集的[CO]和[CO2]兩個(gè)指標(biāo)反映的是前一個(gè)時(shí)刻或前n個(gè)時(shí)刻的熔池反映信息。針對(duì)獲取的樣本數(shù)據(jù),對(duì)其進(jìn)行基于Z-score[1]的標(biāo)準(zhǔn)化處理,使樣本符合標(biāo)準(zhǔn)正態(tài)分布,去除參數(shù)量綱的影響,以提高訓(xùn)練網(wǎng)絡(luò)時(shí)的收斂速度和模型的預(yù)測(cè)精度。
對(duì)標(biāo)準(zhǔn)化處理后的參數(shù)進(jìn)行分析??梢?jiàn)每一個(gè)樣本均代表一次煉鋼過(guò)程,其各項(xiàng)參數(shù)均具有時(shí)間序列性。故對(duì)樣本按順序選取訓(xùn)練集和驗(yàn)證集的方式顯然是欠妥的,可能會(huì)導(dǎo)致網(wǎng)絡(luò)對(duì)特定情況下精度極低。鑒于上述情況,將5組樣本數(shù)據(jù)進(jìn)行組合后,運(yùn)用SPSS軟件對(duì)總體進(jìn)行隨機(jī)取樣,隨機(jī)取樣情況如圖1所示。隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集,選取30%的數(shù)據(jù)作為驗(yàn)證集。
圖1 隨機(jī)取樣情況直方圖Fig. 1 Histogram of random sampling situation
由圖1可見(jiàn)其取樣情況較為均勻,訓(xùn)練和驗(yàn)證集的可信度較高。
運(yùn)用Matlab以樣本的氧氣消耗比例PQ、氧氣消耗總量Q、煙氣中的CO含量[CO]、煙氣中的[CO2]為影響因素,鋼水中的碳含量[C]和鋼水溫度值[T]為目標(biāo)預(yù)測(cè)值,建立三層神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,網(wǎng)絡(luò)設(shè)置為單隱含層,神經(jīng)元節(jié)點(diǎn)為10個(gè),求解器選取TRAINLM,L-M優(yōu)化權(quán)值算法[5],節(jié)點(diǎn)傳遞函數(shù)選取了TANSIG函數(shù)[6]。網(wǎng)絡(luò)的學(xué)習(xí)速率為0.1,梯度下降為0.001。在MSE(均方誤差)精度的選取上[7],發(fā)現(xiàn)MSE的選取與BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度有著直接的關(guān)系,精度選取過(guò)高,會(huì)使網(wǎng)絡(luò)雖然收斂于樣本,但其泛化能力急劇降低,反而并不能很好用于預(yù)測(cè);精度選取過(guò)低,則網(wǎng)絡(luò)收斂性較差,模型預(yù)測(cè)的準(zhǔn)確率低。如何在模型的泛化能力和準(zhǔn)確度中選取一個(gè)合適的精度顯然是一個(gè)需要多次試驗(yàn)研究的過(guò)程。
建立碳含量和溫度值的BP網(wǎng)絡(luò)預(yù)測(cè)模型,設(shè)定其MSE精度分別為0.1、0.01、0.001、0.0001、0.00001。通過(guò)不同精度的網(wǎng)絡(luò)對(duì)驗(yàn)證集進(jìn)行驗(yàn)證,尋找其最佳精度。
由表1可知當(dāng)MSE精度選取為0.0001時(shí),含碳量和溫度值預(yù)測(cè)模型的網(wǎng)絡(luò)收斂性和泛化能力均較強(qiáng),能夠很好的運(yùn)用于預(yù)測(cè)模型。因此,分別建立碳含量和溫度值的預(yù)測(cè)模型,預(yù)測(cè)情況如圖2~3所示。
圖2 碳含量預(yù)測(cè)網(wǎng)絡(luò)收斂示意圖Fig. 2 Schematic diagram of carbon content prediction network convergence
對(duì)碳含量以及溫度預(yù)測(cè)模型的誤差進(jìn)行分析,可發(fā)現(xiàn)其網(wǎng)絡(luò)誤差的產(chǎn)生具有一定規(guī)律性,其誤差往往呈現(xiàn)波動(dòng)態(tài)勢(shì)。其預(yù)測(cè)誤差分布圖如圖4所示。
表1 不同MSE精度下的預(yù)測(cè)均方誤差Table 1 Prediction mean square error under different MSE accuracy
圖3 溫度值預(yù)測(cè)網(wǎng)絡(luò)收斂示意圖Fig. 3 Schematic diagram of temperature prediction network convergence
圖4 預(yù)測(cè)誤差分布圖Fig. 4 Distribution of forecast error
為研究誤差產(chǎn)生的原因,將PQ,Q,CO,CO2以及前5次預(yù)測(cè)值等變量和訓(xùn)練所產(chǎn)生的誤差進(jìn)行相關(guān)性分析,分析結(jié)果顯示:
表2 誤差與CO相關(guān)性Table 2 Error and CO correlation
由表可見(jiàn)誤差的產(chǎn)生同CO和CO2的檢測(cè)量有著顯著性相關(guān)。
故可推斷出原模型的訓(xùn)練過(guò)程中,可能丟失了部分CO與CO2相關(guān)的規(guī)律,導(dǎo)致了誤差的產(chǎn)生,這正好同數(shù)據(jù)表中的[CO]和[CO2]指標(biāo)值與其余的幾個(gè)指標(biāo)值在實(shí)際反映上有一定的延遲性相對(duì)應(yīng)。
表3 誤差與CO2相關(guān)性Table 3Error and CO2 correlation
鑒于誤差產(chǎn)生的因素分析,提出基于預(yù)測(cè)誤差構(gòu)建誤差分析預(yù)測(cè)模型,以修復(fù)原模型誤差的方法。將樣本訓(xùn)練中所產(chǎn)生的誤差,重新構(gòu)成誤差分析數(shù)據(jù)序列。將該時(shí)間點(diǎn)的煙氣中的CO含量[CO]、煙氣中的[CO2]作為網(wǎng)絡(luò)的變量,訓(xùn)練誤差分析網(wǎng)絡(luò),以預(yù)測(cè)該時(shí)間點(diǎn)的誤差。并將該預(yù)測(cè)誤差反向修復(fù)原預(yù)測(cè)值。其流程基本如下:
圖4 誤差預(yù)測(cè)修復(fù)模型流程圖Fig. 4 Flow chart of error prediction and repair model
對(duì)含碳量預(yù)測(cè)模型和溫度值預(yù)測(cè)模型分別構(gòu)建誤差預(yù)測(cè)模型,反向修復(fù)原誤差值。
隨機(jī)選取總體中70%的數(shù)據(jù)作為訓(xùn)練集,30%的樣本作為驗(yàn)證集。并針對(duì)碳含量和溫度預(yù)測(cè)模型,分別引入誤差預(yù)測(cè)模型進(jìn)行修復(fù)。
碳含量預(yù)測(cè)模型,誤差修復(fù)后的預(yù)測(cè)誤差分布圖及改進(jìn)前后的預(yù)測(cè)誤差對(duì)比如圖所示:
圖5 含碳量預(yù)測(cè)模型誤差修復(fù)后的預(yù)測(cè)誤差分布圖及改進(jìn)前后的預(yù)測(cè)誤差對(duì)比Fig. 5 Prediction error distribution of carbon content prediction model after error repair and comparison of prediction error before and after improvement
溫度值預(yù)測(cè)模型,誤差修復(fù)后的預(yù)測(cè)誤差分布圖及改進(jìn)前后的預(yù)測(cè)誤差對(duì)比如圖6所示
差修復(fù)模型較好的改善了原網(wǎng)絡(luò)的誤差。改進(jìn)前和改進(jìn)后的模型誤差在波動(dòng)規(guī)律上具有相似性。這也側(cè)面反應(yīng)誤差分析網(wǎng)絡(luò)較好得描述出了誤差產(chǎn)生的原因。剩余誤差大致為誤差分析網(wǎng)絡(luò)對(duì)具體誤差大小的規(guī)則描述尚不完善,尚有改進(jìn)的余地。
在改進(jìn)后地碳含量預(yù)測(cè)在PQ [76.75-82.35]區(qū)間具有較為穩(wěn)定準(zhǔn)確的預(yù)報(bào)結(jié)果,其誤差均低于0.02。
圖6 溫度值預(yù)測(cè)模型誤差修復(fù)后的預(yù)測(cè)誤差分布圖及改進(jìn)前后的預(yù)測(cè)誤差對(duì)比Fig. 6 Prediction error distribution of temperature prediction model after correction and comparison of prediction error before and after improvement
改進(jìn)后的溫度預(yù)測(cè)在PQ [79.54-84.45]區(qū)間預(yù)測(cè)結(jié)果較為精準(zhǔn),誤差均小于1。
因此可得出結(jié)論預(yù)測(cè)模型在PQ [79.54-82.35]期間模型的C&T預(yù)測(cè)的均較為穩(wěn)定,且預(yù)測(cè)的準(zhǔn)確度較高。
另由于模型的驗(yàn)證集是由5個(gè)樣本中隨機(jī)選取30%的數(shù)據(jù)進(jìn)行驗(yàn)證,其精度較為穩(wěn)定,故可得出該模型在樣本中具有一定的普適性,其魯棒性較高。
通過(guò)建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。較精確得獲取了鋼水含碳量和溫度值的預(yù)測(cè)值,泛化能力較好,模型具有較高的魯棒性。在問(wèn)題的解決過(guò)程中,通過(guò)誤差的反向挖掘,較為準(zhǔn)確的分析出了誤差產(chǎn)生的原因,提出建立了誤差的預(yù)測(cè)模型,修復(fù)預(yù)測(cè)模型所產(chǎn)生的誤差,極大得提高了預(yù)測(cè)模型的精度。且該方法具有一定的普適性,可用于其他的預(yù)測(cè)模型和方法。