楊 磊 柴 琳 劉惠康 易 振
(1.武漢科技大學(xué)信息科學(xué)與工程學(xué)院,2.武漢科技大學(xué)冶金自動(dòng)化與檢測(cè)技術(shù)教育部工程研究中心)
RH爐(真空循環(huán)脫氣)是目前爐外精煉的主要設(shè)備之一,是一種具有脫碳、脫氣和凈化除雜功能的二次精煉爐。在精煉過(guò)程中,精準(zhǔn)控制鋼水的冶煉溫度十分重要,鋼水溫度對(duì)后續(xù)的吹氧脫碳、加鋁脫氧和合金化等工序有較大影響[1-2]。傳統(tǒng)的煉鋼大多根據(jù)經(jīng)驗(yàn)來(lái)估計(jì)鋼水的溫度,該方法既不靠譜又低效,直接影響生產(chǎn)者對(duì)后續(xù)工序的控制,導(dǎo)致鋼品質(zhì)不合格[3-5]。
為了精準(zhǔn)預(yù)測(cè)終點(diǎn)溫度,保證煉鋼工藝的質(zhì)量,學(xué)者們對(duì)煉鋼的溫度控制進(jìn)行了研究。陳偉慶、段貴生等人[6]基于神經(jīng)網(wǎng)絡(luò)建立了轉(zhuǎn)爐出鋼—連鑄過(guò)程鋼液溫度的數(shù)據(jù)模型,但是預(yù)報(bào)偏差較大,訓(xùn)練樣本較少,無(wú)法學(xué)習(xí)到完整的模型特征。丁容、劉瀏等人[7]運(yùn)用BP神經(jīng)網(wǎng)絡(luò)建立了轉(zhuǎn)爐煉鋼人工智能模型,得到的終點(diǎn)溫度預(yù)測(cè)精度較低,誤差在±10 ℃內(nèi)的命中率僅為65.4%。劉瀏、楊強(qiáng)等人[8]分析了RH精煉過(guò)程中鋼水的熱傳遞物理過(guò)程,提出了RH精煉鋼水溫度預(yù)報(bào)模型,該模型預(yù)報(bào)的準(zhǔn)確性較高,誤差在±5 ℃內(nèi)的命中率為72%。但是,該方法理論上可行,實(shí)踐時(shí)許多參數(shù)難以獲取。劉錕、劉瀏等人[9]把增量模型和神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái),提出了增量神經(jīng)網(wǎng)絡(luò)模型預(yù)報(bào),誤差在±5 ℃和±10 ℃內(nèi)的命中率分別為80%和93%,與普通的增量模型相比準(zhǔn)確度有所提高。但是該模型把重心放在了變量上,忽略了結(jié)構(gòu)的影響。王鵬鵬[10]用遺傳算法優(yōu)化支持向量機(jī),建立了終點(diǎn)溫度預(yù)報(bào)模型,誤差在±5 ℃和±10 ℃內(nèi)的命中率分別為58%和96%。該模型精度比BP神經(jīng)網(wǎng)絡(luò)和SVM命中率高,但是容易過(guò)早收斂。
針對(duì)現(xiàn)有研究成果存在的不足,文章采用支持向量回歸來(lái)建立預(yù)測(cè)模型,該模型具有較強(qiáng)的逼近能力和泛化能力。引入核函數(shù)將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題,引入松弛變量將非線性問(wèn)題轉(zhuǎn)化為凸優(yōu)化問(wèn)題,保證結(jié)果是全局最優(yōu)解。但是,僅僅依靠支持向量回歸預(yù)測(cè)終點(diǎn)溫度收斂速度較慢,精度不夠,無(wú)法達(dá)到最佳的預(yù)測(cè)效果。因此,文章引入了一種新型智能尋優(yōu)算法——食肉植物算法來(lái)優(yōu)化支持向量回歸。仿真實(shí)驗(yàn)結(jié)果表明優(yōu)化后的模型收斂速度和精度都有所提高,可以更精準(zhǔn)地預(yù)測(cè)終點(diǎn)溫度,為后序煉鋼工藝提供依據(jù)。
支持向量回歸(Support Vector Regression,SVR)[11]是支持向量機(jī)(Support Vector Machine,SVM)在回歸擬合分析上的拓展,由SVM解決分類問(wèn)題向SVR解決回歸問(wèn)題拓展。假設(shè)有p個(gè)樣本,每個(gè)樣本有n個(gè)特征,用(x1,y1),(x2,y2),…,(xp,yp)表示,則輸入量為矩陣A=[x1,x2,…,xp]T∈Rp×n,輸出量為向量Y=[y1,y2,…,yp]T∈Rp×1。
RH爐冶煉鋼鐵生產(chǎn)系統(tǒng)涉及到的非線性變量多,變量間的耦合性強(qiáng),直接處理比較復(fù)雜。將輸入空間映射到高維特征空間,在高維特征空間尋找線性回歸函數(shù),可將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題。
設(shè)建立的線性回歸函數(shù)為:
f(x)=wΦ(x)+b
(1)
式中:Φ(x)為非線性映射函數(shù);w為權(quán)值向量;b為偏置常數(shù)。
訓(xùn)練模型的過(guò)程即尋找最佳參數(shù)w,b的過(guò)程,使得預(yù)測(cè)值f(x)與真實(shí)值y之間的差最小。引入松弛變量,將上述尋找最佳w,b的問(wèn)題轉(zhuǎn)化為凸二次規(guī)劃問(wèn)題。引入Largrange函數(shù),結(jié)合KKT條件,并轉(zhuǎn)換為對(duì)偶形式,得到原問(wèn)題的對(duì)偶問(wèn)題。
(2)
最終得到的決策函數(shù)為:
(3)
式中:K(xi,xj)=Φ(xi)Φ(xj) 為核函數(shù)。
為了避免遇到高維空間中“維數(shù)災(zāi)難”問(wèn)題[12],核函數(shù)選擇高斯核函數(shù),通過(guò)在低維空間計(jì)算并把結(jié)果映射到高維空間,可以高效處理高維輸入變量。核函數(shù)參數(shù)g=1/(2σ2),可調(diào)整的σ使得高斯核函數(shù)靈活性很高[13]。
食肉植物算法(Carnivorous Plant Algorithm ,CPA)最早由Ong Kok Meng等人[14],于2020年受食肉植物如何適應(yīng)惡劣環(huán)境(比如捕食昆蟲和傳粉繁殖)的啟發(fā)而提出的一種智能優(yōu)化算法。該算法模擬了食肉植物吸引、誘捕、消化和繁殖等行為。CPA首先隨機(jī)初始化一組解決方案,然后將這些解決方案分類為食肉植物和獵物,接著依據(jù)生長(zhǎng)和繁殖過(guò)程分組。更新它們的適應(yīng)度值,組合所有解決方案。重復(fù)分組過(guò)程直到滿足停止條件。根據(jù)適應(yīng)度由小到大排序(考慮最小化問(wèn)題時(shí)),適應(yīng)度較小的解決方案被認(rèn)為是食肉植物,剩余的解決方案被認(rèn)為是獵物。使用CPA算法的目的是利用它在解決全局優(yōu)化問(wèn)題上的優(yōu)越性來(lái)尋找SVR模型中的最優(yōu)核心參數(shù)C,g值,最終提高SVR模型的性能。
肉食植物算法的具體描述如下:
Step1:初始化位置
individuali,j=Lbj+(Ubj-Lbj)×rand
(4)
式中:Ub,Lb是搜索域的上界和下界;i=1,2,…,n;j=1,2,…,d;rand為區(qū)間[0,1]內(nèi)的隨機(jī)值。
利用(4)式初始化位置后,每一行代表一個(gè)解決方案,可理解為一個(gè)個(gè)體。即有n個(gè)解決方案,每個(gè)解決方案有d個(gè)特征。
將個(gè)體位置代入適應(yīng)度函數(shù)f(x),即
f(xi)=f(individuali,1,individuali,2,…,individuali,d)
(5)
式中:xi為第i個(gè)個(gè)體的位置向量。適應(yīng)度數(shù)值越小,則解向量的質(zhì)量越高。
Step2:分類與分組
按式(5)來(lái)評(píng)估n個(gè)體的適應(yīng)度。將n個(gè)體按適應(yīng)度值由小及大排序,其中前nCPlant個(gè)個(gè)體被認(rèn)為是食肉植物,其余的nPrey個(gè)個(gè)體被認(rèn)為是獵物。
分組過(guò)程即獵物的分配過(guò)程,在上述適應(yīng)度序列中,將獵物按前后次序每nCPlant個(gè)為一組,然后把每組中的獵物依前后次序分配給對(duì)應(yīng)級(jí)別的食肉植物,如表1所示。
表1 CPA的分組過(guò)程
Step3:吸引與生長(zhǎng)
食肉植物通過(guò)散發(fā)氣味吸引、誘捕獵物,然后消化它們來(lái)生長(zhǎng)。獵物有可能會(huì)掙脫束縛而逃出陷阱。以吸引率為衡量標(biāo)準(zhǔn),文章指定為0.8。
在表1中,每一行都隨機(jī)選擇一個(gè)獵物。如果吸引率大于隨機(jī)生成的數(shù),則食肉植物會(huì)成功捕獲獵物并消化它來(lái)生長(zhǎng)。肉食植物生長(zhǎng)模型為:
NewCPi,j=growth×CPi,j+(1-growth)×Preyv,j
(6)
growth=growth_rate×randi,j
(7)
式中:CPi,j為i級(jí)食肉植物;Preyv,j為隨機(jī)選擇的獵物;growth_rate為待設(shè)定的生長(zhǎng)率;randi,j為區(qū)間[0,1]內(nèi)的隨機(jī)數(shù)。
如果吸引率小于隨機(jī)生成的數(shù),則食肉植物會(huì)失手,獵物掙脫逃生。數(shù)學(xué)描述為:
NewPreyi,j=growth×Preyu,j+(1-growth)×Preyv,j,u≠v
(8)
growth=
(9)
式中:Preyu,j為另一個(gè)隨機(jī)選擇的i級(jí)獵物。食肉植物與獵物的生長(zhǎng)周而復(fù)始,直到達(dá)到指定的迭代次數(shù),group_iter。
Step4:消化與繁殖
食肉植物消化吸收獵物,進(jìn)而生長(zhǎng)繁殖。只有1級(jí)食肉植物允許繁殖。
NewCPi,j=CP1,j+Reproduction_rate×randi,j×matei,j
(10)
(11)
式中:CP1,j為最優(yōu)解;CPv,j為隨機(jī)選取的食肉植物;繁殖率Reproduction_rate為設(shè)定值。這個(gè)過(guò)程會(huì)重復(fù)nCPlant次。
Step5:適應(yīng)度更新與組合
將新生成的食肉植物和獵物與之前的原始種群結(jié)合(即來(lái)自原始種群的n個(gè)個(gè)體、來(lái)自生長(zhǎng)過(guò)程的nCPlant(group_iter)個(gè)個(gè)體和來(lái)自繁殖過(guò)程的nCPlant個(gè)個(gè)體),得到一個(gè)[n+nCPlant(group_iter)+nCPlant]×d維的新種群。依據(jù)適應(yīng)度由小及大排序,最優(yōu)個(gè)體為新的候選解。
Step6:停止準(zhǔn)則
重復(fù)分類、分組、生長(zhǎng)和繁殖過(guò)程,直到終止條件得到滿足。
上述步驟模擬了食肉植物的生長(zhǎng)、繁殖和捕食等過(guò)程,以及獵物的逃脫、生長(zhǎng)等過(guò)程。
采用某鋼廠2020年1月份31天的RH煉鋼數(shù)據(jù),剔除異常數(shù)據(jù)和補(bǔ)全缺漏數(shù)據(jù),篩選出362組實(shí)際生產(chǎn)數(shù)據(jù)建立數(shù)據(jù)庫(kù)。從中隨機(jī)抽取240組訓(xùn)練模型,其余122組測(cè)試模型的精度。對(duì)模型的輸入與輸出進(jìn)行歸一化處理可消除影響RH爐終點(diǎn)溫度的因素?cái)?shù)量級(jí)相差較大,單位也不盡相同的差異,利用式(12)將輸入與輸出映射到[-1,1]區(qū)間。
(12)
式中:xi為第i個(gè)原始輸入或輸出;xmax和xmin分別為原始輸入或輸出的最大值和最小值;xj為第j個(gè)原始輸入或輸出歸一化映射后的輸入或輸出。
將終點(diǎn)溫度作為因變量,與鋼水質(zhì)量,開(kāi)始溫度,處理時(shí)間,吹氧量,平臺(tái)溫度等影響因素做相關(guān)性分析。計(jì)算得到各個(gè)影響因素對(duì)終點(diǎn)溫度的皮爾遜(Pearson)相關(guān)系數(shù),舍去相關(guān)性不顯著的影響因素(絕對(duì)值小于0.05),選取相關(guān)性較為顯著的影響因素作為自變量[15],終點(diǎn)溫度影響因素的皮爾遜相關(guān)系數(shù)見(jiàn)表2。
表2 終點(diǎn)溫度影響因素的皮爾遜相關(guān)系數(shù)
通過(guò)相關(guān)性分析,確定輸入變量為:罐況、鋼水質(zhì)量、渣厚、開(kāi)始溫度、平臺(tái)溫度、真空度、到站氧含量、處理時(shí)間、氮?dú)辶髁俊⒋笛趿俊?/p>
傳統(tǒng)的SVR依靠網(wǎng)格搜索法來(lái)確定核函數(shù)參數(shù)g和懲罰因子C,兩組數(shù)值交織成網(wǎng),通過(guò)全局搜索找到誤差最小的交叉點(diǎn)對(duì)應(yīng)的(g,C)坐標(biāo)。參數(shù)的選擇沒(méi)有任何指導(dǎo),需要反復(fù)調(diào)整參數(shù)的變化步長(zhǎng)和范圍,預(yù)報(bào)的偏差可能較大。為了提高預(yù)測(cè)模型的收斂速度和精度,避免盲目選擇參數(shù),引入CPA算法來(lái)優(yōu)化SVR[16-18]。利用2.2節(jié)的模型輸入,結(jié)合SVR原理,按以下步驟建模:
(1)將362組原始數(shù)據(jù)做歸一化處理。
(2)初始化或更新C,g,ε參數(shù)。
(3)求解原問(wèn)題的對(duì)偶問(wèn)題,得到參數(shù)w,b。
(4)將結(jié)果代入SVR線性回歸函數(shù)f(x)中,得到RH爐預(yù)測(cè)模型。
(5)判斷模型的精度,偏差較大則返回第二步,直到滿足要求為止。
為了評(píng)判模型的擬合程度,文章以平均誤差MAE、均方根誤差RMSE、相關(guān)系數(shù)R2和預(yù)報(bào)命中率(誤差絕對(duì)值在5 ℃以內(nèi)視為預(yù)報(bào)命中)作為模型的評(píng)判指標(biāo)。
(13)
(14)
(15)
式中:N是測(cè)試集樣本數(shù)據(jù)的總數(shù);Xtesti是測(cè)試樣本數(shù)據(jù);Xpredicti是預(yù)測(cè)數(shù)據(jù)。
為了直觀地、科學(xué)地判斷模型的效果,將食肉植物算法優(yōu)化的支持向量回歸(CPA-SVR模型)與多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)、支持向量回歸(SVR)三個(gè)模型作對(duì)比。在同一臺(tái)電腦上利用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn),訓(xùn)練240組數(shù)據(jù),測(cè)試122組數(shù)據(jù)。表3為四種模型終點(diǎn)溫度預(yù)測(cè)值對(duì)比。
表3 四種模型終點(diǎn)溫度預(yù)測(cè)值對(duì)比
多元線性回歸的模型為Y=KX+b?y=k1x1+k2x2+…+knxn+b,以2.2節(jié)提到的10個(gè)輸入量為自變量,以終點(diǎn)溫度為因變量,建立了10輸入1輸出的線性回歸模型。
BP神經(jīng)網(wǎng)絡(luò)模型,包含輸入層、隱含層和輸出層。首先按2.1節(jié)的方法進(jìn)行歸一化處理,然后反復(fù)調(diào)整隱含層節(jié)點(diǎn)數(shù)進(jìn)行實(shí)驗(yàn),最終得到最佳隱含層節(jié)點(diǎn)數(shù)為11,即結(jié)構(gòu)為10-11-1的BP神經(jīng)網(wǎng)絡(luò)模型。
建立SVR模型,取回歸誤差ε=0.01,利用網(wǎng)格搜索法,進(jìn)行5折交叉驗(yàn)證,得到最佳的參數(shù)C=22.0,g=2-6.9。
按2.3節(jié)所述步驟進(jìn)行操作,選取適應(yīng)度函數(shù)為模型的平均絕對(duì)誤差MAE來(lái)建立CPA-SVR模型。通過(guò)調(diào)整參數(shù),得到終點(diǎn)溫度預(yù)測(cè)模型的最優(yōu)參數(shù)(C=1.0721,g=0.0793,ε=0.01)。進(jìn)而建立RH爐煉鋼終點(diǎn)溫度預(yù)測(cè)模型。
仿真實(shí)驗(yàn)結(jié)果表明,對(duì)于終點(diǎn)溫度的預(yù)測(cè),CPA-SVR模型的預(yù)測(cè)誤差在1.9 ℃左右,多元線性回歸模型的預(yù)測(cè)誤差在4.2 ℃左右,BP模型的預(yù)測(cè)誤差在2.9 ℃左右,SVR模型的預(yù)測(cè)誤差在2.2 ℃左右。CPA-SVR模型的相關(guān)系數(shù)R2為0.8768,在四個(gè)模型中最接近于1,略高于SVR模型的0.8530,高于BP模型的0.8464,遠(yuǎn)高于線性回歸模型的0.5915。這說(shuō)明CPA-SVR模型的擬合效果最好,多元線性回歸模型的擬合效果最差。精度要求|Δt|≤5 ℃,即預(yù)測(cè)值與真實(shí)值的差值在±5 ℃以內(nèi);CPA-SVR模型僅有8個(gè)爐次不符合,SVR模型有12個(gè)爐次不符合,BP模型有20個(gè)爐次不符合,多元線性回歸模型多達(dá)40個(gè)爐次不符合。
CPA-SVR模型和BP模型的預(yù)測(cè)誤差如圖1所示。從圖1可以看出,CPA-SVR模型有8個(gè)誤差點(diǎn)落在了±5 ℃的誤差范圍外,命中率達(dá)到了93.442 6%;全部誤差點(diǎn)都在±10 ℃以內(nèi),命中率達(dá)100%。BP模型有20個(gè)誤差點(diǎn)落在了±5 ℃的誤差范圍外,命中率達(dá)到了83.606 6%;2個(gè)誤差點(diǎn)不在±10 ℃誤差線以內(nèi),命中率達(dá)98.360 7%。綜上所述,CPA-SVR模型在終點(diǎn)溫度預(yù)測(cè)上確實(shí)優(yōu)于另外三種模型,預(yù)測(cè)精度均表現(xiàn)為最高,可以為后序煉鋼工序的展開(kāi)提供溫度參考。
圖1 CPA-SVR模型和BP模型預(yù)測(cè)誤差對(duì)比
(1)溫度對(duì)煉鋼工藝的開(kāi)展至關(guān)重要,受限于工藝環(huán)境只能預(yù)測(cè)溫度,現(xiàn)有的模型精度和收斂速度無(wú)法同時(shí)滿足工藝要求,需要更為契合的終點(diǎn)溫度預(yù)測(cè)模型。文章將尋優(yōu)性能較好的CPA算法和支持向量回歸結(jié)合起來(lái),提高了模型的收斂速度和精度,對(duì)終點(diǎn)溫度預(yù)測(cè)有一定的參考價(jià)值。
(2)針對(duì)利用網(wǎng)格搜索法選擇支持向量回歸(SVR)的參數(shù)較為繁瑣的問(wèn)題,引入了食肉植物算法(CPA)來(lái)優(yōu)化SVR的方法,利用CPA算法優(yōu)秀的全局尋優(yōu)性能尋找最佳的SVR參數(shù),并將CPA-SVR預(yù)測(cè)模型運(yùn)用到RH爐鋼水終點(diǎn)溫度預(yù)測(cè)上。
(3)根據(jù)冶金工藝流程,結(jié)合相關(guān)性分析,選擇了與終點(diǎn)溫度相關(guān)性較為顯著的因素,將這些因素作為自變量,終點(diǎn)溫度作為因變量,依次建立了基于多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)、SVR和CPA-SVR的四種終點(diǎn)溫度預(yù)測(cè)模型。通過(guò)362組實(shí)際生產(chǎn)數(shù)據(jù)測(cè)試CPA-SVR預(yù)測(cè)模型,結(jié)果表明,終點(diǎn)溫度預(yù)測(cè)的絕對(duì)誤差|Δt|≤5 ℃條件下的命中率可達(dá)到93.442 6%,該模型在終點(diǎn)溫度預(yù)測(cè)效果上比多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)和未優(yōu)化的SVR模型好,命中率更高。