盛曉靜,吳永明,2+,李少波,劉天松,劉應(yīng)波
(1.貴州大學(xué) 現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;2.貴州財(cái)經(jīng)大學(xué) 信息學(xué)院,貴州 貴陽 550004;3.云南財(cái)經(jīng)大學(xué) 云南省經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究院,云南 昆明 650221)
近年來,時(shí)間序列數(shù)據(jù)分析一直是機(jī)器學(xué)習(xí)活躍研究的主題,其中時(shí)間序列預(yù)測(cè)作為時(shí)序數(shù)據(jù)分析的一個(gè)分支,在各個(gè)領(lǐng)域具有重要的作用,如金融、能源、工業(yè)生產(chǎn)等[1]。ZHOU等[2]利用一種基于因子分解機(jī)的神經(jīng)網(wǎng)絡(luò)混合方法,通過分析股票價(jià)格的時(shí)間序列數(shù)據(jù)來預(yù)測(cè)股票市場(chǎng)趨勢(shì);QIAO等[3]提出一種新的基于自適應(yīng)濾波器和改進(jìn)優(yōu)化算法的混合預(yù)測(cè)模型,對(duì)天然氣消耗量進(jìn)行短期預(yù)測(cè),為天然氣企業(yè)實(shí)現(xiàn)智能調(diào)度提供參考;宋震等[4]以BP(back propagation)神經(jīng)網(wǎng)絡(luò)為技術(shù)基礎(chǔ),對(duì)旋轉(zhuǎn)機(jī)械設(shè)備的振動(dòng)頻率進(jìn)行高效時(shí)間序列預(yù)測(cè)。目前時(shí)間序列預(yù)測(cè)在工業(yè)生產(chǎn)領(lǐng)域的研究正步入一個(gè)新的階段,對(duì)提高工業(yè)生產(chǎn)效率具有重要意義。
在工業(yè)生產(chǎn)方面,通常采用機(jī)器學(xué)習(xí)模型對(duì)工業(yè)生產(chǎn)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè)。馬健等[5]利用改進(jìn)遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)參數(shù),實(shí)現(xiàn)智能電能計(jì)量設(shè)備退化趨勢(shì)的向后預(yù)測(cè)與更新;KOOPIALIPOOR等[6]提出一種基于數(shù)據(jù)分組處理方法(Group Method of Data Handing,GMDH)的隧道掘進(jìn)機(jī)侵徹速度預(yù)測(cè)新模型,該模型在預(yù)測(cè)侵徹速度方面效果較好;萬文波等[7]提出一種改進(jìn)自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)(Adaptive Network-based Fuzzy Inference System,ANFIS)模型,可以判斷刀具加工狀態(tài)并執(zhí)行換刀策略,完成了刀具狀態(tài)監(jiān)測(cè)系統(tǒng)開發(fā)并應(yīng)用于實(shí)際生產(chǎn)加工。在“鋁”工業(yè)方面,鋁生產(chǎn)效率在鋁電解生產(chǎn)工藝中是一個(gè)重要指標(biāo),因此生產(chǎn)工藝時(shí)序數(shù)據(jù)分析對(duì)提高鋁電解生產(chǎn)效率具有指導(dǎo)意義。劉天松等[8]提出一種基于自適應(yīng)生長(zhǎng)層次神經(jīng)氣模型,通過分析鋁電解過程雜質(zhì)元素時(shí)間序列數(shù)據(jù),準(zhǔn)確、有效地監(jiān)測(cè)和控制鋁電解工藝過程;孫長(zhǎng)好等[9]提出一種改進(jìn)的ID3算法,對(duì)鋁電解數(shù)據(jù)庫(kù)中包含的出鋁量專家知識(shí)和經(jīng)驗(yàn)進(jìn)行知識(shí)表示和自動(dòng)推理,從而生成出鋁量決策規(guī)則。
然而,上述模型隨著迭代次數(shù)的增加易出現(xiàn)局部最優(yōu)和收斂速度慢的問題,本文以預(yù)測(cè)鋁電解工藝中的雜質(zhì)含量為切入點(diǎn),針對(duì)在鋁電解工藝生產(chǎn)中缺少對(duì)時(shí)間序列數(shù)據(jù)全局高效的預(yù)測(cè)模型,提出一種基于生長(zhǎng)神經(jīng)氣改進(jìn)自適應(yīng)神經(jīng)模糊系統(tǒng)(Growing Neural Gas improved Adaptive Network-based Fuzzy Inference System,GNG-ANFIS)的混合時(shí)序預(yù)測(cè)模型。
生長(zhǎng)神經(jīng)氣(Growing Neural Gas,GNG)算法是一種無監(jiān)督聚類算法,FRITZKE[10]最早提出一種無監(jiān)督的GNG算法,該算法具有全局競(jìng)爭(zhēng)特性。GNG網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)隨著新數(shù)據(jù)輸入動(dòng)態(tài)調(diào)整,即GNG神經(jīng)網(wǎng)絡(luò)中的獲勝節(jié)點(diǎn)可以動(dòng)態(tài)跟蹤數(shù)據(jù),從而實(shí)時(shí)監(jiān)測(cè)時(shí)間序列數(shù)據(jù);吳永明[11]等通過控制節(jié)點(diǎn)生成機(jī)制的GNG來分析與控制燃煤鍋爐數(shù)據(jù)動(dòng)態(tài)特征,實(shí)現(xiàn)了對(duì)時(shí)序數(shù)據(jù)的實(shí)時(shí)跟蹤。工業(yè)生產(chǎn)中采集的數(shù)據(jù)具有量大、冗余的特點(diǎn),本文將采用GNG算法動(dòng)態(tài)跟蹤原始數(shù)據(jù),通過識(shí)別奇異點(diǎn)篩選樣本數(shù)據(jù),以提高預(yù)測(cè)階段的效率。
GNG中更新節(jié)點(diǎn)Sn的局部誤差
ESn=ESn+||x-Sn||2。
(1)
通過調(diào)整節(jié)點(diǎn)權(quán)值系數(shù)α1和α2來調(diào)整獲勝節(jié)點(diǎn)和鄰域節(jié)點(diǎn)的權(quán)重,公式如下:
Wn=Wn+α1×(X-Wn);
(2)
Wn*=Wn*+α2×(X-Wn*)。
(3)
式中:Wn,Wn*,X分別為獲勝節(jié)點(diǎn)權(quán)重、鄰域節(jié)點(diǎn)權(quán)重、輸入樣本。
生成新節(jié)點(diǎn)Snewnode的過程如下:
Snewnode=0.5×(Smax1+Smax2);
(4)
Enewnode=0.5×Emax。
(5)
式中:Smax1,Smax2表示獲勝節(jié)點(diǎn)、次獲勝節(jié)點(diǎn);Emax,Enewnode表示獲勝節(jié)點(diǎn)和新增節(jié)點(diǎn)的誤差。
ANFIS是一種神經(jīng)網(wǎng)絡(luò)與模糊邏輯相結(jié)合的模糊神經(jīng)網(wǎng)絡(luò),已被運(yùn)用到各種復(fù)雜工程問題中[12]。ANFIS通過模擬人類的推理方式形成模糊系統(tǒng),并運(yùn)用一組模糊規(guī)則建立語言模型;采用神經(jīng)網(wǎng)絡(luò)進(jìn)行模糊化、模糊推理和反模糊化,從輸入輸出數(shù)據(jù)中提取模糊規(guī)則,通過離線訓(xùn)練和在線學(xué)習(xí)算法調(diào)整模糊推理控制規(guī)則。然而,這種傳統(tǒng)的網(wǎng)絡(luò)模型很容易在訓(xùn)練過程中陷入局部最優(yōu),因此本文采用基于粒子群算法改進(jìn)的黑猩猩優(yōu)化算法( Particle swarm optimization based improved Chimpanzee Optimization Algorithm,PChOA)對(duì)ANFIS網(wǎng)絡(luò)進(jìn)行優(yōu)化。
本文所提混合預(yù)測(cè)模型GNG-ANFIS的具體建模流程分為兩個(gè)主要階段:①奇異點(diǎn)識(shí)別階段,即用GNG算法對(duì)收集到的原始時(shí)間序列數(shù)據(jù)進(jìn)行動(dòng)態(tài)跟蹤和異常識(shí)別;②預(yù)測(cè)階段,即用改進(jìn)后的群體智能算法對(duì)傳統(tǒng)模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,并進(jìn)行實(shí)例預(yù)測(cè)。圖1所示為混合預(yù)測(cè)模型的建立流程。
GNG模型能隨數(shù)據(jù)的輸入動(dòng)態(tài)生成獲勝節(jié)點(diǎn),從而跟蹤監(jiān)測(cè)實(shí)時(shí)數(shù)據(jù)。本文利用GNG算法的特性,在模型訓(xùn)練階段動(dòng)態(tài)跟蹤采集到的原始數(shù)據(jù)并捕獲奇異點(diǎn),將篩選的數(shù)據(jù)作為模型訓(xùn)練的有效數(shù)據(jù)來提高預(yù)測(cè)效率。在動(dòng)態(tài)跟蹤時(shí)間序列數(shù)據(jù)時(shí),若某個(gè)節(jié)點(diǎn)的獲勝次數(shù)超過輸入樣本量的70%,則將該獲勝節(jié)點(diǎn)設(shè)為奇點(diǎn),具體判定條件為
Tsn>0.7Q。
(6)
式中:TSn為節(jié)點(diǎn)Sn的獲勝次數(shù);Q為輸入的樣本量。同時(shí)對(duì)奇點(diǎn)進(jìn)行判斷,若奇點(diǎn)超出指標(biāo)閾值范圍,則為跟蹤到的奇異點(diǎn)。
2.2.1 改進(jìn)黑猩猩優(yōu)化算法
在自然界中,黑猩猩的社會(huì)是一個(gè)裂變?nèi)诤系纳鐣?huì),其社會(huì)成員都有特殊的能力和職責(zé),即每個(gè)黑猩猩都能以自己特有的能力搜索特定的空間[13]。捕食過程中的黑猩猩分為驅(qū)動(dòng)者、屏障者、追逐者和攻擊者4種角色。黑猩猩優(yōu)化算法(Chimpanzee Optimization Algorithms,ChOAs)是一種基于群體智能的算法,自然界中不同群體在局部和全局搜索問題空間上采用的搜索策略也不同,具有獨(dú)立群的ChOAs適應(yīng)更廣泛的優(yōu)化問題。然而在社會(huì)激勵(lì)下,黑猩猩可能會(huì)放棄自身職責(zé)獨(dú)自覓食,此時(shí)ChOAs仍可能陷入局部最優(yōu),收斂速度變慢。為此,本文提出PChOA,其數(shù)學(xué)建模過程如下:
(1)黑猩猩驅(qū)趕和追逐獵物階段的數(shù)學(xué)模型
黑猩猩驅(qū)趕和追逐獵物階段的數(shù)學(xué)模型如下:
d=|cXprey(t)-mXchimp(t)|;
(7)
Xchimp(t+1)=Xprey(t)-ad。
(8)
式中:d為黑猩猩與獵物之間的距離;Xprey和Xchimp分別為獵物和黑猩猩的位置向量;t為當(dāng)前迭代次數(shù);a,m,c為系數(shù)向量,
a=2fr1-a,
(9)
c=2r2,
(10)
m=Chaotic·value。
(11)
式中:f通過迭代過程非線性地從2降至0;r1和r2為[0,1]范圍內(nèi)的隨機(jī)向量;m為混沌映射矢量,具有一定的遍歷性和有序性,表示黑猩猩在狩獵過程中受社會(huì)激勵(lì)行為影響的程度;Chaotic·value為基于各種混沌映射計(jì)算的混沌向量。
(2)探索階段的數(shù)學(xué)模型
驅(qū)動(dòng)者、屏障者、追逐者和攻擊者在驅(qū)趕、圍堵、追逐、捕獵過程中的數(shù)學(xué)模型如下:
dAttacker=|c1XAttacker-ωm1x|,
dBarrier=|c2XBarrier-ωm2x|,
dChaser=|c3XChaser-ωm3x|,
dDriver=|c4XDriver-ωm4x|;
(12)
X1=XAttacker-a1(dAttacker),
X2=XBarrier-a2(dBarrier),
X3=XChaser-a3(dChaser),
X4=XDriver-a4(dDrier);
(13)
(14)
(15)
式中:dAttacker,dBarrier,dChaser,dDriver為攻擊者、障礙者、驅(qū)趕者、追趕者分別與獵物之間的距離;c1,c2,c3,c4為狩獵過程中障礙物阻擋黑猩猩捕獵的影響因子;ω∈[0.5,1],為慣性常數(shù);m1,m2,m3,m4均為混沌映射矢量;X1,X2,X3,X4為攻擊者、障礙者、驅(qū)趕者、追趕者更新后的位置向量;XAttacker,XBarrier,XChaser,XDriver為攻擊者、障礙者、驅(qū)趕者、追趕者的位置向量;Vik和Xik表示第k次迭代時(shí),第i個(gè)粒子的速度及所在的位置向量。
(3)剝削階段的數(shù)學(xué)模型
黑猩猩會(huì)分頭尋找獵物,并聚集攻擊獵物。|a|>1時(shí)迫使黑猩猩與獵物分離,避免陷入局部最優(yōu),|a|<1則迫使黑猩猩在獵物位置收斂(即全局最優(yōu)處收斂),其中a∈[-2f,2f]。
(4)社會(huì)激勵(lì)影響階段的數(shù)學(xué)模型
最后階段,黑猩猩的行為在社會(huì)激勵(lì)影響下會(huì)變得混亂,不再嚴(yán)格遵守自己的職責(zé),開始混無序地奪取獵物,這種行為可用混沌映射來模擬更新過程,具體如下:
(16)
式中μ∈[0,1]。目前模擬黑猩猩混亂行為的混沌地圖[14]有6種,具體如表1所示。
表1 各混沌地圖的數(shù)學(xué)模型
圖2所示為6種混沌地圖在同一時(shí)間尺度下的振幅映射效果。可見圖2在模擬黑猩猩最后階段的混沌行為時(shí),隨著時(shí)間尺度的不斷增大,Gauss/mouse Map振幅逐漸趨于穩(wěn)定,反映其映射效果在6種混沌地圖中表現(xiàn)最好。因此本文在實(shí)例中采用的混沌地圖為Gauss/mouse Map。
為進(jìn)一步驗(yàn)證PChOA的有效性,采用單峰基準(zhǔn)函數(shù)和多峰基準(zhǔn)函數(shù)為客觀搜索空間,并與多種元啟發(fā)式算法進(jìn)行對(duì)比,驗(yàn)證其有效性。
圖3所示為在以單峰基準(zhǔn)函數(shù)為客觀搜索空間下,各智能算法的迭代收斂情況。由圖可知,在同樣的單峰基準(zhǔn)函數(shù)客觀搜索空間下,對(duì)比變異粒子群優(yōu)化(Momentum Particle Swarm Optimization,MPSO)算法、粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法、目標(biāo)自適應(yīng)協(xié)同粒子群優(yōu)化(Target-Adaptive Cooperative Particle Swarm Optimization,TACPSO)算法、PChOA算法在迭代300次后收斂速度最快且未陷入局部最優(yōu),其余算法在迭代500次時(shí)陷入局部最優(yōu),且最優(yōu)值分別為100.2,101,103.5,10-2。以多峰基準(zhǔn)函數(shù)為客觀搜索空間的全局收斂性對(duì)比如圖4所示,PChOA算法相比于其他4類啟發(fā)式算法收斂速度最快,而且隨著迭代次數(shù)的增加,整個(gè)過程并未陷入局部最優(yōu),其他4類算法的局部收斂最優(yōu)值分別為MPSO(100.3),PSO(101),TACPSO(106),Chimp(100.2)。因此,改進(jìn)的PChOA算法具有收斂速度快、全局最優(yōu)的特點(diǎn)。
PChOA算法偽代碼如下:
1.初始化黑猩猩Xi(i=1,2,…,n)
2.初始化f,m,a,c
3.計(jì)算Position(i),i=1,2,…,n
4.初始化XAttacker,XBarrier,XChaser,XDriver和Attacker_pos,Chaser_pos,Barrier_pos,Driver_pos
5.While t 6. for XChimp(i) 7.XChimp(i)→XAttacker,XChaser,XBarrier,XDriver 8.更新f,m,c,a,d 9. end for 10. for XSearch_Chimp(i) 11.If μ>0.5 12. if |a|<1 13.XChimp(t+1)=Xprey(t)-a·d 14. else XChimp(t+1)←random 15. end if 16. else if μ>0.5 17.XChimp(t+1)=Chaotic.value 18. end if 19. V(i,j)=ω*[V(i,j)+c1r1(X1-Position(i,j))+c2r2(X2-Position(i,j))+c3r3(X3-Position(i,j))+c4r4(X4-Position(i,j))] 20.Position(i,j)=Position(i,j)+V(i,j) 21. end for 22.更新f,m,a,c 23.更新XAttacker,XBarrier,XChaser,XDriver和Attacker_pos,Chaser_pos,Barrier_pos,Driver_pos 24.t=t+1 25.end while 26.return XAttacker 2.2.2 改進(jìn)ANFIS模型 針對(duì)傳統(tǒng)ANFIS模型易陷入局部最優(yōu)的問題[14],本文提出利用全局優(yōu)化智能算法PChOA來改進(jìn)ANFIS模型。 改進(jìn)ANFIS模型的數(shù)學(xué)建模過程如下: (1)調(diào)整參數(shù) 利用改進(jìn)算法PChOA對(duì)所需參數(shù)進(jìn)行優(yōu)化。 (2)模糊化 輸出的是輸入模糊成員的等級(jí),由式(17)給出: (17) (3)模糊規(guī)則的加權(quán) 符號(hào)M表示該層中的每個(gè)固定節(jié)點(diǎn),通過模糊化計(jì)算出的隸屬度值計(jì)算發(fā)射強(qiáng)度Wk,并計(jì)算輸出 i,j=1,2。 (18) 對(duì)第2層的輸出進(jìn)行歸一化: k=1,2。 (19) (4)去模糊化 在該層計(jì)算每個(gè)節(jié)點(diǎn)經(jīng)過模糊規(guī)則后的加權(quán)均值,公式為 k=1,2。 (20) (5)總和 對(duì)去模糊化層中所有傳入信號(hào)的輸出進(jìn)行求和,并計(jì)算輸出。具體求和公式為 (21) GNG-ANFIS模型的輸入變量為時(shí)序數(shù)據(jù),輸出變量為經(jīng)模型計(jì)算的預(yù)測(cè)值。本文實(shí)例以鋁電解中的鐵含量和預(yù)測(cè)值為混合模型的輸入變量和輸出變量。劃分時(shí)序數(shù)據(jù)常用自上而下(Top-Down,TD)、自下而上(Bottom-Up,BU)和滑動(dòng)窗口(Slide Windows,SW)3種方法[15],本文采用滑動(dòng)窗口法。窗口將時(shí)間序列的第一個(gè)數(shù)據(jù)點(diǎn)初始化為一個(gè)分段的左端點(diǎn),通過順序掃描時(shí)序數(shù)據(jù)來尋找分段的右端點(diǎn)。可以利用前一個(gè)時(shí)間步長(zhǎng)預(yù)測(cè)下一個(gè)時(shí)間步長(zhǎng),窗口沿時(shí)間方向滑動(dòng)一個(gè)時(shí)間單位便構(gòu)造出單個(gè)訓(xùn)練樣本。假設(shè)整個(gè)樣本的范圍為L(zhǎng),滑動(dòng)時(shí)間窗口大小為w,則分割的時(shí)間序列為[1,…,w],[2,…,w+1],…,[L-w+1,…,L],共得到L-w+1個(gè)子樣本。 構(gòu)建混合模型的具體步驟如下: 步驟1初始化GNG參數(shù),并利用GNG對(duì)時(shí)序數(shù)據(jù)進(jìn)行動(dòng)態(tài)跟蹤監(jiān)測(cè)。 步驟2當(dāng)出現(xiàn)奇異點(diǎn)時(shí),從奇異點(diǎn)之后訓(xùn)練數(shù)據(jù),以提高數(shù)據(jù)質(zhì)量。 步驟3將處理后的數(shù)據(jù)按照設(shè)置的滑動(dòng)窗口構(gòu)造時(shí)間序列數(shù)據(jù)集。 步驟4按照短期預(yù)測(cè)劃分規(guī)則,從步驟3構(gòu)造的時(shí)間序列數(shù)據(jù)集選取一定比例的數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集。實(shí)例預(yù)測(cè)中按7∶3比例劃分為訓(xùn)練集和測(cè)試集。 步驟5初始化PChOA的相關(guān)參數(shù)。 步驟6將相關(guān)參數(shù)代入改進(jìn)的PChOA優(yōu)化算法,尋優(yōu)獲得最佳值。 步驟7利用步驟6尋優(yōu)獲得的最佳值作為ANFIS網(wǎng)絡(luò)所需的參數(shù)值。 步驟8利用優(yōu)化后的參數(shù)搭建ANFIS網(wǎng)絡(luò)。 步驟9實(shí)例預(yù)測(cè)。 鋁電解生產(chǎn)工藝中鋁液雜質(zhì)含量最多的是鐵元素,而鐵的主要來源有原料、電解槽及操作過程中使用的鐵制工具,雜質(zhì)含量超標(biāo)會(huì)影響鋁的性能和品質(zhì)。為了在生產(chǎn)過程中提高鋁的質(zhì)量,需要利用高效精準(zhǔn)的預(yù)測(cè)模型對(duì)鐵含量進(jìn)行預(yù)測(cè)分析,及時(shí)向管理者發(fā)出預(yù)警。根據(jù)不同生產(chǎn)標(biāo)準(zhǔn)和產(chǎn)品質(zhì)量要求,鐵含量的閾值范圍設(shè)置在0.17%~0.26%。為進(jìn)一步驗(yàn)證本文模型的可行性和有效性,本文選取貴陽一鋁廠電解槽2020年3月~2020年8月連續(xù)時(shí)間段內(nèi)電解產(chǎn)物中的鐵含量百分比時(shí)序數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象。原始時(shí)間序列數(shù)據(jù)(鐵含量%)如圖5所示。 圖5中,電解槽鋁液的鐵含量隨時(shí)間推移呈波動(dòng)式增長(zhǎng),最高值達(dá)到0.278%,超出工廠標(biāo)準(zhǔn),嚴(yán)重影響了鋁液的純度和鋁的質(zhì)量,因此預(yù)測(cè)鋁電解中的鐵含量尤為重要。 奇異點(diǎn)在工業(yè)數(shù)據(jù)上通常指新奇、異常的數(shù)據(jù)點(diǎn)[8]。為了高效預(yù)測(cè)鋁電解中的鐵含量時(shí)序數(shù)據(jù),本文采用GNG算法對(duì)鐵含量時(shí)序數(shù)據(jù)進(jìn)行動(dòng)態(tài)跟蹤。由于實(shí)驗(yàn)對(duì)象采集數(shù)據(jù)的間隔為1天,本文將滑動(dòng)窗口大小設(shè)定為[14]2,3,4,5,單位長(zhǎng)度(單位:天)分別為2,3,4,5。在不同滑動(dòng)窗口下,采用GNG算法動(dòng)態(tài)跟蹤鐵含量并捕獲奇異點(diǎn),具體如圖6所示。 圖6中,當(dāng)窗口大小為2時(shí),奇異點(diǎn)坐標(biāo)為(37,0.16);當(dāng)窗口大小為3時(shí),奇異點(diǎn)坐標(biāo)為(34,0.13);當(dāng)窗口大小為4時(shí),奇異點(diǎn)為坐標(biāo)(41,0.168);當(dāng)窗口大小為5時(shí),奇異點(diǎn)坐標(biāo)為(43,0.16)。采用計(jì)算成本減少率RCC衡量模型在訓(xùn)練過程中計(jì)算所需的數(shù)據(jù)量,從而評(píng)估模型訓(xùn)練時(shí)的效率,公式為 (22) 式中:N1為篩選后的樣本量;N為原始樣本量。 表2所示為各模型的計(jì)算成本,其他模型表示GMDH模型、ANFIS模型、差分進(jìn)化改進(jìn)的自適應(yīng)神經(jīng)模糊系統(tǒng)(Differential Evolution improved Adaptive Network-based Fuzzy Inference System,DE-ANFIS)模型、粒子群優(yōu)化改進(jìn)的自適應(yīng)神經(jīng)模糊系統(tǒng)(Particl Swarm Optimization improved Adaptive Network-based Fuzzy Inference System, PSO-ANFIS)模型。對(duì)比各模型預(yù)測(cè)時(shí)的RCC值可知,本文GNG-ANFIS在各個(gè)窗口下的RCC最高,訓(xùn)練樣本最少,即模型訓(xùn)練時(shí)間最短。 表2 各模型的計(jì)算成本 % 本文根據(jù)預(yù)測(cè)精度選擇滑動(dòng)窗口。表3所示為各因素對(duì)預(yù)測(cè)結(jié)果的影響,可見窗口不同、奇異點(diǎn)位置不同,對(duì)模型GNG-ANFIS的預(yù)測(cè)結(jié)果的影響不同,當(dāng)窗口設(shè)置為2(天)時(shí),預(yù)測(cè)效果最佳。 對(duì)比分析PChOA-ANFIS(無奇異點(diǎn)識(shí)別)與GNG-ANFIS模型,如表4所示??梢?GNG-ANFIS模型的預(yù)測(cè)效果均優(yōu)于PChOA-ANFIS;在時(shí)間消耗方面,兩種模型的時(shí)間復(fù)雜度分別為O(Imn+n2)和O(Ibmn+(1+b2)n2)(設(shè)樣本個(gè)數(shù)、種群規(guī)模、迭代次數(shù)分別為n,m和I,b為實(shí)際樣本在全部樣本中的占比,0 利用GNG-ANFIS模型預(yù)測(cè)經(jīng)奇異點(diǎn)篩選后的鐵含量時(shí)序數(shù)據(jù),同時(shí)采用對(duì)比分析的方法驗(yàn)證本文構(gòu)建的模型。模型參數(shù)設(shè)置是根據(jù)多次實(shí)驗(yàn)結(jié)果,選出一組預(yù)測(cè)效果最理想的參數(shù),如表5所示(其他模型特有參數(shù)請(qǐng)參考文獻(xiàn)[16-17]的設(shè)置)。 表5 模型相關(guān)參數(shù)設(shè)置 續(xù)表5 針對(duì)鋁電解生產(chǎn)過程中同一組鐵含量時(shí)序數(shù)據(jù),對(duì)比上述5種模型的預(yù)測(cè)性能。分別采用均方誤差MSE、均方根誤差RMSE和決定系數(shù)R作為評(píng)定指標(biāo),具體結(jié)果如表6所示。 表6中,當(dāng)鐵含量時(shí)序數(shù)據(jù)預(yù)測(cè)中ANFIS模型、DE-ANFIS模型、PSO-ANFIS模型、GNG-ANFIS模型在窗口大小設(shè)置為2時(shí),測(cè)試集的R值均最大,分別為0.680 59,0.905 75,0.922 39,0.981 76;GMDH模型在窗口大小設(shè)置為5時(shí),測(cè)試集的R值最大為0.890 59。對(duì)比可知,本文模型在大多數(shù)窗口下對(duì)鐵含量時(shí)序數(shù)據(jù)的預(yù)測(cè)精度比其他模型高。窗口為2時(shí),GNG-ANFIS模型對(duì)鐵含量的預(yù)測(cè)精度最高達(dá)到98.18%。因此,在預(yù)測(cè)鐵含量時(shí)序數(shù)據(jù)時(shí)將窗口設(shè)置為2(天)進(jìn)行實(shí)驗(yàn)分析。預(yù)測(cè)效果如圖7所示。 圖7中,本文GNG-ANFIS從檢測(cè)到的奇異點(diǎn)(圖中五角星處)后篩選數(shù)據(jù),并從當(dāng)前位置開始預(yù)測(cè)鐵含量,而以GMDH,ANFIS等為代表的模型仍從第一個(gè)樣本開始預(yù)測(cè),由此可見混合模型減少了樣本數(shù)量,提高了訓(xùn)練階段的效率。各模型在測(cè)試集方面的誤差和預(yù)測(cè)值與預(yù)期值的對(duì)比如圖8和圖9所示。 圖8中,5種模型的誤差值范圍大約在(-0.13,0.06)且不超過0.1,其中GNG-ANFIS模型的測(cè)試集誤差值基本穩(wěn)定在(0,0.02),最大值不超過0.03;ANFIS模型和DE-ANFIS模型誤差值波動(dòng)較大且在(-0.05,0.05)之間振蕩,表明預(yù)測(cè)值與實(shí)際鐵含量值不吻合;PSO-ANFIS模型在0~20個(gè)樣本時(shí)誤差值波動(dòng)較小且均在0附近振蕩,在第21個(gè)樣本后驟降;GMDH模型在前期誤差值波動(dòng)較大,預(yù)測(cè)不穩(wěn)定。因此,在誤差方面,GNG-ANFIS模型預(yù)測(cè)值與實(shí)際鐵含量值相近,預(yù)測(cè)比較準(zhǔn)確。 圖9中,本文GNG-ANFIS模型在預(yù)測(cè)趨勢(shì)吻合度、穩(wěn)定性和精確度方面優(yōu)于其他4種模型,圖中三角形、圓形、方形、菱形分別表示DE-ANFIS,GMDH,PSO-ANFIS,ANFIS模型中預(yù)測(cè)值和實(shí)際鐵含量值偏差較大的樣本點(diǎn),可見模型預(yù)測(cè)準(zhǔn)確性較低。 綜上所述,本文所提混合預(yù)測(cè)模型GNG-ANFIS可以在減少訓(xùn)練時(shí)間的情況下提高預(yù)測(cè)精度。將鐵含量時(shí)序數(shù)據(jù)帶入模型進(jìn)行預(yù)測(cè),得到預(yù)測(cè)結(jié)果為0.264 4%,即未來一天的鐵含量將達(dá)到0.264 4%,可見已超過鋁電解工廠設(shè)定的鐵含量閾值范圍(0.17%~0.26%),將會(huì)導(dǎo)致鋁電解槽中鋁液純度下降,從而影響鋁的性能和品質(zhì),降低工廠的生產(chǎn)效率,應(yīng)及時(shí)預(yù)警并采取相應(yīng)的預(yù)防措施。 本文提出一種高效精準(zhǔn)的混合預(yù)測(cè)模型GNG-ANFIS,模型分為兩個(gè)階段:①奇異點(diǎn)識(shí)別階段,利用GNG動(dòng)態(tài)追蹤奇異點(diǎn),篩選有效數(shù)據(jù),縮短模型訓(xùn)練時(shí)間;②預(yù)測(cè)階段,針對(duì)傳統(tǒng)網(wǎng)絡(luò)易陷入局部最優(yōu)的問題,采用一種改進(jìn)群體智能算法PChOA對(duì)模糊神經(jīng)網(wǎng)絡(luò)ANFIS進(jìn)行優(yōu)化,進(jìn)一步提高預(yù)測(cè)精度。最后,以鋁電解生產(chǎn)工藝中的鐵含量數(shù)據(jù)為分析對(duì)象對(duì)本文所提預(yù)測(cè)模型GNG-ANFIS進(jìn)行性能分析,結(jié)果表明該模型在減少訓(xùn)練時(shí)間的前提下,能夠精確預(yù)測(cè)雜質(zhì)鐵含量,為生產(chǎn)管理者提供理論/技術(shù)支持。下一步將針對(duì)不同應(yīng)用場(chǎng)景,繼續(xù)探究時(shí)間序列混合預(yù)測(cè)模型的魯棒性并進(jìn)行優(yōu)化。2.3 構(gòu)建混合模型GNG-ANFIS
3 實(shí)例研究與結(jié)果分析
3.1 鋁廠時(shí)序數(shù)據(jù)分析
3.2 奇異點(diǎn)監(jiān)測(cè)
3.3 預(yù)測(cè)結(jié)果分析
4 結(jié)束語
計(jì)算機(jī)集成制造系統(tǒng)2023年10期