范曉詩,雷英杰,路艷麗,王亞男
(空軍工程大學(xué)防空反導(dǎo)學(xué)院,陜西 西安 710051)
基于DTW的長期直覺模糊時(shí)間序列預(yù)測模型
范曉詩,雷英杰,路艷麗,王亞男
(空軍工程大學(xué)防空反導(dǎo)學(xué)院,陜西 西安 710051)
針對現(xiàn)有直覺模糊時(shí)間序列模型中直覺模糊關(guān)系組和確定性轉(zhuǎn)換規(guī)則過度依賴訓(xùn)練數(shù)據(jù)規(guī)模的問題,提出一種基于動態(tài)時(shí)間彎曲(DTW,dynamic time warping)距離的長期直覺模糊時(shí)間序列預(yù)測模型。通過直覺模糊C均值(IFCM,intuitionistic fuzzy C mean)聚類構(gòu)建直覺模糊時(shí)間序列片段庫,動態(tài)更新和維護(hù)規(guī)則庫,減少系統(tǒng)復(fù)雜度。提出基于DTW距離的直覺模糊時(shí)間序列片段相似度計(jì)算方法,有效解決不等長時(shí)間序列片段匹配問題。通過對合成數(shù)據(jù)以及包含不同時(shí)間序列模式的氣溫?cái)?shù)據(jù)的實(shí)驗(yàn),與其他相關(guān)模型比較,說明該模型對于不同時(shí)間序列趨勢變化模式中均具有較高的預(yù)測能力,克服傳統(tǒng)模型提高模型只能滿足單一模式時(shí)間序列預(yù)測,提高模型的泛化性能。
DTW;直覺模糊集合;IFCM聚類;時(shí)間序列;預(yù)測
由于對模糊數(shù)據(jù)和不確定性信息處理的優(yōu)勢,模糊時(shí)間序列(FTS,fuzzy time series)分析理論的提出[1]得到了廣泛關(guān)注和研究。大量優(yōu)化理論與其進(jìn)行了有效融合,文獻(xiàn)[2]構(gòu)建了基于粒子群的混合模糊時(shí)間序列模型;文獻(xiàn)[3,4]利用信息粒對模糊區(qū)間進(jìn)行劃分,提高模型預(yù)測精度;文獻(xiàn)[5]結(jié)合蟻群與自回歸算法進(jìn)行模型優(yōu)化;文獻(xiàn)[6]提出基于C均值聚類及神經(jīng)網(wǎng)絡(luò)的混合預(yù)測模型。相關(guān)文獻(xiàn)對模糊時(shí)間序列模型的多元和高階問題進(jìn)行了研究[7~9]。隨著 FTS理論的不斷發(fā)展,單一隸屬度的模糊度量存在一定局限性,文獻(xiàn)[10]將直覺模糊集引入模糊時(shí)間序列模型,提出直覺模糊時(shí)間序列(IFTS,intuitionistic fuzzy time series)。
隨后,一些學(xué)者對直覺模糊時(shí)間序列預(yù)測問題進(jìn)行了深入研究,文獻(xiàn)[11]初步給出直覺模糊時(shí)間序列建模方法;文獻(xiàn)[12]提出基于概率及直覺模糊的時(shí)間序列模型;文獻(xiàn)[13]提出參數(shù)自適應(yīng)的直覺模糊C均值聚類的IFTS模型;文獻(xiàn)[14]和文獻(xiàn)[15]分別將矢量量化與確定性轉(zhuǎn)換與直覺模糊時(shí)間序列結(jié)合,進(jìn)一步優(yōu)化預(yù)測模型。由此可見,直覺模糊時(shí)間序列成為模糊時(shí)間序列的重要發(fā)展方向。
時(shí)間序列分析研究序列數(shù)據(jù)的關(guān)聯(lián)性,通過歷史數(shù)據(jù)挖掘序列變化規(guī)律,用以完成對未來數(shù)據(jù)的預(yù)測工作。傳統(tǒng)模型側(cè)重于短期、單值預(yù)測,模型應(yīng)用范圍有限,文獻(xiàn)[16]將短期模糊時(shí)間序列拓展到長期范圍,構(gòu)建了多值輸出預(yù)測模型,文獻(xiàn)[13,15]在此基礎(chǔ)上改進(jìn)并提出直覺模糊長期預(yù)測模型;文獻(xiàn)[17]利用直覺模糊最小二乘支持向量機(jī)進(jìn)行長期經(jīng)濟(jì)周期預(yù)測。然而,長期模糊時(shí)間序列預(yù)測理論研究相對較少,沒有統(tǒng)一的評價(jià)標(biāo)準(zhǔn),文獻(xiàn)[15,16]將長期定義為多個(gè)輸出值,并沒有準(zhǔn)確反映出序列數(shù)據(jù)變化趨勢。傳統(tǒng)模糊時(shí)間序列構(gòu)建匹配規(guī)則庫,極大地增加系統(tǒng)復(fù)雜度,如文獻(xiàn)[7,8]構(gòu)建的模糊邏輯關(guān)系組,文獻(xiàn)[15,16]構(gòu)建的確定性轉(zhuǎn)換規(guī)則庫,其本質(zhì)上均是通過歷史序列數(shù)據(jù)建立一定推理規(guī)則,通過搜索匹配項(xiàng)或相似匹配項(xiàng),從而得到輸出結(jié)果。這些模型極其依賴訓(xùn)練數(shù)據(jù)集的規(guī)則庫,如果沒有動態(tài)維護(hù)原有規(guī)則庫,當(dāng)出現(xiàn)匹配度較低的時(shí)間序列片段時(shí),模型預(yù)測準(zhǔn)確度將大大降低;如果實(shí)時(shí)更新規(guī)則庫,則系統(tǒng)開銷隨數(shù)據(jù)規(guī)模增大而增大。因此,本文提出一個(gè)更加合理的長期直覺模糊時(shí)間序列模型,利用DTW距離有效解決非等長直覺模糊時(shí)間序列匹配問題,同時(shí)動態(tài)更新和維護(hù)時(shí)間序列庫,避免規(guī)則庫隨預(yù)測范圍的變化而增長,減少系統(tǒng)復(fù)雜度,最后通過實(shí)驗(yàn)證明該模型的有效性。
定義 1(直覺模糊時(shí)間序列)假設(shè){Y(t),t=0,1,…,n}是論域U上的一個(gè)時(shí)間序列,A是U上的一個(gè)劃分,即其中,Ai是語言變量值。如果在{Ai}上相對于Y(t)的直覺模糊集F(t)有隸屬度和非隸屬度的函數(shù)對其中,且那么FI(t)被稱為一個(gè)定義在在Y(t)上的直覺模糊時(shí)間序列,表示為
其中,“+”表示連接符。
定義 2(直覺模糊時(shí)間序列關(guān)系)對于一個(gè)直覺模糊時(shí)間序列FI(t),如果僅由前一時(shí)刻FI(t?1)決定,稱之為一階時(shí)間序列,表示為其中,“?”表示直覺模糊合成操作算子,RI(t,t?1)表示直覺模糊關(guān)系矩陣,并且如果FI(t)的隸屬度函數(shù)與非隸屬度函數(shù)分別為那么隸屬度和非隸屬度關(guān)系矩陣如式(2)所示。
如果FI(t)由前m個(gè)值FI(t?1),FI(t?2),… ,FI(t?m)決定,稱FI(t)為m階直覺模糊時(shí)間序列,關(guān)系表達(dá)式如式(3)所示,其中,“×”是笛卡爾乘積。
定義3(動態(tài)時(shí)間彎曲距離)給定長度為n和m的2個(gè)時(shí)間序列A和B,分別記為A=a1,a2,…,an,B=b1,b2,…,bm,構(gòu)造一個(gè)n×m的彎曲矩陣,如圖1所示,其中任意位置表示ai到bj的距離d(ai,bj),定義彎曲矩陣上長度為 K的彎曲路徑 Wn,m=(w1,w2,…,wk,…,wK),其中,wk=(i,j)k表示彎曲路徑上第k個(gè)元素,并且
圖1 DTW彎曲矩陣與彎曲路徑
彎曲路徑應(yīng)滿足以下條件。
1)邊界條件:路徑起始點(diǎn)為(a1,b1),終止點(diǎn)為(an,bm),即時(shí)間序列端點(diǎn)對齊。
由此定義時(shí)間序列點(diǎn)對基距離之和的最小值為 DTW 距離,如式(4)所示,DTW 距離對應(yīng)的彎曲路徑為最佳路徑。
求解最佳路徑通常構(gòu)造一個(gè) n×m的距離矩陣DDTW,其中每個(gè)元素表示A(a1,aj)到B(b1,bi)的DTW距離,定義為
本文提出一個(gè)基于 DTW 距離的長期直覺模糊時(shí)間序列預(yù)測模型,通過IFMC聚類算法從訓(xùn)練數(shù)據(jù)中提取時(shí)間序列片段并生成匹配規(guī)則庫,同時(shí)校正和更新規(guī)則庫,從而降低傳統(tǒng)模型的系統(tǒng)復(fù)雜度,提高預(yù)測準(zhǔn)確度。模型基本框架如圖2所示。
圖2 基于DTW的長期IFTS預(yù)測模型
直覺模糊時(shí)間序列是對模糊時(shí)間序列的擴(kuò)展和延伸,其基本結(jié)構(gòu)包括論域的劃分、數(shù)據(jù)的直覺模糊化、模糊推理關(guān)系或預(yù)測規(guī)則庫的構(gòu)建以及預(yù)測算法。本文模型首先對數(shù)據(jù)進(jìn)行直覺模糊化和論域劃分,定義全局論域其中,Dmin和Dmax分別表示最大和最小訓(xùn)練數(shù)據(jù),Ai表示語言變量且其中,μj和
jγ由式(6)計(jì)算得出,分別表示Ai屬于ui的隸屬度和非隸屬度函數(shù)。n表示論域劃分區(qū)間數(shù)量,dj表示區(qū)間邊界,xi為歷史數(shù)據(jù),λ表示直覺模糊調(diào)節(jié)因子。因此,根據(jù)數(shù)據(jù)所在劃分區(qū)間,可以得到模糊語言值,最后依據(jù)式(1)得到一個(gè)直覺模糊時(shí)間序列Fi(t)。
相應(yīng)地,當(dāng)需要輸出精確結(jié)果時(shí),根據(jù)式(7)對直覺模糊預(yù)測結(jié)果進(jìn)行去模糊化。
時(shí)間序列預(yù)測模型,通常通過挖掘序列數(shù)據(jù)變化趨勢,構(gòu)建相應(yīng)規(guī)則庫作為預(yù)測基礎(chǔ)。文獻(xiàn)[7,8,12]根據(jù)歷史數(shù)據(jù)構(gòu)建模糊推理關(guān)系組,預(yù)測算法通過搜索匹配的模糊關(guān)系得到輸出結(jié)果,這種方法預(yù)測精度高,但需要構(gòu)建大量模糊推理關(guān)系組,系統(tǒng)復(fù)雜度隨數(shù)據(jù)規(guī)模增大而增大,不便于維護(hù);文獻(xiàn)[15,16]構(gòu)建確定性轉(zhuǎn)化規(guī)則庫作為預(yù)測依據(jù),預(yù)測算法依賴時(shí)間序列狀態(tài)確定性轉(zhuǎn)化,當(dāng)出現(xiàn)不確定性轉(zhuǎn)化時(shí),需要進(jìn)行大量遞歸回溯,算法復(fù)雜度依然較高,同時(shí)對于模糊時(shí)間序列變化趨勢反映不夠明顯,當(dāng)沒有出現(xiàn)匹配規(guī)則時(shí),預(yù)測精度大大降低。因此,這些模糊時(shí)間序列預(yù)測模型的泛化性能不夠理想,不適用于長期時(shí)間序列預(yù)測問題。因此,本文利用直覺模糊C均值聚類算法(IFCM)結(jié)合 DTW 算法建立和更新時(shí)間序列片段庫,使其滿足長期預(yù)測跟蹤匹配,有效降低技術(shù)復(fù)雜度。
IFCM算法通過目標(biāo)函數(shù)Je最小化原則,將數(shù)據(jù)集X=(x1,x2,…,xn)劃分為C類[11],表示為
表1給出構(gòu)建直覺模糊時(shí)間序列片段算法,通過直覺模糊C均值聚類,得到最優(yōu)聚類中心,將聚類中心添加到時(shí)間序列片段,根據(jù)長期預(yù)測規(guī)模的需求,分別取不等長的時(shí)間序列片段作為訓(xùn)練數(shù)據(jù)。該算法將原始時(shí)間序列直覺模糊化為不等長序列片段,生產(chǎn)規(guī)則庫并作為時(shí)間序列預(yù)測的依據(jù)。
算法1直覺模糊時(shí)間序列片段算法
輸入:測試數(shù)據(jù)X,時(shí)間序列片段長度w,聚類數(shù)c,序列片段間隔d,最大迭代次數(shù)r
輸出:直覺模糊時(shí)間序列片段庫Base
Begin
在時(shí)刻τ沿 X滑動窗口 w,建立 X子序列,
根據(jù)式(6)直覺模糊化子序列 S;
for k=1 to r
根據(jù)式(10)、式(11)計(jì)算中心的隸屬度和非隸屬度函數(shù)
Break;
end
end
DTW 是一種距離測度與時(shí)間規(guī)劃結(jié)合的非線性測量技術(shù),通過彎曲矩陣可以有效測量非等長時(shí)間序列片段的曲線相似度,對于長期時(shí)間序列預(yù)測有很好的適用性。表2給出計(jì)算2個(gè)直覺模糊時(shí)間序列DTW距離的算法,對于2個(gè)直覺模糊數(shù)a和b,其隸屬度和非隸屬度函數(shù)分別為和那么定義直覺模糊數(shù)的距離d(a,b)由式(13)計(jì)算得到。
算法中min_cor函數(shù)表示之前路徑對應(yīng)的最小代價(jià)值的坐標(biāo)。最后得到2個(gè)n×m的矩陣,分別稱為代價(jià)矩陣cost和彎曲路徑矩陣path。算法2通過計(jì)算2個(gè)直覺模糊時(shí)間序列的最小代價(jià)路徑,作為這2個(gè)時(shí)間序列的DTW距離,在預(yù)測算法中調(diào)用該算法,得到的DTW距離作為長期直覺模糊序列規(guī)則庫匹配的標(biāo)準(zhǔn)。
算法2直覺模糊DTW算法
輸入:直覺模糊時(shí)間序列片段 A,B,序列長度n,m,DTW(A,B)
輸出:n×m代價(jià)矩陣cost和彎曲路徑矩陣path
Begin
設(shè)一個(gè)IFTS A=a1,a2,…,an,隸屬度和非隸屬函數(shù)分別為
設(shè)一個(gè)IFTS B=b1,b2,…,bn,隸屬度和非隸屬函數(shù)分別為
根據(jù)式(12)計(jì)算d(ai,bj);//序列片段坐標(biāo)距離
長期直覺模糊時(shí)間序列預(yù)測問題就是利用訓(xùn)練數(shù)據(jù)構(gòu)建直覺模糊時(shí)間序列片段庫,通過序列片段相似度匹配算法進(jìn)行搜索,找出最相似的時(shí)間序列片段作為預(yù)測基礎(chǔ),最后計(jì)算得到預(yù)測輸出結(jié)果。文獻(xiàn)[13,16]利用歐式距離進(jìn)行時(shí)間序列片段匹配,對于非等長時(shí)間序列片段,只截取了較短片段進(jìn)行距離計(jì)算并得到預(yù)測結(jié)果,模型精度有限,本節(jié)提出一個(gè)基于直覺模糊DTW距離的預(yù)測算法,并通過實(shí)驗(yàn)證明其有效性。
算法3為基于DTW的long-term IFTS 預(yù)測算法。首先由算法1構(gòu)建一個(gè)規(guī)模為n的直覺模糊時(shí)間序列片段庫,分別計(jì)算每條片段到待測序列與Base中片段的DTW距離,取代價(jià)矩陣最小的片段作為匹配序列。接著計(jì)算前q?d項(xiàng)匹配序列與待測序列的DTW距離和預(yù)測距離e,最后將匹配向量后d項(xiàng)序列 match( ~ d)與預(yù)測距離e的和作為最終預(yù)測結(jié)果。當(dāng)匹配序列方差將當(dāng)前時(shí)間序列片段添加到原片段庫Base,從而達(dá)到動態(tài)更新和維護(hù)序列片段庫的目的。
算法3基于DTW的long-term IFTS預(yù)測算法
輸入:直覺模糊時(shí)間序列片段庫Base,規(guī)模為n,窗口長度l,預(yù)測長度d,歷史數(shù)據(jù)p,τ時(shí)刻待測序列
輸出:預(yù)測結(jié)果
Begin
for i=1 to n
從Base 中選擇一個(gè) IFTS Bq=b1,b2,…,bq;
DTW(Ap,Bq);
Wp,q=(w1,w2,…,wk…,wK);//最佳彎曲路徑
Ifδ(A,B)=min(DTW(A,Base))
match=B;//匹配時(shí)間序列片段
else
Base?B;//刪去時(shí)間序列片段
end
DTW(A,match(q?d));//計(jì)算待測序列與匹配序列前q?d項(xiàng)的DTW距離
通過式(7)去直覺模糊化 Fτ′+1;
本節(jié)提出的基于DTW的long-term IFTS預(yù)測模型,由 3個(gè)算法構(gòu)成,算法 1通過直覺模糊聚類方法,將原始時(shí)間序列直覺模糊化為不等長序列片段,生產(chǎn)規(guī)則庫。算法 2計(jì)算 2個(gè)直覺模糊時(shí)間序列的DTW距離,在預(yù)測算法中調(diào)用該算法,作為長期直覺模糊序列規(guī)則庫匹配標(biāo)準(zhǔn)。算法 3計(jì)算代價(jià)矩陣最小的片段作為匹配序列,最后求匹配向量后與預(yù)測距離之和得到預(yù)測結(jié)果。
為了說明本文提出的基于 DTW 的 long-term IFTS預(yù)測模型的有效性,將該模型應(yīng)用于文獻(xiàn)[15,16]中的一個(gè)合成數(shù)據(jù)集,如圖3所示。該數(shù)據(jù)集為一個(gè)包括60個(gè)數(shù)據(jù)點(diǎn)的時(shí)間序列,前40個(gè)點(diǎn)作為訓(xùn)練數(shù)據(jù),其余的作為測試數(shù)據(jù)。根據(jù)本文提出的模型,預(yù)測步驟如下。
圖3 長期預(yù)測合成數(shù)據(jù)
Step1為了同相關(guān)文獻(xiàn)進(jìn)行比較[13,16],本文設(shè)定相同參數(shù)值,即時(shí)間序列片段長度 w=5,聚類數(shù)c=5,序列片段間隔d=1,沿時(shí)間序列數(shù)據(jù)X計(jì)算得到36個(gè)時(shí)間序列片段,前3項(xiàng)為
Step2定義全局論域 U=[20.0,70.0],設(shè)di=10,λ=0.95,U被劃分為5個(gè)區(qū)間,即A1=[20,30],A2=[30,40],A3=[40,50],A4=[50,60],A5=[60,70]。根據(jù)式(6)直覺模糊化時(shí)間序列片段,設(shè)λ=0.95,前 3項(xiàng)直覺模糊化時(shí)間序列數(shù)據(jù)為:S1=(lt;0.38,0.61>,lt;0.46,0.53>,lt;0.63,0.37>,lt;0.71,0.28>,lt;0.41,0.58>),S2=(lt;0.46,0.53>,lt;0.63,0.37>,lt;0.71,0.28>,lt;0.41,0.58>,lt;0.70,0.29>),S3=(lt;0.63,0.37>,lt;0.71,0.28>,lt;0.41,0.58>,lt;0.70,0.29>,lt;0.44,0.55>)。
Step3調(diào)用直覺模糊時(shí)間序列片段算法r=50,計(jì)算最優(yōu)聚類中心,得到5個(gè)直覺模糊時(shí)間序列片段 m1、m2、m3、m4、m5,其隸屬度和非隸屬度函數(shù)如圖4所示。將該時(shí)間序列片段添加至直覺模糊時(shí)間序列片段庫Base。
圖4 直覺模糊時(shí)間序列片段
表1 直覺模糊時(shí)間序列片段庫
Step4轉(zhuǎn)至Step1,分別設(shè)訓(xùn)練數(shù)據(jù)窗口大小w=6,w=7,聚類數(shù)c=5,序列片段間隔d=1,調(diào)用直覺模糊時(shí)間序列片段算法,得到不等長時(shí)間序列片段并添加至Base,得到15條直覺模糊時(shí)間序列片段組成的Base庫,如表1所示。
Step5設(shè)d=2,p=3,得到待測向量調(diào)用基于DTW的long-term IFTS預(yù)測算法。例如第 1條待測向量為(lt;0.63,0.36>,lt;0.23,0.76>,lt;0.21,0.78>),根據(jù)算法 3,分別計(jì)算待測向量A1與Base庫中每條序列的直覺模糊DTW距離。得到與第13條序列片段最小DTW距離方差計(jì)算 DTW(A1,match(5)),得到距離期望ε=0.231,根據(jù)最后 2項(xiàng)序列值lt;0.66,0.33>,lt;0.61,0.38> 計(jì) 算 得 到 預(yù) 測 結(jié) 果 為Fτ′+1=(<0.43,0.56 gt;,<0.38,0.61gt;)。
Step6根據(jù)式(7)對預(yù)測結(jié)果進(jìn)行去直覺模糊化,得到精確值為(41.50,39.25)。其他預(yù)測結(jié)果如表2所示,分別將2項(xiàng)輸出結(jié)果作為τ+1和τ+2時(shí)刻的預(yù)測值。
表2 合成數(shù)據(jù)長期預(yù)測結(jié)果
為了比較不同預(yù)測模型的精度,分別利用預(yù)測平均方差(MSE,mean square error)和平均預(yù)測誤差率(AFER,average forecasting error rate)作為評價(jià)指標(biāo)。
將本文提出的模型與文獻(xiàn)[13,16]中的模型在該合成數(shù)據(jù)上進(jìn)行比較,在本實(shí)驗(yàn)中,設(shè)置相同的時(shí)間序列窗口大小w和預(yù)測長度d,達(dá)到控制變量的目的,預(yù)測精確度隨預(yù)測長度d的增加而降低,較短的預(yù)測長度可以得到較好的結(jié)果,聚類算法中聚類中心隨聚類數(shù)c的增加而更加準(zhǔn)確,但過多的聚類中心增加算法復(fù)雜度,同時(shí)增加系統(tǒng)規(guī)則庫的規(guī)模。在預(yù)測問題中,過于精確的結(jié)果以犧牲系統(tǒng)開銷為代價(jià),通常在沒有極大降低預(yù)測準(zhǔn)確度的條件下減少聚類中心,該實(shí)驗(yàn)中實(shí)驗(yàn)數(shù)據(jù)為有限隨機(jī)模式,實(shí)驗(yàn)對比結(jié)果如表3所示,本文提出的預(yù)測模型在MSE和AFER上均低于前2種模型,說明本文方法的參數(shù)選擇合適,并且在長期時(shí)間序列預(yù)測中具有更高的精度。
表3 MSE和AFER比較結(jié)果
為了分析本文提出的長期直覺模糊時(shí)間序列模型在不同時(shí)間序列模式下的預(yù)測能力,將本文模型應(yīng)用于另一溫度數(shù)據(jù)集,北京市 2014年日平均氣溫(http∶//www.cma.gov.cn),該數(shù)據(jù)集共包括 365個(gè)數(shù)據(jù)點(diǎn)。溫度數(shù)據(jù)根據(jù)不同單位尺度包含不同時(shí)間序列變化趨勢,例如隨機(jī)模型(月)、季節(jié)模型(季)、長期趨勢(半年)和周期模型(年),因此可以有效檢驗(yàn)時(shí)間序列模型的泛化性能。
本文模型在不同時(shí)間單位上分別與文獻(xiàn)[2,12,16,18]進(jìn)行對比實(shí)驗(yàn)??紤]到相關(guān)模型只有單步輸出結(jié)果,因此訓(xùn)練數(shù)據(jù)窗口長度分別設(shè)置為w=5、6、7,預(yù)測長度 d=1,預(yù)測窗口大小 w=6,聚類數(shù)設(shè)為c=7,前2個(gè)月共59個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。由于文獻(xiàn)[16]模型無法預(yù)測超出訓(xùn)練范圍的數(shù)據(jù),為了覆蓋全年數(shù)據(jù)范圍,將1月、4月、7月共92個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。文獻(xiàn)[2,12,18]中的模型將全局論域劃分為8部分。重復(fù)實(shí)驗(yàn)10次取平均值,本文模型與文獻(xiàn)[2,12,16,18]中模型對全年溫度預(yù)測對比結(jié)果如圖5和圖6所示,2個(gè)月(3月、8月)氣溫預(yù)測對比結(jié)果如圖7所示,MSE和AFER指標(biāo)對比結(jié)果如表4所示。通過實(shí)驗(yàn)可以看出,在預(yù)測窗口大小參數(shù)選擇上,最優(yōu)預(yù)測結(jié)果為w=6,說明時(shí)間序列長度與預(yù)測沒有線性相關(guān)性,通過多次訓(xùn)練可以得到較優(yōu)值,本文提出的模型在全年范圍和月范圍上的時(shí)間序列預(yù)測結(jié)果均比相關(guān)文獻(xiàn)精確,年級氣溫為周期性時(shí)間序列模式,月級為隨機(jī)時(shí)間序列模式,本文模型僅8月份AFER指標(biāo)比文獻(xiàn)[18]略高,文獻(xiàn)[2,12,18]在特定時(shí)間序列模式上進(jìn)行全局論域劃分可以得到較精確的結(jié)果,而將模型應(yīng)用與幾種時(shí)間序列模式的復(fù)合數(shù)據(jù)集上,預(yù)測結(jié)果不夠理想,因此,說明本文模型比其他模型對于不同趨勢的時(shí)間序列具有良好的適應(yīng)性能。從實(shí)驗(yàn)參數(shù)設(shè)置可以看出,本文提出的模型不僅具有長期預(yù)測能力,相比文獻(xiàn)[13,15,16]的長期時(shí)間序列預(yù)測模型,對訓(xùn)練數(shù)據(jù)集規(guī)模要求更小,能夠有效處理預(yù)測范圍超出訓(xùn)練數(shù)據(jù)的問題,動態(tài)維護(hù)直覺模糊時(shí)間序列庫,從而減少系統(tǒng)復(fù)雜度。
圖5 本文模型與文獻(xiàn)[2,16]模型對比結(jié)果
圖6 本文模型與文獻(xiàn)[12,18]模型對比結(jié)果
圖7 2個(gè)月氣溫預(yù)測對比結(jié)果
表4 氣溫預(yù)測MSE和AFER比較結(jié)果
本文針對現(xiàn)有直覺模糊時(shí)間序列模型訓(xùn)練數(shù)據(jù)復(fù)雜度高的問題,提出一種基于DTW的直覺模糊長期預(yù)測模型。通過直覺模糊C均值聚類構(gòu)造非等長直覺模糊時(shí)間序列片段庫,動態(tài)維護(hù)和更新數(shù)據(jù)庫,有效解決現(xiàn)有文獻(xiàn)中模型過度依賴訓(xùn)練數(shù)據(jù)庫規(guī)模的現(xiàn)象,基于DTW距離的直覺模糊時(shí)間序列片段相似度計(jì)算方法,克服不等長時(shí)間序列片段匹配問題。該模型在預(yù)測數(shù)據(jù)超出訓(xùn)練數(shù)據(jù)范圍的情況下,依然可以根據(jù)時(shí)間序列片段相似匹配度預(yù)測數(shù)據(jù)變化趨勢,適用于不同模式的時(shí)間序列預(yù)測問題。通過實(shí)驗(yàn),預(yù)測結(jié)果的MSE和AFER指標(biāo)均表明該模型比現(xiàn)有文獻(xiàn)更準(zhǔn)確,是一種有效且泛化性能較好的長期預(yù)測模型。
[1]SONG Q,CHISSOM B S. Forecasting enrollments with fuzzy time series—part I[J]. Fuzzy Sets Systems,1993,54(1): 1-9.
[2]HUANG Y L,HORNG S J,HE M X,et al. A hybrid forecasting model for enrollments based on aggregated fuzzy time series and particle swarm optimization[J]. Expert Systems with Applications,2011,38(7):8014-8023.
[3]WANG L Z,LIU X D,PEDRYCZ W. Effective intervals determined by information granules to improve forecasting in fuzzy time series[J].Expert Systems with Applications,2013,40(14): 1465-1470.
[4]WEI L,CHEN X Y,PEDRYCZ W,et al. Using interval information granules to improve forecasting in fuzzy time series[J]. International Journal of Approximate Reasoning,2015,57(11): 1-18.
[5]CAI Q S,ZHANG D F,ZHANG W. A new fuzzy time series forecasting model combined with ant colony optimization and auto-regression[J].Knowledge-Based Systems,2015,74(11): 61-68.
[6]EGRIOGLU E,ALADAG C H,YOLCU U. Fuzzy time series forecasting with a novel hybrid approach combining fuzzy C-means and neural networks[J]. Expert Systems with Applications,2013,40(3):854-857.
[7]PARK J,LEE D J,SONG C K,et al. TAIFEX and KOSPI 200 forecasting based on two-factor high-order fuzzy time series and particle swarm optimization[J]. Expert Systems with Applications,2010,37(2):959-967.
[8]CHEN S M,CHEN S W. Fuzzy forecasting based on two-factors second-order fuzzy-trend logical relationship groups and the probabilities of trends of fuzzy logical relationships[J]. IEEE Transactions on cybernetics,2015,45(3): 405-416.
[9]ASKARI S,MONTAZERIN N. A high-order multi-variable fuzzy time series forecasting algorithm based on fuzzy clustering[J]. Expert Systems with Applications,2015,42(9): 2121-2135.
[10]CASTILLO O,ALANIS A,GARCIA M,et al. An intuitionistic fuzzy system for time series analysis in plant monitoring and diagnosis[J].Applied Soft Computing,2007,7(4): 1227-1233.
[11]鄭寇全,雷英杰,王睿,等. 直覺模糊時(shí)間序列建模及應(yīng)用[J]. 控制與決策,2013,28(10): 1525-1530.ZHENG K Q,LEI Y J,WANG R,et al. Modeling and application of IFTS[J]. Control and Decision,2013,28(10): 1525-1530.
[12]GANGWAR S S,KUMAR S. Probabilistic and intuitionistic fuzzy sets-based method for fuzzy time series forecasting[J]. Cybernetics and Systems.2014,45(4): 349-361.
[13]鄭寇全,雷英杰,王睿,等. 參數(shù)自適應(yīng)的長期 IFTS預(yù)測算法[J].系統(tǒng)工程與電子技術(shù),2014,36(1): 100-104.ZHENG K Q,LEI Y J,WANG R,et al. Method of long-term IFTS forecasting based on parameter adaptation[J]. Systems Engineering and Electronics,2014,36(1): 100-104.
[14]鄭寇全,雷英杰,王睿,等. 基于確定性轉(zhuǎn)換的IFTS預(yù)測[J]. 應(yīng)用科學(xué)學(xué)報(bào),2013,31(2): 204-211.ZHENG K Q,LEI Y J,WANG R,et al. Prediction of IFTS based on deterministic transition[J]. Journal of Applied Sciences,2013,31(2):204-211.
[15]鄭寇全,雷英杰,王睿,等. 基于矢量量化的長期直覺模糊時(shí)間序列預(yù)測[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版),2014,44(3): 795-800.ZHENG K Q,LEI Y J,WANG R,et al. Long-term intuitionistic fuzzy time series forecasting based on vector quantization[J]. Journal of Jilin University (Engineering and Technology Edition),2014,44(3):795-800.
[16]LI S T,KUO S C,CHEN Y C,et al. Deterministic vector long-term forecasting for fuzzy time series[J]. Fuzzy Sets and Systems,2010,161(13): 1852-1870.
[17]HUNG K C,LIN K P. Long-term business cycle forecasting through a potential intuitionistic fuzzy least-squares support vector regression approach[J]. Information Sciences,2013,224(Complete): 37-48.
[18]LEE H S,CHOU M T. Fuzzy forecasting based on fuzzy time series[J]. International Journal of Computer Mathematics,2004,81(7): 781-789.
Long-term intuitionistic fuzzy time series forecasting model based on DTW
FAN Xiao-shi,LEI Ying-jie,LU Yan-li,WANG Ya-nan
(Air and Missile Defense College,Air Force Engineering University,Xi’an 710051,China)
In existing fuzzy time series forecasting models,the intuitionistic fuzzy relationship groups and deterministic transition rules excessively relied on scale of the training data. A long-term intuitionistic fuzzy time series (IFTS)forecasting model based on DTW was proposed. The IFTS segment base was constructed by IFCM. The complexity of system was reduced by dynamic update and maintaining of the rule base. The computing method of IFTS segments similarity based on the distance of DTW was proposed,which was valid for matching unequal length time series segments. The proposed model implements on the synthetic and the temperature dataset,which including different time series patterns,respectively. The experiments illustrate that the forecasting accuracy of the proposed model is higher than the others on the different tendency patterns of time series. The proposed model overcomes the limitation of single time series pattern and improves the generalization ability.
DTW,intuitionistic fuzzy sets,IFCM clustering,time series,forecasting
The National Natural Science Foundation of China (No.61309022)
TP393.08
A
2016-01-13;
2016-05-03
國家自然科學(xué)青年基金資助項(xiàng)目(No.61309022)
10.11959/j.issn.1000-436x.2016160
范曉詩(1988-),男,陜西西安人,空軍工程大學(xué)博士生,主要研究方向?yàn)榫W(wǎng)絡(luò)信息安全。
雷英杰(1956-),男,陜西渭南人,博士,空軍工程大學(xué)教授、博士生導(dǎo)師,主要研究方向?yàn)榫W(wǎng)絡(luò)信息安全、智能信息處理。
路艷麗(1980-),女,陜西渭南人,博士,空軍工程大學(xué)講師,主要研究方向?yàn)橹悄苄畔⑻幚怼?/p>
王亞男(1988-),女,山東青島人,空軍工程大學(xué)博士生,主要研究方向?yàn)榫W(wǎng)絡(luò)信息安全。