田紅麗,李成群,閆會強(qiáng),陳 昕
(1.河北工業(yè)大學(xué) 人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津 300130;2.河北工業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院, 天津 300130;3.哈爾濱工業(yè)大學(xué) 電氣工程及自動化學(xué)院,黑龍江 哈爾濱 150001)
灰色模型(grey model,GM)在振蕩變化時間序列的預(yù)測研究一直是大家關(guān)注的熱點(diǎn)問題,雖有很多研究成果呈現(xiàn)[1-4],但預(yù)測結(jié)果仍然不夠理想。預(yù)測結(jié)果或?qū)е虏B(tài)結(jié)果出現(xiàn),或得到的包絡(luò)、區(qū)間形式,只能給出預(yù)測的大致區(qū)域。此外,現(xiàn)有的灰色模型在預(yù)測建模時,較少利用歷史數(shù)據(jù)或完全舍棄歷史數(shù)據(jù)[5,6]。實際上,隨著數(shù)據(jù)的積累,振蕩序列數(shù)據(jù)中的波動特性存在著一定的相似性。隨著時間周期的積累,振蕩序列也將呈現(xiàn)一定的周期性。
本文嘗試充分利用歷史數(shù)據(jù)信息,針對當(dāng)前預(yù)測數(shù)據(jù),利用本文提出的殘差相關(guān)系數(shù),在歷史數(shù)據(jù)中尋找其相似數(shù)據(jù)段,在該相似數(shù)據(jù)段中利用遺傳算法尋優(yōu)得到灰色模型的權(quán)重系數(shù)。然后,利用最優(yōu)權(quán)重系數(shù)灰色模型對當(dāng)前數(shù)據(jù)進(jìn)行預(yù)測,得到的預(yù)測結(jié)果再與歷史數(shù)據(jù)結(jié)合,得到最終的預(yù)測結(jié)果。
文獻(xiàn)[7]提出了一種綜合考慮縱向偏差和橫向殘差的相關(guān)系數(shù),相比其它相關(guān)系數(shù)可以更好地反映數(shù)據(jù)之間的相關(guān)性。但是該相關(guān)系數(shù)計算得到的相關(guān)系數(shù)數(shù)值普遍偏大,使得數(shù)據(jù)之間的區(qū)分性不明顯。因此,本文提出一種新的殘差相關(guān)系數(shù)(residual correlation coefficient,RCC)。該相關(guān)系數(shù)考慮了兩個數(shù)據(jù)序列之間的空間距離及每個序列內(nèi)橫向殘差之間的相似度。
給定兩組數(shù)據(jù)X和Y, 它們之間的歐氏距離表示為
(1)
式中: T為轉(zhuǎn)置運(yùn)算符。
則二者之間的空間距離度量表示為
D(X,Y)=exp(-Δ(X,Y))
(2)
在式(2)中,利用指數(shù)運(yùn)算可保證X和Y之間的距離呈現(xiàn)平穩(wěn)過渡趨勢,且0 在單一數(shù)據(jù)序列內(nèi),殘差定義為 (3) (4) 因此,可以得到殘差相關(guān)系數(shù)表示為 (5) 所以, 0 灰色預(yù)測模型是灰色系統(tǒng)理論的核心和基礎(chǔ),是一種客觀的基于不確定性描述的預(yù)測模型。該模型巧妙地運(yùn)用累加累減計算而放寬了對數(shù)據(jù)的苛刻要求,即該模型無需大量歷史數(shù)據(jù)和數(shù)據(jù)序列的平穩(wěn)性特征即可實現(xiàn)快速的中短期預(yù)測。但是,該模型及推廣模型也普遍存在以下不足:①預(yù)測精度對模型參數(shù)選取比較敏感;②振蕩數(shù)據(jù)的預(yù)測效果不理想。這也是本文主要解決的兩個重點(diǎn)問題。 最常用的灰色預(yù)測模型為GM(1,1)模型。建立GM(1,1) 模型的基本流程和方法如下:給定X(0)={x(0)(1),x(0)(2),…,x(0)(t),…,x(0)(n)} 為一個時間序列模型,t=1,2,…,n,n稱為歷史數(shù)據(jù)維度。對其元素迭代累加后得到累加序列 X(1)={x(1)(1),x(1)(2),…,x(1)(T),…,x(1)(n)} (6) 由此得到緊鄰加權(quán)值生成序列為 z(1)={z(1)(2),z(1)(3),…,z(1)(n)} (7) 式中:z(1)(k)=μx(1)(t-1)+(1-μ)x(1)(t),t≥2,μ為緊鄰權(quán)重系數(shù), 1>μ>0。 建立白化微分方程 x(0)(t)+az(1)(t)=u (8) 式中:a為發(fā)展系數(shù),代表數(shù)據(jù)的發(fā)展態(tài)勢;u為灰作用量,代表數(shù)據(jù)的不確定性。兩個參數(shù)可按最小二乘法進(jìn)行辨識獲取 (9) 式中 (10) (11) (12) 則可解得離散時間響應(yīng)函數(shù)為 (13) 然后利用累減運(yùn)算求解預(yù)測結(jié)果為 x(0)(t+1)=x(1)(T+1)-x(1)(T) (14) 在最相似歷史數(shù)據(jù)段Xh中,根據(jù)歷史預(yù)測結(jié)果,以最小相對誤差為目標(biāo)函數(shù),利用遺傳算法尋找最佳的緊鄰權(quán)重系數(shù)μ。 相對誤差公式為 (15) 結(jié)合歷史預(yù)測結(jié)果和當(dāng)前預(yù)測結(jié)果,則可以得到最終的預(yù)測結(jié)果表示為 (16) 因此,可設(shè)計基于遺傳算法尋優(yōu)的組合預(yù)測模型一般過程如下: 步驟1 截取當(dāng)前預(yù)測所需的訓(xùn)練數(shù)據(jù)序列Xc; 步驟2 在所有歷史數(shù)據(jù)序列XA中,遍歷計算每個等長序列與Xc的相關(guān)系數(shù),找到具有最大相關(guān)系數(shù)的歷史序列段Xh; 步驟3 在歷史數(shù)據(jù)段Xh中,對緊鄰權(quán)重系數(shù)μ通過選擇、交叉、變異操作,在最大進(jìn)化代數(shù)范圍內(nèi)找到使得相對誤差最小的緊鄰權(quán)重系數(shù); 步驟4 利用最優(yōu)緊鄰權(quán)重系數(shù)對當(dāng)前數(shù)據(jù)序列進(jìn)行預(yù)測,包括累加序列生成、緊鄰生成、白化微分方程參數(shù)求解、方程求解和累減運(yùn)算輸出結(jié)果; 步驟5 根據(jù)式(16)得到最終的預(yù)測結(jié)果。 為驗證本文所提模型的有效性,選取美國天然氣數(shù)據(jù)作為研究對象,截取2010年1月1日至2018年11月30日期間每周的天然氣價格,單位為美元/Btu(British Thermal Unit)。原始數(shù)據(jù)如圖1所示。 圖1 天然氣價格原始走勢 通過圖1可以看出,所使用的天然氣數(shù)據(jù)序列為典型的振蕩數(shù)據(jù)。 對比實驗包括兩部分,第一部分為殘差相關(guān)系數(shù)的驗證實驗,第二部分為預(yù)測驗證實驗。在殘差相關(guān)系數(shù)驗證實驗中,對比的相關(guān)系數(shù)包括余弦相似度(cosine similarity,CS)、廣義雅可比相關(guān)系數(shù)(generalized Jaccarb coef-ficient,GJC)、皮爾遜相關(guān)系數(shù)(Pearson correlation coef-ficient,PCC)和橫向殘差與縱向相關(guān)系數(shù)(longitudinal and transverse correlation coefficient,LTCC)[7]。在預(yù)測驗證中,選取的對比方法包括向前滾動灰色模型(forward rolling grey model,F(xiàn)RGM)[8]、新陳代謝灰色模型(metabolism grey model,MGM)[9]和改進(jìn)灰色模型(revised grey model,RGM)[10]。其中,本文簡記為GARGM(genetic algorithm based residual grey model)。 在本文的組合預(yù)測模型中,初始?xì)v史數(shù)據(jù)個數(shù)為60,當(dāng)前歷史數(shù)據(jù)個數(shù)n為10,遺傳算法進(jìn)化代數(shù)為100,初始種群數(shù)為100,二進(jìn)制編碼長度為10,交叉概率為0.6,變異概率為0.001,緊鄰權(quán)重系數(shù)變化范圍為0<μ<1。 3.2.1 相關(guān)系數(shù)對比實驗 在本部分實驗中,同樣選取文獻(xiàn)[7]中所用的人工數(shù)據(jù)作為測試對象,其分布如圖2所示。 圖2 人工數(shù)據(jù)走勢 在計算相關(guān)系數(shù)時,以x1為參考基準(zhǔn),分別計算序列x2至x7與x1的相關(guān)系數(shù)??梢缘玫礁鞣N方法的相關(guān)系數(shù)結(jié)果見表1。 表1 相似灰色模型預(yù)測結(jié)果 3.2.2 預(yù)測對比實驗 各種對比方法得到的預(yù)測結(jié)果如圖3-圖6所示,所得的平均相對誤差見表2。 圖3 FRGM預(yù)測結(jié)果 圖4 MGM預(yù)測結(jié)果 圖5 RGM預(yù)測結(jié)果 圖3-圖6的預(yù)測結(jié)果表明,向前滾動灰色預(yù)測模型由于不恰當(dāng)?shù)厥褂昧藲v史數(shù)據(jù),導(dǎo)致其預(yù)測結(jié)果只能大致跟蹤數(shù)據(jù)的走勢,但無法實現(xiàn)較為精準(zhǔn)的預(yù)測;新陳代謝灰色模型通過舍棄歷史數(shù)據(jù)對新數(shù)據(jù)進(jìn)行更新,而得到了相對較好的趨勢保持結(jié)果;改進(jìn)的灰色模型,通過在歷史數(shù) 圖6 GARGM預(yù)測結(jié)果 FRGMMGMRGMGARGM平均相對誤差18.182110.64115.10814.5900 據(jù)中尋找較優(yōu)的訓(xùn)練數(shù)據(jù)維度,而實現(xiàn)了較好的預(yù)測效果;而圖6中本文所提方法則通過合理地利用歷史數(shù)據(jù)信息,使得預(yù)測結(jié)果與真實結(jié)果具有更好的貼合效果。表2中的平均相對誤差結(jié)果再次驗證了上述分析結(jié)果。 針對灰色模型在振蕩序列中預(yù)測的不足,提出一種基于殘差相關(guān)系數(shù)和灰色模型組合的預(yù)測方法。首先,根據(jù)時間序列特點(diǎn),提出殘差相關(guān)系數(shù)。然后,將殘差相關(guān)系數(shù)和灰色模型結(jié)合,利用遺傳算法對灰色模型參數(shù)進(jìn)行尋優(yōu)。最后,得到一種加權(quán)預(yù)測結(jié)果?;谌斯?shù)據(jù)的對比實驗結(jié)果表明,殘差相關(guān)系數(shù)更符合人們的自然認(rèn)知,更適用于時間序列間的相似關(guān)系計算?;谔烊粴鈨r格預(yù)測的對比實驗結(jié)果表明,本文所提的組合預(yù)測方法預(yù)測精度更高,適用于振蕩序列的預(yù)測。1.2 灰色預(yù)測模型
2 組合預(yù)測模型
3 數(shù)值實驗
3.1 數(shù)據(jù)來源及實驗設(shè)定
3.2 對比實驗與結(jié)果分析
4 結(jié)束語