岳赟,盧光躍,劉迪,董靜怡
?
基于等維新息的GM(2,1)遞推預(yù)測模型
岳赟,盧光躍,劉迪,董靜怡
(西安郵電大學(xué)無線網(wǎng)絡(luò)安全技術(shù)國家工程實驗室,陜西西安 710121)
針對GM(2,1)白化方程的解影響其預(yù)測精度的問題,提出了一種新的預(yù)測模型——等維新息GM(2,1)遞推預(yù)測模型。該模型通過其灰色微分方程推導(dǎo)出GM(2,1)遞推預(yù)測模型的表達式,避免了對二階白化方程進行求解,同時解決了差分方程與微分方程之間因轉(zhuǎn)換而產(chǎn)生誤差的問題,并結(jié)合等維新息的思想更新GM(2,1)遞推預(yù)測模型的參數(shù)。最后通過實例驗證了所提等維新息GM(2,1)遞推預(yù)測模型的有效性和實用性。
GM(2,1)模型;白化方程;灰色微分方程;等維新息;遞推預(yù)測模型
如何挖掘缺乏統(tǒng)計規(guī)律的小樣本預(yù)測系統(tǒng)的發(fā)展規(guī)律,一直是學(xué)術(shù)界的難點[1]?;疑到y(tǒng)(grey system)是20世紀80年代鄧聚龍?zhí)岢龅囊环N針對小樣本、貧信息、不確定性問題的方法。灰色系統(tǒng)理論以“部分信息已知,部分信息未知”的小樣本、貧信息、不確定系統(tǒng)為研究對象,通過對“部分”已知信息的生成、開發(fā),提取有價值的信息,實現(xiàn)對系統(tǒng)運行行為、演化規(guī)律的正確描述和有效監(jiān)控[2]。
GM(2,1)模型作為灰色系統(tǒng)中最重要的預(yù)測模型之一,已廣泛應(yīng)用于經(jīng)濟、生態(tài)、科技、農(nóng)業(yè)、生物等各個領(lǐng)域。GM(2,1)模型是由原始序列建立的二階微分方程,有兩個特征根,因此動態(tài)過程能反映出單調(diào)、非單調(diào)或擺動等多種情況[3]。然而實際求解過程中存在的近似誤差會對算法性能帶來影響,比如GM(2,1)模型用梯形公式近似代替背景值,以向前差商或向后差商近似代替灰導(dǎo)數(shù),初始條件的選取缺乏合理性等。因此,諸多學(xué)者對GM(2,1)模型進行了改進和優(yōu)化,參考文獻[3]利用最小二乘法對模型的初始條件進行修正,降低了模型的預(yù)測誤差;參考文獻[4]利用新信息優(yōu)先的原理來求解預(yù)測響應(yīng)函數(shù)中的1、2,進而提高了模型的預(yù)測效果;參考文獻[5]利用權(quán)值1、2對一階灰導(dǎo)數(shù)和背景值進行加權(quán)組合,以提高模型的預(yù)測精度;參考文獻[6]分別利用參數(shù)和對GM(2,1)模型的背景值進行修正,并對原始數(shù)據(jù)進行數(shù)乘變換,以此提高模型精度。
以上研究從不同角度對GM(2,1)模型進行改進,在一定程度上提高了GM(2,1)模型的預(yù)測精度。然而GM(2,1)模型存在解的多樣性及離散模型與連續(xù)模型之間的近似替代問題,本文對GM(2,1)模型的參數(shù)估計、模擬及預(yù)測均采用離散形式的方程,從而推導(dǎo)出GM(2,1)遞推模型,然后利用新息優(yōu)先的思想不斷更新建模用的原始數(shù)據(jù),進而更新系統(tǒng)參數(shù)。
2.1 建模原理
作為灰色預(yù)測中最重要的模型,GM(2,1)是由原始數(shù)據(jù)序列建立的二階微分方程,其時間響應(yīng)函數(shù)有兩個指數(shù)分量,主要適合對單一時間序列的系統(tǒng)進行模擬和預(yù)測。
記長度為的原始非負序列(0)={(0)(1),(0)(2),…,(0)()},對其進行一次累減和一次累加生成,分別記為和(1)={(1)(1),(1)(2),…,(1)()},其中,(1,2,3,…,)。據(jù)此構(gòu)造背景值序列(1)={(1)(1),(1)(2), …,(1)()},其中(2,3,…,)。
則稱:
為GM(2,1)模型,其中u(=1,2,3)為待確定的系統(tǒng)參數(shù)。
式(1)對應(yīng)的白化微分方程形式為:
關(guān)于GM(2,1)常微分方程的解[7]有如下說明。
(2)齊次方程的通解有以下3種情況。
(3)常微分方程的特解有以下3種情況。
實際上絕大部分數(shù)據(jù)都是兩個不相等的特征根,下面就以此為例說明求解的步驟。
設(shè)特征根是1、2,則上述微分方程的解為:
采用最小二乘原則求解1、2,使達到最小。
(5)
進而由克拉默法則求解1、2。
將1、2代入式(3),并在=(1,2,…,)處的值來逼近:
將式(6)累減還原,即可得到預(yù)測值:
,2,3,…,(7)
2.2 模型的檢驗
眾所周知,擬合的精度是評判模型效果的核心指標(biāo)。因此,灰色預(yù)測模型必須通過精度檢驗后再決定其是否可以用于模擬和預(yù)測。模型精度的檢驗方法主要有3種:殘差檢驗法、后驗差檢驗法和關(guān)聯(lián)度檢驗法,其中殘差檢驗法是最常用的方法。殘差是實際值與模擬值之差,殘差檢驗實際上檢驗的是模擬值與實際值之間偏離的程度[8]。殘差檢驗步驟如下。
設(shè)原始序列(0)和模擬序列分別為:
(9)
其絕對誤差()和平均相對誤差分別為:
(11)
當(dāng)<10%且()<10%,稱模型為殘差合格模型。
GM(2,1)模型是由原始序列建立的二階微分方程,有兩個特征根,能動態(tài)地反映出單調(diào)、非單調(diào)或擺動等多種情況,然而在建模的過程中存在解的多樣性及離散模型與連續(xù)模型之間的近似替代問題。
為了避免建模過程中存在解的多樣性及離散模型與連續(xù)模型之間的近似替代問題,本文將提出一種新的GM(2,1)遞推模型,該方法在建模過程中一直沿用差分方程的形式。將,代入式(1)得:
化簡式(12)得:
(13)
易知:
(15)
式(14)減去式(15),整理得:
其中,(0)()為=時刻的模擬預(yù)測值,1和2為系統(tǒng)的待確定值,可利用最小二乘法求解。
GM(2,1)遞推預(yù)測模型計算簡單,不需對二階微分方程進行求解,且避免了離散模型與連續(xù)模型之間的近似替代,從而提高了模型的預(yù)測精度。
GM(2,1)遞推模型只能做逐步預(yù)測,在進行下一步預(yù)測時,需用到上一步預(yù)測的結(jié)果,每步預(yù)測的參數(shù)估計值1和2是個定數(shù)——由原始時序得到,隨著預(yù)測步數(shù)的增加,其預(yù)測精度有可能較快下降。為了減緩預(yù)測精度下降的速度,本文采用等維新息遞推預(yù)測模型提高其預(yù)測精度。
對于灰色系統(tǒng)而言,隨著時間的推移,干擾系統(tǒng)的因素不斷變化,系統(tǒng)的狀態(tài)也在不斷變化。傳統(tǒng)灰色預(yù)測模型準(zhǔn)確度較高的僅僅是原點數(shù)據(jù)以后的1~2個數(shù)據(jù),越向未來發(fā)展,即越遠離時間原點,模型的預(yù)測準(zhǔn)確度越低。因此,必須引入已知信息來反映系統(tǒng)的變化和狀態(tài),或在無已知信息的情況下,用灰色信息來淡化灰平面的灰度,這種模型由于及時地引入了新的已知信息或灰色信息,刪除舊的數(shù)據(jù),能夠比較準(zhǔn)確地反映系統(tǒng)的變化狀態(tài),故稱為新息灰色模型[9]。而灰色預(yù)測模型長期預(yù)測的有效性明顯受到時間序列長短及數(shù)據(jù)變化的影響,數(shù)據(jù)序列太短,難以建立長期的預(yù)測模型;數(shù)據(jù)序列太長,系統(tǒng)受干擾的成分變大,不穩(wěn)定因素增多,系統(tǒng)預(yù)測精度下降。所以等維新息GM(2,1)遞推模型通過在GM(2,1)遞推模型中加入等維約束條件,彌補了灰色系統(tǒng)模型的不足,有效地提高預(yù)測的精度[10]。
在原始序列(0)={(0)(1),(0)(2),…,(0)()}的基礎(chǔ)上,去掉第一個數(shù)據(jù)(0)(1),同時加入新的已知數(shù)據(jù)(0)(+1),構(gòu)成等維動態(tài)序列(0)={(0)(2),(0)(3),…,(0)(),(0)(+1)},如此遞補,依次遞推,建立等維新息GM(2,1)遞推預(yù)測模型。
綜上,等維新息GM(2,1)遞推預(yù)測模型的建模步驟如下。
步驟1 構(gòu)造原始數(shù)據(jù)序列(0)={(0)(1),(0)(2),。
步驟2 將(0)代入式(16),求出1和2,建立GM(2,1)遞推預(yù)測模型。
步驟3 計算+1時刻的預(yù)測值(0)(+1)。
步驟4 更新原始數(shù)據(jù)序列(0),即令(0)= {(0)(2),(0)(3),…,(0)(),(0)(+1)}。
步驟5 返回步驟2,重復(fù)步驟2~4,直至計算完所有預(yù)測數(shù)據(jù)的預(yù)測值為止。
1997年以來,中國互聯(lián)網(wǎng)信息中心(CNNIC)已連續(xù)20年開展統(tǒng)計調(diào)查工作,并于每年1月、7月分兩次發(fā)布統(tǒng)計報告,公布我國Internet上網(wǎng)計算機數(shù)、用戶人數(shù)、用戶分布、信息流量分布、域名注冊等方面情況的統(tǒng)計信息,為我國信息化發(fā)展提供了重要的依據(jù),也為政府、機構(gòu)和企業(yè)各界提供重要決策參考。根據(jù)CNNIC第39次發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,截至2016年12月,中國網(wǎng)民上網(wǎng)人數(shù)已過半,中國網(wǎng)民的人均周上網(wǎng)時長為26.4 h。本文選取CNNIC于2017年1月發(fā)布的第39次報告數(shù)據(jù),分別以手機網(wǎng)民規(guī)模和網(wǎng)民人均周上網(wǎng)時長為例進行分析。
2008—2016年我國手機網(wǎng)民規(guī)模見表1,記表1的數(shù)據(jù)為原始序列(0),該數(shù)據(jù)為單調(diào)遞增序列,下面將利用GM(2,1)模型、參考文獻[4]模型和等維新息GM(2,1)遞推模型分別對(0)中的前7個數(shù)據(jù)建立相應(yīng)的預(yù)測模型,后2個數(shù)據(jù)用來預(yù)測,以對比3種模型的預(yù)測精度。
對于GM(2,1)模型,利用2008—2014年的數(shù)據(jù)建立GM(2,1)模型,解得1=0.701 9、2=?0.098 2、1=24 107;對于參考文獻[4]模型,灰色建模得1=0.338 3、2=?0.157 4、1=24 441;而對于等維新息GM(2,1)遞推模型,首先建立GM(2,1)遞推模型,解得1=1.842 1、2=?0.844 7,并得到2015年手機網(wǎng)民規(guī)模的預(yù)測值(見表2中“等維新息1”所在列),然后對原始數(shù)據(jù)進行一次等維新息處理,將2015年的實際值添加到原始序列中,同時刪除2008年的數(shù)據(jù),保持維度相同,重新建立GM(2,1)遞推模型,解得1=1.549 6、2=?0.476 5,預(yù)測2016年手機網(wǎng)民規(guī)模(見表2中“等維新息2”所在列)。表2描述了3種模型對原始序列的的擬合值和相對誤差。
表1 2008—2016年我國手機網(wǎng)民規(guī)模
表2 3種模型對原始序列的擬合值和相對誤差
由表2可知,GM(2,1)模型、參考文獻[4]模型和等維新息GM(2,1)遞推模型對原始序列進行一步預(yù)測的相對誤差分別為1.09%、4.43%和1.66%,二步預(yù)測的相對誤差分別為1.62%、8.05%和0.006%,2015年和2016年手機網(wǎng)民規(guī)模人數(shù)的平均相對誤差分別為1.36%、6.24%和0.83%,從而表明本文所提的等維新息GM(2,1)遞推模型的預(yù)測精度優(yōu)于GM(2,1)模型和參考文獻[4]模型。
2008—2016年中國網(wǎng)民人均周上網(wǎng)時長見表3,記表3的數(shù)據(jù)為原始序列(0),該數(shù)據(jù)為擺動序列,下面將利用GM(2,1)模型、參考文獻[4]模型和等維新息GM(2,1)遞推模型分別對(0)中的前7個數(shù)據(jù)建立相應(yīng)的預(yù)測模型,后2個數(shù)據(jù)用來預(yù)測,以對比3種模型的預(yù)測精度。
對于GM(2,1)模型,利用2008—2014年的數(shù)據(jù)建立GM(2,1)模型,解得1=?0.358 2、2=0.026 8、1=?5.523 1;對于參考文獻[4]模型,灰色建模得1=?0.449 0、2=?0.034 8、1=21.397 0;而對于等維新息GM(2,1)遞推模型,首先建立GM(2,1)遞推模型,解得1=1.332 7、2=?0.312 5,并得到2015年網(wǎng)民人均周上網(wǎng)時長預(yù)測值(見表4中“等維新息1”所在列),然后對原始數(shù)據(jù)進行一次等維新息處理,將2015年的實際值添加到原始序列中,同時刪除2008年的數(shù)據(jù),保持維度相同,重新建立GM(2,1)遞推模型,解得1=1.198 0、2=?0.193 2,預(yù)測2016年網(wǎng)民人均周上網(wǎng)時長(見表4中“等維新息2”所在列)。表4描述了3種模型對原始序列的擬合值和相對誤差。
由表4可知,GM(2,1)模型、參考文獻[4]模型和等維新息GM(2,1)遞推模型對原始序列進行一步預(yù)測的相對誤差分別為0.60%、28.02%和1.57%,二步預(yù)測的相對誤差分別為4.82%、263.14%和1.07%,2015年和2016年網(wǎng)民人均周上網(wǎng)時長的平均相對誤差分別為2.71%、145.58%和1.32%,參考文獻[4]所提的模型對該數(shù)據(jù)的預(yù)測效果急劇下降,從而表明本文所提的等維新息GM(2,1)遞推模型的預(yù)測精度優(yōu)于GM(2,1)模型和參考文獻[4]模型。
表3 2008—2016年中國網(wǎng)民人均周上網(wǎng)時長
表4 3種模型對原始序列的擬合值和相對誤差
根據(jù)新息優(yōu)先的思想,本文對GM(2,1)模型的參數(shù)估計、模擬及預(yù)測均采用離散形式的方程,并通過其灰色微分方程推導(dǎo)出GM(2,1)遞推預(yù)測模型的表達式,從而建立等維新息GM(2,1)遞推預(yù)測模型,該模型有效地避免了對二階白化方程進行求解。最后,通過實例驗證該改進模型的合理性,同時該模型有效地提高了預(yù)測精度。
[1] 吳利豐, 劉思峰, 姚立根. 含Caputo型分數(shù)階導(dǎo)數(shù)的灰色預(yù)測模型[J]. 系統(tǒng)工程理論與實踐, 2015, 35(5): 1311-1316.
WU L F, LIU S F, YAO L G. Grey model with Caputo fractional order derivative[J]. Systems Engineering Theory & Practice, 2015, 35(5): 1311-1316.
[2] 曾柯方. 幾種灰預(yù)測模型的參數(shù)辨識與優(yōu)化方法研究[D]. 南充: 西華師范大學(xué), 2015.
ZENG K F. Identifying parameters and optimization method research of several grey prediction models[D]. Nanchong: China West Normal University, 2015.
[3] 李玲玲, 單銳, 崔紅芳. 改進GM(2,1)模型的MATLAB實現(xiàn)及其應(yīng)用[J]. 數(shù)學(xué)的實踐與認識, 2011, 41(20): 179-183.
LI L L, SHAN R, CUI H F. The application of the improved GM(2,1) grey model using MATLAB[J]. Mathematics in Practice & Theory, 2011, 41(20): 179-183.
[4] XU N, DANG Y G. An optimized grey GM (2,1) model and forecasting of highway subgrade settlement[J]. Mathematical Problems in Engineering, 2015(1): 1-6.
[5] 牛思先, 陳鵬宇, 蘇玉剛. 基于加權(quán)組合和最小二乘法改進的GM(2,1)模型[J]. 統(tǒng)計與決策, 2010(22): 28-30.
NIU S X, CHEN P Y, SU Y G. Improvement of GM (2,1) model based on weighted combination and least squares method[J]. Statistics and Decision, 2010(22): 28-30.
[6] 劉虹, 張岐山. 基于微粒群算法的GM(2,1, λ, ρ)優(yōu)化模型[J]. 系統(tǒng)工程理論與實踐, 2008, 28(10): 96-101.
LIU H, ZHANG Q S. GM (2, 1, λ, ρ) based on particle swarm optimization[J]. Journal of Systems Science and Information, 2008, 28(10): 96-101.
[7] 劉麗桑, 彭俠夫, 周結(jié)華. 兩種改進的GM(2,1)模型及其在船舶橫搖預(yù)報中的應(yīng)用[J]. 廈門大學(xué)學(xué)報(自然科學(xué)版), 2011, 50(3): 515-519.
LIU L S, PENG X F, ZHOU J H. Two improved model of GM (2,1) and its application in ship rolling forecast[J]. Journal of Xiamen University(Natural Science), 2011, 50(3): 515-519.
[8] 盧懿. 灰色預(yù)測模型的研究及其應(yīng)用[D]. 杭州: 浙江理工大學(xué), 2014.
LU Y. The research and application of grey forecast model[D]. Hangzhou: Zhejiang Sci-tech University, 2014.
[9] ZHANG H, YANG Y. Application of equal dimension and new information gray prediction model in power load forecasting[C]// 2010 2nd International Conference on Signal Processing Systems (ICSPS), July 5-7, 2010, Dalian, China. New Jersey: IEEE Press, 2010: 196-200 .
[10] ZHANG Q, CHEN R. Application of metabolic GM (1,1) model in financial repression approach to the financing difficulty of the small and medium-sized enterprises[J]. Grey Systems, 2014, 4(2): 311-320.
GM (2,1) recursive forecasting model based on equal dimension and new information
YUE Yun, LU Guangyue, LIU Di, DONG Jingyi
National Engineering Laboratory for Wireless Security, Xi’an University of Posts and Telecommunications, Xi’an 710121, China
Aiming at the problem that the solution of GM (2,1) whitening equation affects its prediction accuracy, a new prediction model dubbed GM (2,1) recursive prediction model of equal dimension new information was proposed. The model was deduced from the grey differential equation of GM (2,1) mode, which could avoid solving the second-order whitening equation, solve the problem that the errors between equations and differential equations for conversion, and update the model parameters combining the idea of equal dimension and new information. Both the simulation and analysis of the example demonstrate that the proposed method is more effective and practical.
GM (2,1) model, whitening equation, grey differential equation, equal dimension and new information, recursive forecasting model
TP391.9
A
10.11959/j.issn.1000?0801.2017112
2017?02?22;
2017?04?20
陜西省工業(yè)科技攻關(guān)資助項目(No.2016GY-113,No.2015GY-013);陜西省教育廳專項科研計劃基金資助項目(No.16JK1704)
Industrial Research Project of Science and Technology Department of Shaanxi Province of China (No.2016GY-113, No.2015GY-013), Shaanxi Provincial Department of Education Special Research Project of China (No.16JK1704)
岳赟(1989?),男,西安郵電大學(xué)無線網(wǎng)絡(luò)安全技術(shù)國家工程實驗室碩士生,主要研究方向為數(shù)據(jù)分析。
盧光躍(1971?),男,西安郵電大學(xué)無線網(wǎng)絡(luò)安全技術(shù)國家工程實驗室教授,主要研究方向為信號與信息處理、認知無線電、數(shù)據(jù)分析等。
劉迪(1991?),男,西安郵電大學(xué)無線網(wǎng)絡(luò)安全技術(shù)國家工程實驗室碩士生,主要研究方向為數(shù)據(jù)分析。
董靜怡(1992?),女,西安郵電大學(xué)無線網(wǎng)絡(luò)安全技術(shù)國家工程實驗室碩士生,主要研究方向為數(shù)據(jù)分析。