陳 雪,申建紅,2*,徐文慧,朱 琛
(1.青島理工大學(xué) 管理工程學(xué)院,山東 青島 266520;2.山東省高校智慧城市建設(shè)管理研究中心,山東 青島 266520)
近年來,隨著我國(guó)城鎮(zhèn)化步伐的加快,建筑產(chǎn)業(yè)不斷發(fā)展,工程承包企業(yè)之間的競(jìng)爭(zhēng)日趨激烈。鋼材作為工程建設(shè)的主要原材料,其價(jià)格直接影響著工程承包企業(yè)的成本和利潤(rùn)??茖W(xué)合理地運(yùn)用價(jià)格預(yù)測(cè)技術(shù),準(zhǔn)確把握鋼材價(jià)格的變化趨勢(shì),是工程承包企業(yè)制定合理采購策略和庫存優(yōu)化的依據(jù)。
目前,國(guó)內(nèi)外針對(duì)鋼材價(jià)格的預(yù)測(cè)研究相對(duì)薄弱。陳海鵬等人綜合考慮螺紋鋼原材料結(jié)算價(jià)與貨幣匯率等因素對(duì)螺紋鋼價(jià)格變動(dòng)的影響,提出了一種基于嶺估計(jì)法的線性回歸預(yù)測(cè)模型,通過與未來螺紋鋼的交易價(jià)格進(jìn)行對(duì)比驗(yàn)證,得到該模型預(yù)測(cè)精度較高[1]。陳希等人針對(duì)鋼材價(jià)格變動(dòng)性較大的現(xiàn)象,利用Levenberg-Marquardt方法改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)建立了鋼材價(jià)格預(yù)測(cè)模型,同時(shí)結(jié)合1990—2008年的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練預(yù)測(cè),結(jié)果顯示所建立的鋼材價(jià)格預(yù)測(cè)模型有較好的預(yù)測(cè)精準(zhǔn)度[2]。胡六星為提高工程造價(jià)效率以鋼材價(jià)格為研究對(duì)象,在提煉出其趨勢(shì)項(xiàng)的基礎(chǔ)上利用殘差序列建立了自回歸移動(dòng)平均模型(Auto-Regressive Moving Average Model,ARMA),并應(yīng)用該模型對(duì)鋼材價(jià)格進(jìn)行分析預(yù)測(cè),同時(shí)結(jié)合真實(shí)價(jià)格進(jìn)行精度驗(yàn)證,得到其預(yù)測(cè)結(jié)果誤差低于5%[3]。王雪飛等人通過建立差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average model,ARIMA),對(duì)多種鋼材價(jià)格進(jìn)行預(yù)測(cè)分析,實(shí)驗(yàn)結(jié)果表明該模型的短期預(yù)測(cè)效果較好[4-5]。王松等人應(yīng)用廣義自回歸條件異方差(GARCH)模型與ARMA模型相結(jié)合的組合模型對(duì)近十六年Myspic鋼材價(jià)格的變動(dòng)率進(jìn)行實(shí)證分析,發(fā)現(xiàn)鋼材價(jià)格的時(shí)間序列中含有著明顯的長(zhǎng)短記憶特征[6]。Kaijian He等人對(duì)初始時(shí)間序列進(jìn)行空間重構(gòu),并采用曲線去噪方法分離和剔除噪聲干擾,實(shí)現(xiàn)了對(duì)原始時(shí)間序列中的動(dòng)態(tài)混沌數(shù)據(jù)特征進(jìn)行建模。其所提出的模型在統(tǒng)計(jì)上比傳統(tǒng)的標(biāo)桿模型具有更強(qiáng)的魯棒性[7]。Tsung-Yin Ou等人提出了一種極限學(xué)習(xí)機(jī)器(ELM)法與灰色關(guān)聯(lián)分析(GRA)法相結(jié)合的材料價(jià)格組合預(yù)測(cè)模型,其預(yù)測(cè)能力優(yōu)于ARIMA和GARCH模型,可以更準(zhǔn)確、快速地預(yù)測(cè)原材料價(jià)格[8]。
目前關(guān)于鋼材價(jià)格預(yù)測(cè)的研究只考慮了鋼材價(jià)格變動(dòng)的短記憶性,并未考慮其價(jià)格變動(dòng)的長(zhǎng)記憶性對(duì)預(yù)測(cè)結(jié)果的影響。為此,本文從螺紋鋼價(jià)格時(shí)間序列出發(fā),引入鋼材價(jià)格變動(dòng)的長(zhǎng)記憶性指標(biāo),從而建立了基于分?jǐn)?shù)差分自回歸移動(dòng)平均(Autoregressive fractionally integrated moving average,ARFIMA)模型的鋼材價(jià)格預(yù)測(cè)模型,通過對(duì)鋼材價(jià)格時(shí)間序列變動(dòng)特性的分析并借助MATLAB軟件編程進(jìn)行了鋼材價(jià)格的預(yù)測(cè)[9]。并利用ARFIMA模型和ARIMA模型的預(yù)測(cè)值與真實(shí)值進(jìn)行對(duì)比分析,實(shí)驗(yàn)結(jié)果顯示,ARFIMA模型的鋼材價(jià)格預(yù)測(cè)精準(zhǔn)度更高。
ARMA模型可認(rèn)為由自回歸模型(AR)和移動(dòng)平均模型(MA)組成,通常可記為ARMA(p,q),其形式為:
Xt=φ0+φ1Xt-1+φ2Xt-2+…+φpXt-p+
εt-θ1εt-1-θ2εt-2-…-θqεt-q
(1)
式中:{εt}是白噪聲序列,p為自回歸模型階數(shù),q為移動(dòng)平均模型階數(shù),φ1,φ2,…,φp和θ1,θ2,…,θq為參數(shù),且φp≠0,θq≠0。
若使用后移算子B表示,ARMA模型可簡(jiǎn)寫為:
Φ(B)Xt=Θ(B)εt
(2)
BXt=Xt-1
(3)
ARMA模型適合于分析平穩(wěn)時(shí)間序列,即其均值不受時(shí)間影響且方差收斂的狹義平穩(wěn)過程。目前,由于多數(shù)時(shí)間序列呈現(xiàn)出非平穩(wěn)性,因此ARMA模型不再適用。而ARIMA模型則適用于分析非平穩(wěn)時(shí)間序列,它是在ARMA模型的基礎(chǔ)上加入差分處理,通過剔除時(shí)間序列中非平穩(wěn)趨勢(shì),得到平穩(wěn)時(shí)間序列,從而展開分析研究。其模型ARIMA(p,d,q)形式為:
φ(L)(1-L)dXt=θ(L)εt
(4)
式中:L為滯后算子,d為差分參數(shù),{εt}是白噪聲序列,φ(L)和θ(L)分別為p階與q階平穩(wěn)的滯后算子,可表示為:
φ(L)=1-φ1L-φ2L2-…-φpLp
(5)
θ(L)=1-θ1L-θ2L2-…-θqLq
(6)
式中:p,d,q均為非負(fù)整數(shù)。
在ARIMA模型中,當(dāng)0 (7) 對(duì)于任何d>-1的實(shí)數(shù),上式都可以用一個(gè)超幾何函數(shù)表示為: (8) 式中:Γ(x)為Gamma函數(shù)。差分參數(shù)d可以通過赫斯指數(shù)(H)來確定[10],d=H-0.5。 對(duì)于一個(gè)由N個(gè)數(shù)值組成的時(shí)間序列集合Xt,將其劃分成長(zhǎng)度為n的m個(gè)子序列,并將這m個(gè)子序列的均值都定義為: (9) 式中:xk,l為第l個(gè)時(shí)間序列中第k個(gè)觀測(cè)量。 計(jì)算每個(gè)子序列的累計(jì)均值離差為: (10) 根據(jù)上式,計(jì)算出每個(gè)子序列的極差為: (11) 則其重標(biāo)極差均值可表示為: (12) 式中:Sl表示第l個(gè)子序列的標(biāo)準(zhǔn)差為: (13) 如果時(shí)間序列滿足: (R/S)n=αnH (14) 則該時(shí)間序列符合赫斯特率,式中,α為系數(shù),H為赫斯指數(shù)。其中H可以由公式(14)兩側(cè)取對(duì)數(shù),并結(jié)合最小二乘法擬合得到。當(dāng)0≤H<0.5時(shí),則表示時(shí)間序列具有反持久性,其表現(xiàn)出強(qiáng)烈的異變特性;當(dāng)H=0.5時(shí),則表示時(shí)間序列為隨機(jī)序列;當(dāng)0.5 因此,ARFIMA模型能夠避免過度差分,最大限度地保留時(shí)間序列在低頻處的信息,更適用于具有長(zhǎng)記憶性的時(shí)間序列分析研究。 本文在借助SPSS軟件缺失值分析功能對(duì)鋼材價(jià)格原始數(shù)據(jù)進(jìn)行補(bǔ)齊的基礎(chǔ)上,通過平穩(wěn)性檢驗(yàn)、長(zhǎng)記憶性檢驗(yàn)、數(shù)據(jù)擬合等過程利用ARFIMA模型對(duì)青島市直徑為18 mm的HRB400螺紋鋼價(jià)格進(jìn)行了分析預(yù)測(cè),同時(shí)結(jié)合ARIMA模型對(duì)該鋼材價(jià)格的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析。 本文數(shù)據(jù)選用青島市2014年1月1日到2019年6月30日直徑18 mm的HRB400鋼材價(jià)格作為研究對(duì)象。共采集到樣本數(shù)據(jù)1 875個(gè),由于各種因素導(dǎo)致收集的原始數(shù)據(jù)存在部分缺失,共缺失131個(gè)。 為保證預(yù)測(cè)結(jié)果的準(zhǔn)確性,本文采用SPSS軟件缺失值分析功能對(duì)缺失數(shù)據(jù)進(jìn)行了分析,并在此基礎(chǔ)上將數(shù)據(jù)補(bǔ)齊。其中單變量統(tǒng)計(jì)結(jié)果見表1,通過SPSS數(shù)據(jù)分析中的多變異分析(MVA)得到鋼材價(jià)格變動(dòng)時(shí)間序列服從正態(tài)分布,且多變量檢驗(yàn)(Little's MCAR)的顯著性水平小于5%,由此可判斷原始數(shù)據(jù)為隨機(jī)缺失型數(shù)據(jù)。本文采用期望-最大似然估計(jì)法(EM)對(duì)存在缺失的原始數(shù)據(jù)進(jìn)行填補(bǔ)。 表1 單變量統(tǒng)計(jì) 利用經(jīng)數(shù)據(jù)處理后的鋼材日價(jià)格共得到287個(gè)周價(jià)格樣本作為初始時(shí)間序列,記為Xt。圖1為利用SPSS軟件對(duì)該時(shí)間段內(nèi)青島市直徑為18 mm的HRB400螺紋鋼價(jià)格數(shù)據(jù)繪制的時(shí)序圖,其價(jià)格在早期呈現(xiàn)出下降趨勢(shì),后期呈現(xiàn)出上升趨勢(shì),初步識(shí)別為非平穩(wěn)時(shí)間序列。并利用單位根檢驗(yàn)-ADF方法檢驗(yàn)時(shí)間序列Xt是否含有單位根。 圖1 螺紋鋼價(jià)格時(shí)序圖 單位根檢驗(yàn)結(jié)果如圖2所示,初始時(shí)間序列Xt檢驗(yàn)統(tǒng)計(jì)量大于各個(gè)臨界值,此時(shí)原假設(shè)成立,即認(rèn)為初始時(shí)間序列Xt是非平穩(wěn)時(shí)間序列。 圖2 時(shí)間序列Xt的ADF檢驗(yàn)結(jié)果 圖3為時(shí)間序列Xt的自相關(guān)函數(shù)圖,圖中表明鋼材價(jià)格的變動(dòng)沒有明顯的季節(jié)性變化,且自相關(guān)系數(shù)逐漸減小呈緩慢下降的趨勢(shì),在滯后80階后才開始小于0,表現(xiàn)出長(zhǎng)期相關(guān)特性,可初步判斷時(shí)間序列Xt含有一定程度的長(zhǎng)記憶性。根據(jù)公式(8)—公式(13)計(jì)算得到H為0.835,赫斯指數(shù)大于0.5進(jìn)一步表明時(shí)間序列Xt確實(shí)具有較強(qiáng)的長(zhǎng)記憶性。 圖3 時(shí)間序列Xt自相關(guān)函數(shù)圖 將樣本數(shù)據(jù)分為兩部分,取2014年1月1日到2019年5月12日的周價(jià)格數(shù)據(jù),即前280個(gè)樣本數(shù)據(jù)作為建模序列,記為Yt,用來構(gòu)建ARFIMA模型和確定模型參數(shù)。取2019年5月13日至2019年6月30日的周價(jià)格數(shù)據(jù),即后7個(gè)樣本數(shù)據(jù)用來驗(yàn)證所建立的ARFIMA模型的可行性與精確度。 應(yīng)用R/S分析法求得時(shí)間序列Yt的赫斯指數(shù)為0.835,則所建模型中的分?jǐn)?shù)差分參數(shù)d為0.335。對(duì)時(shí)間序列Yt進(jìn)行分?jǐn)?shù)差分剔除其中存在的長(zhǎng)記憶性,從而獲得只含有短記憶的時(shí)間序列,記為Zt。圖4為時(shí)間序列Zt的時(shí)序圖,由圖可知經(jīng)分?jǐn)?shù)差分后的時(shí)間序列Zt中的數(shù)據(jù)基本圍繞基準(zhǔn)線零線進(jìn)行上下波動(dòng),并不存在顯著的趨勢(shì)或周期,此時(shí)可初步判斷時(shí)間序列Zt已達(dá)到平穩(wěn)。 圖4 時(shí)間序列Zt時(shí)序圖 采用ADF方法檢驗(yàn)時(shí)間序列Zt是否還含有單位根,結(jié)果如圖5所示,可以看出經(jīng)過分?jǐn)?shù)差分處理后的時(shí)間序列Zt檢驗(yàn)統(tǒng)計(jì)量小于各個(gè)臨界值,此時(shí)可判斷該時(shí)間序列為平穩(wěn)時(shí)間序列。通過利用混成檢驗(yàn)(LB)法對(duì)該時(shí)間序列純隨機(jī)性進(jìn)行檢驗(yàn),可知在前6階和前12階延遲下Q檢驗(yàn)統(tǒng)計(jì)量的p值均小于0.05,于是時(shí)間序列Zt為純隨機(jī)序列的假設(shè)不成立,即認(rèn)為時(shí)間序列Zt屬于非白噪聲序列。 圖5 時(shí)間序列Zt的ADF檢驗(yàn)結(jié)果 通過分?jǐn)?shù)差分處理后的時(shí)間序列Zt的自相關(guān)系數(shù)在滯后2階時(shí)其值小于2倍的標(biāo)準(zhǔn)差,同時(shí)偏自相關(guān)系數(shù)在滯后1階時(shí)其值小于2倍的標(biāo)準(zhǔn)差,于是可以確定模型參數(shù)p=2,q=1。由此可建立模型為ARFIMA(2,0.335,1),并對(duì)時(shí)間序列Zt進(jìn)行數(shù)據(jù)擬合,同時(shí)采用LB檢驗(yàn)其殘差序列,可知在前6階和前12階延遲下Q檢驗(yàn)統(tǒng)計(jì)量的p值均大于0.05,此時(shí)認(rèn)為該殘差序列是白噪聲序列,即可表明ARFIMA(2,0.335,1)是顯著有效的。為了與ARIMA模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,本文同時(shí)利用ARIMA模型對(duì)時(shí)間序列Yt進(jìn)行數(shù)據(jù)處理,模型參數(shù)對(duì)比如表2所示。 表2 ARFIMA和ARIMA模型參數(shù)估計(jì)值 為了驗(yàn)證ARFIMA模型的適用性,根據(jù)以上模型參數(shù)估計(jì),確定以ARFIMA(2,0.335,1)模型對(duì)直徑為18 mm的HRB400鋼材價(jià)格進(jìn)行擬合預(yù)測(cè)。圖6為ARFIMA(2,0.335,1)模型的擬合預(yù)測(cè)結(jié)果與真實(shí)值的比較,結(jié)果顯示ARFIMA(2,0.335,1)具有很好的擬合效果。 本文通過分別利用ARIMA模型和ARFIMA模型對(duì)2019年5月13日至2019年6月30日,7周的鋼材周價(jià)格進(jìn)行預(yù)測(cè)分析,同時(shí)結(jié)合7周的真實(shí)值進(jìn)行累計(jì)差值和相對(duì)誤差的精度驗(yàn)證,如表3所示。從表中可以看出,ARIMA模型預(yù)測(cè)值較真實(shí)值的累計(jì)差值為777元,平均相對(duì)誤差為2.08%;ARFIMA模型預(yù)測(cè)值較真實(shí)值的累計(jì)差值為175元,平均相對(duì)誤差為0.38%。綜上所述,在鋼材價(jià)格預(yù)測(cè)中ARFIMA模型較ARIMA模型預(yù)測(cè)結(jié)果精度更高。 表3 ARFIMA模型和ARIMA模型預(yù)測(cè)結(jié)果 圖6 ARFIMA(2,0.335,1)模型預(yù)測(cè)擬合圖 本文以2014年1月~2019年6月青島市直徑18 mm的HRB400鋼價(jià)格數(shù)據(jù)為樣本,建立了ARFIMA(2,0.335,1)鋼材價(jià)格預(yù)測(cè)模型,并與ARIMA模型進(jìn)行對(duì)比分析,得出以下幾點(diǎn)結(jié)論: 1)ARFIMA模型中的分?jǐn)?shù)差分較ARIMA模型的整數(shù)差分能更好地保證鋼材價(jià)格原始時(shí)間序列信息的完整性,避免有效信息的缺失。 2)螺紋鋼價(jià)格時(shí)間序列具有較強(qiáng)的長(zhǎng)記憶性,ARFIMA模型在保持ARIMA短期預(yù)測(cè)精度的基礎(chǔ)上,充分考慮了鋼材價(jià)格變動(dòng)的長(zhǎng)記憶性。 3)實(shí)驗(yàn)結(jié)果顯示,ARFIMA模型預(yù)測(cè)值較真實(shí)值平均相對(duì)誤差僅為0.38%,相較于ARIMA模型的鋼材價(jià)格預(yù)測(cè)精準(zhǔn)度提高了1.7%,且模型擬合度更高、預(yù)測(cè)效果更穩(wěn)定。對(duì)于房地產(chǎn)企業(yè)及時(shí)掌握市場(chǎng)動(dòng)向,降低庫存資金占用率,制定短期鋼材采購計(jì)劃有一定的參考意義。2 基于ARFIMA模型的鋼材價(jià)格預(yù)測(cè)
2.1 原始數(shù)據(jù)處理
2.2 ARFIMA模型
2.3 長(zhǎng)記憶性檢驗(yàn)
2.4 模型建立
2.5 模型預(yù)測(cè)
3 結(jié)論