高嘉慧
摘?要:煤炭在中國經(jīng)濟發(fā)展中占據(jù)著重要的位置,它不僅是工業(yè)的主要能源,也是民用的主要能源和化工原料,并且是我國出口的商品,它在國民經(jīng)濟中具有重要的戰(zhàn)略地位。近幾年來,我國煤炭的價格一直處于較大的波動范圍,特別是近幾年的煤炭大幅下降引起了社會的廣泛關(guān)注。煤炭作為基礎(chǔ)能源,需求關(guān)系的變化,必然會導(dǎo)致價格的變化。煤炭作為國家主要能源,客觀分析個判定煤炭價格的影響因素,了解預(yù)測未來煤炭的價格,對于掌握決策的主動權(quán),是非常重要的。本文主要對某市2006年7月3日起至2020年4月31日的煤炭價格相關(guān)數(shù)據(jù)以及從網(wǎng)絡(luò)上收集的從2019年5月到2020年3月的煤炭價格相關(guān)數(shù)據(jù)進行分析,運用相關(guān)性分析中的灰色關(guān)聯(lián)分析,建立了灰色模型,得到了影響某市煤價格的主要因素的排序;其次,用python軟件分析附件1中煤炭價格數(shù)據(jù),建立了ARIMA模型,預(yù)測了未來31天、35周、36個月的煤炭價格;然后,利用回歸分析,建立了多元線性回歸方程,綜合考慮了未來各種情況(例如突發(fā)事件)引起的煤炭價格影響因素在結(jié)構(gòu)性和重要性方面的變化。
關(guān)鍵詞:煤炭價格;灰色關(guān)聯(lián)分析;SPSS軟件;ARIMA模型;逐步回歸方法
【一】基本假設(shè)
1.查找得到的數(shù)據(jù)真實可靠,可以作為分析依據(jù),且每周/月/年/煤炭價格的均值為全國平均價格;
2.假設(shè)秦皇島港動力煤的月平均價格可以直接視作該月各周其價格的均值。
3.短期內(nèi)煤炭價格及需求量不受國家政策的強制干預(yù)。
【二】符號說明
【三】 問題分析
首先要給出影響煤炭價格的重要因素并排序,因此需要搜索影響煤炭價格的指標數(shù)據(jù),由于數(shù)據(jù)較少,我們認為是灰色系統(tǒng),利用灰色關(guān)聯(lián)分析求出煤炭價格與指標之間的兩兩相關(guān)性并排序。接著我們對煤炭價格進行預(yù)測,需要掌握一定量的數(shù)據(jù)。通過附件1可以獲得我國某市2006年7月至2020年4月的煤炭價格。通過對所得到的數(shù)據(jù)進行分析,發(fā)現(xiàn)煤炭價格與時間呈非線性關(guān)系,可以建立煤炭價格與時間序列之間的時間序列模型,并據(jù)此對于煤炭未來價格進行預(yù)測。最后,為了得到精準的預(yù)測模型,且考慮變量間的多重共線性問題,我們采用逐步回歸方法使用SPSS,找到一個能描述煤炭價格變化的多元線性回歸方程。
【四】 建模過程
4.1.1模型準備
1.數(shù)據(jù)收集
我們從網(wǎng)絡(luò)上收集到2019年5月到2020年3月份煤炭進口量/萬噸,煤炭出口量/萬噸,全國鐵路煤炭發(fā)運量/萬噸,居民消費者指數(shù)價格指數(shù)(上月=100),全國煤炭企業(yè)庫存/萬噸,GDP,煤炭加工成本指數(shù),秦皇島平均最高氣溫/℃。
2. 數(shù)據(jù)預(yù)處理
鑒于數(shù)據(jù)收集之繁瑣且困難,在保證絕大部分數(shù)據(jù)真實可信的條件下,我們對某些自變量(煤炭出口量,全國煤炭企業(yè)庫存,煤炭產(chǎn)量,煤炭進口量)值進行臨近線性插值和算術(shù)平均處理,以及對因變量煤炭價格進行平均處理,求得每月平均價格。大致數(shù)據(jù)如下表:
3. 灰色關(guān)聯(lián)分析介紹
對于都有兩個系統(tǒng)之間的因素,其隨時間或不同對象而變化的關(guān)聯(lián)性大小的度量稱為關(guān)聯(lián)度,在系統(tǒng)發(fā)展過程中,若兩個因素變化的趨勢具有一致性及同步變化程度較高,即可為兩者關(guān)聯(lián)程度較高,反之則較低。因此,灰色關(guān)聯(lián)分析方法是根據(jù)因素之間發(fā)展趨勢的相似或相異程度,以及灰色關(guān)聯(lián)度作為衡量因素間關(guān)聯(lián)程度的一種方法,在實際獲取數(shù)據(jù)中,常常受到客觀因素和人為因素的影響,使獲得的數(shù)據(jù)部分正確,部分不準確,具有一定灰度;并且傳統(tǒng)的數(shù)理統(tǒng)計要求樣本服從某個典型的概率分布,要求各數(shù)據(jù)與系統(tǒng)特征數(shù)據(jù)之間呈線性關(guān)系且各因素之間彼此無關(guān),這種要求在本題中難以滿足。因此,我們選擇灰色關(guān)聯(lián)分析方法進行量化分析,建立數(shù)學(xué)模型得出影響某市煤價格的主要因素的排序。
4.1.2模型建立一
1.確定分析序列
灰色關(guān)聯(lián)度分析的進行需要確定參考序列,反映系統(tǒng)特征的數(shù)據(jù)列,還需要確定比較數(shù)據(jù)序列,是影響系統(tǒng)變化的數(shù)據(jù)序列。
設(shè)為母序列(因變量)煤炭價格為X0,子序列(自變量)依次為X1,X2?,…,X9
2.對數(shù)據(jù)進行預(yù)處理
為了消除量綱以及縮小變量范圍簡化計算,我們母序列和子序列中的每個指標進行預(yù)處理。令
,其中為各序列的均值。
3.序列絕對差
對標準化后的參考序列與比較序列進行差值運算并取絕對值,計算得出每列數(shù)列的最大差與最小差。數(shù)學(xué)表達式如下:
4.定義關(guān)聯(lián)系數(shù)
5.計算灰色關(guān)聯(lián)度
灰色關(guān)聯(lián)度是對灰色關(guān)聯(lián)系數(shù)做均值運算,將參考序列與比較序列在各個時刻所體現(xiàn)的關(guān)聯(lián)度數(shù)值,轉(zhuǎn)變?yōu)閮尚蛄虚g的關(guān)聯(lián)度數(shù)值,以λ(0,k)代表母序列X0與子序列Xi之間的灰色關(guān)聯(lián)度,則計算公式表示為:
4.1.3 模型求解
利用Matlab R2017a平臺(代碼見附錄),我們對母序列X0與子序列Xi灰色關(guān)聯(lián)分析度進行求解,子序列中各個指標的灰色關(guān)聯(lián)度分別為:
由計算結(jié)果可知,從2019年5月1日至2020年4月30日,影響秦皇島煤炭價格的主要因素依次排序為經(jīng)濟水平,煤炭生產(chǎn)成本,煤炭產(chǎn)量,季節(jié)因素。
4.2.1模型建立二
附件1中給2006-2020年某市所在“周”的煤炭價格最低價值、最高價值、平均值,為了預(yù)測此趨勢之下預(yù)測未來31天、35周、36個月的煤炭價格的變化,通過煤炭價格平均值的變化研究來對煤炭未來價格的發(fā)展趨勢作出預(yù)測分析。建立時間序列模型,首先檢索到原始數(shù)據(jù)時間間隔沒有規(guī)律,然后對附件1中的數(shù)據(jù)進行重采樣。
隨后建立模型:
4.2.2模型求解
1.讀取數(shù)據(jù)
我們先讀取附件1給出的煤炭價格數(shù)據(jù),并選擇我們需要的數(shù)據(jù),由于原始數(shù)據(jù)的時間索引間隔是沒有規(guī)律的,所以我們需要對數(shù)據(jù)進行重采樣,根據(jù)問題二的要求,我們分別以天、周、月為單位對數(shù)據(jù)重采樣,并取平均價格那一列作為預(yù)測數(shù)據(jù)。
我們把附件1中某市煤炭價格以日平均量為單位的以折線圖的形式表示出來,
通過分析可以看到上圖數(shù)據(jù)的平穩(wěn)性較差,需要對數(shù)據(jù)做差分。
3、平穩(wěn)化處理
因為原序列呈現(xiàn)非線性趨勢,需要進行一階差分
4.時間序列定階
定階問題,主要是確定p,d,q三個參數(shù),差分的階數(shù)d一般通過觀察圖示,1階或2階即可。我們主要確定p和q的值,通過以下兩個函數(shù)確定。
(1)自相關(guān)函數(shù)ACF
自相關(guān)函數(shù)ACF描述的是時間序列觀測值與其過去的觀測值之間的線性相關(guān)性。計算公式如下:
其中k代表滯后期數(shù),如果k=2,則代表yt和yt-2。
(2)偏自相關(guān)函數(shù)PACF
偏自相關(guān)函數(shù)PACF描述的是在給定中間觀測值的條件下,時間序列觀測值預(yù)期過去的觀測值之間的線性相關(guān)性。
綜上,p和q的階數(shù)確定規(guī)則如下:
通過對PACF和ACF的分析,我們可以得到PACF圖和ACF圖:
5.信息準則定階
通過拖尾和截尾對模型進行定階的方法,往往具有很強的主觀性。因此我們可以通過信息準則定階,常用的信息準則函數(shù)有下面2種:
AIC準則
AIC準則全稱為全稱是最小化信息量準則(Akaike Information Criterion),計算公式如下:
其中L表示模型的極大似然函數(shù),K表示模型參數(shù)個數(shù)。
AIC=-2ln(L)+2k
BIC準則
AIC準則存在一定的不足之處。當樣本容量很大時,在AIC準則中擬合誤差提供的信息就要受到樣本容量的放大,而參數(shù)個數(shù)的懲罰因子卻和樣本容量沒關(guān)系,因此當樣本容量很大時,使用AIC準則選擇的模型不收斂與真實模型,它通常比真實模型所含的未知參數(shù)個數(shù)要多。BIC貝葉斯信息準則彌補了AIC的不足,計算公式如下:
其中 n 表示樣本容量。
得出結(jié)果如下:
我們?nèi)IC的結(jié)果,因此可以確定p、q的值分別為1、1
6.訓(xùn)練模型,預(yù)測數(shù)據(jù)
通過求解模型,我們可以得到所預(yù)測的未來31天、35周、36個月的煤炭價格
4.3.1模型準備
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法,運用十分廣泛。在進行線性回歸分析時,容易出現(xiàn)自變量(解釋變量)之間彼此相關(guān)的現(xiàn)象,我們稱這種現(xiàn)象為多重共線性。適度的多重共線性不成問題,但當出現(xiàn)嚴重共線性問題時,會導(dǎo)致分析結(jié)果不穩(wěn)定,出現(xiàn)回歸系數(shù)的符號與實際情況完全相反的情況。本應(yīng)該顯著的自變量不顯著,本不顯著的自變量卻呈現(xiàn)出顯著性,這種情況下就需要消除多重共線性的影響。為了消除多重共線性對回歸結(jié)果的影響,對回歸模型做出準確有效地估計,我們采用向后逐步回歸方法,篩選自變量。
4.3.2模型介紹
逐步回歸求解最優(yōu)回歸方程的重要方法,它的基本思想是將變量逐個引入模型,每引入一個解釋變量后都要進行F檢驗,并對已經(jīng)選入的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除。以確保每次引入新的變量之前回歸方程中只包含顯著性變量。這是一個反復(fù)的過程,直到既沒有顯著的解釋變量選入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止。以保證最后所得到的解釋變量集是最優(yōu)的。
4.3.3模型建立
回歸模型建立,涉及n個自變量的多元線性回歸模型可表示為,
βi為未知的回歸系數(shù),ε為無規(guī)則但服從正態(tài)分布的擾動項。
4.3.4.模型求解
1.回歸方程確定
首先申明本次回歸自變量為第一問所收集的9個指標,接下來我們利用spss軟件對這9個指標進行向前逐步回歸。最后得到煤炭價格關(guān)于生產(chǎn)成本指數(shù)與秦皇島日最高氣溫的二元線性回歸方程。
可以看到回歸方程y=1.548x8+0.696x9+422.072(x8是煤炭生產(chǎn)成本指數(shù),x9是秦皇島日均最高氣溫),且每個回歸系數(shù)對應(yīng)t統(tǒng)計量的p<0.05,說明這些指標都與因變量線性關(guān)系顯著。
2.回歸模型的顯著性檢驗
可以看到,經(jīng)選擇后相關(guān)系數(shù)為0.899,且F統(tǒng)計量對應(yīng)p值<0.05,說明回歸方程線性顯著。
4.3.5模型結(jié)果討論
根據(jù)回歸方程我們得出以下結(jié)論:
1.煤炭價格與煤炭生產(chǎn)成本呈明顯正相關(guān),且生產(chǎn)成本上升1個百分點,煤炭價格會隨之上升1.548個百分點。
2.煤炭價格與氣溫有關(guān),說明煤炭價格波動是有著一定的季節(jié)性,從本模型中,可以看到,溫度每上升一度,煤炭價格上升0.696元。一定程度上來說,夏季的煤炭價格比冬季的煤炭價格更高。
3.煤炭價格與市場經(jīng)濟水平有一定關(guān)系,由于煤炭生產(chǎn)成本與市場經(jīng)濟有著密不可分的關(guān)系,可以說,煤炭價格的決定與市場經(jīng)濟制度有著強烈的正相關(guān)性。
【五】模型的綜合評價及推廣
5.1 模型的優(yōu)缺點
模型的優(yōu)點:
1.沒有采用片面主觀的層次分析法,而是引入相關(guān)性分析中的灰色關(guān)聯(lián)度分析方法。該方法非常適合數(shù)據(jù)稀少,且自變量與因變量具有大致變化趨勢的情況。可以減少由于信息不對稱帶來的損失。
2.ARIMA模型,使用方便,且對短期情況的預(yù)計結(jié)果較為準確。
3.原有數(shù)據(jù)中存在缺失值,利用SPSS處理了缺失值問題。
模型的缺點:
1.ARIMA模型預(yù)測時序數(shù)據(jù)時,必須是穩(wěn)定的,如果不穩(wěn)定的數(shù)據(jù),是無法捕捉到規(guī)律的。
2.影響煤炭價格變化的指標數(shù)據(jù)難以尋找,導(dǎo)致回歸方程具有很大的片面性。同時只利用了煤炭近一年的價格數(shù)據(jù)進行逐步回歸,難以提供長期預(yù)測。
5.2模型的推廣
灰色關(guān)聯(lián)分析方法不僅適用于煤炭的綜合評價這一類問題,而且,類似的可以用來研究解決諸如工程方案的綜合評價問題,灰色關(guān)聯(lián)分析方法在實際中非常有推廣應(yīng)用價值。時間序列模型可以在有限個樣本總量的情況下,預(yù)測短期的經(jīng)濟形勢、規(guī)避風(fēng)險等。
參考文獻:
[1] 姜啟源,謝金星,葉俊,數(shù)學(xué)模型(第四版)[M],北京高等教育出版社,2011年
[2]司玲君,煤炭價格波動的影響因素研究[J],現(xiàn)代經(jīng)濟信息,2018年,01期:350
[3]張同功,雷仲敏,煤炭價格波動的影響因素分析[J],中國能源,2005年,12期,16-19