劉遵雄,周天清
(華東交通大學(xué)信息工程學(xué)院,江西南昌 330013)
在過去幾十年里,各種線性與非線性的時間序列建模預(yù)測方法被提出,包括自回歸移動平均(ARMA)、求和自回歸移動平均(ARIMA)、自回歸條件異方差(ARCH)、人工神經(jīng)網(wǎng)絡(luò)(ANN)[1]、遺傳算法(GA)[2]、支持向量機(jī)(SVM)[3]、門限自回歸(TAR)、自適應(yīng)回歸(AAR)和泛函數(shù)自回歸(FAR)等,其中許多方法已成功地應(yīng)用到金融時間序列分析中,并且獲得了較為理想的結(jié)果。然而,其中有些方法須以在一定假設(shè)條件(如線性、平穩(wěn)性、標(biāo)準(zhǔn)性假設(shè)等)為前提,而另一些方法則無法直接適用于高維、高噪聲數(shù)據(jù)的建模。奇異譜分析(singular spectrum analysis,SSA)技術(shù)的提出是時間序列分析研究的重大變革,它結(jié)合典型時間序列分析、多元統(tǒng)計(jì)、多元幾何、動態(tài)系統(tǒng)、信號處理及奇異值分解(SVD)等技術(shù)[4],破除了許多傳統(tǒng)方法的假設(shè)前提,是一類元參數(shù)、獨(dú)立于模型的時間序列分析技術(shù)[5]。
奇異譜分析通過將原始序列延時地排列成一矩陣形式,然后應(yīng)用奇異值分解將原始序列分解成少數(shù)可解釋、獨(dú)立的成份之和,如緩慢變化趨勢、擺動成份和隨機(jī)噪聲[6]。奇異譜分析技術(shù)主要用于解決趨勢或準(zhǔn)周期成分的檢測與提取、降噪、預(yù)測、異常點(diǎn)檢測等問題,廣泛應(yīng)用于氣候、環(huán)境、地理、社會科學(xué)及金融等多方領(lǐng)域。
常見的奇異譜分析預(yù)測技術(shù)通常以傳統(tǒng)神經(jīng)網(wǎng)絡(luò)或線性遞歸公式(linear recurrent formula,LRF)[7]為模型進(jìn)行預(yù)測,但是基于奇異譜分析的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練速度緩慢,而基于奇異譜分析的線性遞歸預(yù)測效果有待改進(jìn)?;诖?,本文將廣義回歸神經(jīng)網(wǎng)絡(luò)(general regression neural network,GRNN)與奇異譜分析技術(shù)相結(jié)合形成基于奇異譜分析的廣義回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型,以同方股份收盤價格為測試對象驗(yàn)證其預(yù)測效果。
奇異譜分析算法包含分解與重構(gòu)兩個階段。前者將原始序列延時地排列成一矩陣形式,進(jìn)行奇異值分解;后者利用求得的主成份進(jìn)行分組并對組成份所形成的矩陣對角平均化。
廣義回歸神經(jīng)網(wǎng)絡(luò)[8-9]是徑向前饋神經(jīng)網(wǎng)絡(luò)RBF的一個分支,它以數(shù)理統(tǒng)計(jì)為基礎(chǔ)進(jìn)行非線性(核)回歸分析。GRNN與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)一樣,具有很強(qiáng)的非線性建模能力、較高的容錯性及魯棒性,其逼近能力和學(xué)習(xí)速度較傳統(tǒng)的RBF網(wǎng)絡(luò)有著較強(qiáng)的優(yōu)勢,且當(dāng)樣本數(shù)據(jù)較少時,預(yù)測效果不受影響。
對應(yīng)網(wǎng)絡(luò)p維輸入向量X={},x2,…,xp,其輸出為Y={y1,y2,…,yp},網(wǎng)絡(luò)結(jié)構(gòu)如圖1。
如果GRNN神經(jīng)網(wǎng)絡(luò)的隱含層的傳遞函數(shù)以高斯函數(shù)為概率密度函數(shù),那么網(wǎng)絡(luò)的輸出為
以同方股份1997年6月至1998年5月收盤價格共204個數(shù)據(jù)作為測試數(shù)據(jù)。根據(jù)奇異譜分析的步驟,首先將序列以80為窗口長度(一般小于等于序列長度的一半)組織成一延時矩陣,然后采用SVD對延時矩陣進(jìn)行分解,得80個特征值(按非增序排列)。首5個特征值的貢獻(xiàn)率分別為98.765 66%,0.411 16%,0.363 15%,0.252 86%,0.005 481%,其中98.765 66%的特征值對應(yīng)的重構(gòu)序列代表原始序列的趨勢,見圖2,后四項(xiàng)則指示著序列的波動情況,見圖3。特征值中最后75項(xiàng)由于貢獻(xiàn)率極小,可被視為序列噪聲數(shù)據(jù)。最后由前5個成份重構(gòu)成降噪后的序列,見圖4,該序列將用于預(yù)測。
圖2中,原始序列呈現(xiàn)出較為復(fù)雜的波動變化,而由貢獻(xiàn)率98.765 66%的特征向量重構(gòu)序列擬合曲線近似于一上升直線??梢园l(fā)現(xiàn),由首個成份形成的重構(gòu)序列能夠較好地捕捉原始序列的趨勢。
圖3中,由前2-5個成份形成的重構(gòu)序列擬合曲線波動變化比較平緩,沒有出現(xiàn)銳角變化情況,而且基本上反映了原始序列的波動變化。由于金融時間序列中普遍存在噪聲,噪聲點(diǎn)通常呈現(xiàn)出較大的波動變化(表現(xiàn)為較為尖銳的齒狀),因此,可將由前2-5個成份形成的重構(gòu)序列近似地看成原始序列的波動成份,其很好刻畫了原始序列的波動變化。
圖4中,由前5個成份形成的重構(gòu)序列擬合曲線波動變化相對于原始序列較平緩,其較好地過濾了噪聲數(shù)據(jù),實(shí)現(xiàn)了對原始序列的逼近。該文用該5個成份形成的降噪重構(gòu)序列作為廣義神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入。
該文提出了一種基于奇異譜分析的廣義神經(jīng)網(wǎng)絡(luò)預(yù)測方法,其基本工作原理:首先對原始序列進(jìn)行奇異譜分析得到降噪后的重構(gòu)序列,然后將廣義神經(jīng)網(wǎng)絡(luò)應(yīng)用于該重構(gòu)序列。相比傳統(tǒng)的奇異譜分析預(yù)測(如caterpillar SSA3.3[10])主要采用線性遞歸函數(shù)為預(yù)測模型。
對于廣義神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,最為關(guān)鍵的參數(shù)為前面所提的平滑因子σ,考慮到廣義神經(jīng)網(wǎng)絡(luò)是一類訓(xùn)練速度快,非線性映射能力強(qiáng),能以任意速度逼近任意連續(xù)函數(shù)的網(wǎng)絡(luò)模型。該文通過考慮預(yù)測誤差(絕對值形式)試探性地在[ ]0.01,0.5間選擇平滑因子σ。
對原始序列和重構(gòu)序列進(jìn)行廣義回歸神經(jīng)網(wǎng)絡(luò)預(yù)測的平滑因子與預(yù)測誤差的關(guān)系見圖5。從圖中可知,兩曲線均呈現(xiàn)出先減后增的趨勢,其中前者在平滑因子為0.12時取得最小誤差均值0.005 004,后者在平滑因子為0.07時取得最小誤差均值0.002 877。故對于原始序列應(yīng)用GRNN時,平滑因子取0.12;對于重構(gòu)序列則取0.07。
由于影響股票價格難以進(jìn)行長期預(yù)測,往往只能進(jìn)行短期的預(yù)測。該文使用GRNN,LRF+SSA和GRNN+SSA三種方法對同方股份的收盤價格進(jìn)行未來一天的預(yù)測。GRNN直接將原始數(shù)據(jù)為其輸入進(jìn)行預(yù)測;LRF+SSA先利用SSA獲得降噪成份,后以LRF為模型進(jìn)行預(yù)測;GRNN+SSA同樣先利用SSA獲取降噪成份,再使用GRNN進(jìn)行預(yù)測。各類方法的預(yù)測值及其預(yù)測誤差見表1,從表中可以發(fā)現(xiàn),采用LRF+SSA方法進(jìn)行預(yù)測的誤差值最大,GRNN次之,而GRNN+SSA預(yù)測誤差最小,原因在于GRNN+SSA方法既能有效利用SSA技術(shù)降噪能力,又能攝取GRNN強(qiáng)大的非線性映射能力及任意逼近能力,從而使其達(dá)到了較兩者更優(yōu)的預(yù)測效果。
表1 各類預(yù)測值及誤差Tab.1 Various predicted values and error
提出了基于奇異譜分析的廣義神經(jīng)網(wǎng)絡(luò)預(yù)測方法GRNN+SSA,并將其應(yīng)用于同方股份收盤價格的短期預(yù)測,實(shí)驗(yàn)結(jié)果表明,GRNN+SSA預(yù)測效果明顯好于傳統(tǒng)的LRF+SSA及GRNN方法,原因在于,GRNN+SSA方法同時兼有SSA和GRNN方法的優(yōu)點(diǎn),即集成了SSA降噪能力及GRNN的強(qiáng)大非線性映射與任意逼近能力。因此,可試將其推廣用于回歸復(fù)雜多噪聲時間序列的分析建模。
[1]BODYANSKIYY,POPOV S.Neural network approach to forecasting of quasiperiodic financial time series[J].European Journal of Operational Research,2006,175(3):1357-1366.
[2]MAHFOUD S,MANI G.Financial forecasting using genetic algorithms[J].Applied Artificial Intelligence,1996,10(6):543-565.
[3]KIM K.Financial time series forecasting using support vector machines[J].Neurocomputing,2003,55(1/2):307-319.
[4]HASSANI H,HERAVI S,ZHIGLJAVSKY A.Forecasting European industrial production with singular spectrum analysis[J].International Journal of Forecasting,2008,25(1):103-118.
[5]GOLYANDINA V N A Z.Analysis of Time Series Structure:SSA and Related Techniques[M].London:Chapman&CRC ,2001.
[6]HASSANI H.Singular spectrum analysis based on the minimum variance estimator[J].Nonlinear Analysis:Real World Applications,2010,11(3):2065-2077.
[7]HASSANI H,SOOFI A S,ZHIGLJAVSKY AA.Predicting daily exchange rate with singular spectrum analysis[J].Nonlinear Analysis:Real WorldApplications.2010,11(3):2023-2034.
[8]梁鳳國,李帥瑩,于淼,等.基于GRNN神經(jīng)網(wǎng)絡(luò)的參考作物騰發(fā)量預(yù)測[J].人民長江,2009,40(05):58-59.
[9]馮志鵬,宋希庚,薛冬新,等.基于廣義回歸神經(jīng)網(wǎng)絡(luò)的時間序列預(yù)測研究[J].振動、測試與診斷,2003,23(2):105-109.