趙慶國,孔祥月,劉莉明,楊龍倩
(沈陽航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,沈陽 110136)
隨著我國經(jīng)濟(jì)高速發(fā)展,國民積累了越來越多的閑置資金。金融市場中最主要的金融工具之一股票成為國人重要的投資渠道被廣泛普及。在近年來全球經(jīng)濟(jì)普遍低迷的環(huán)境下,實(shí)體經(jīng)濟(jì)萎靡不振,投資渠道縮窄,出于保值增值的目的大量資金涌入股市,股價(jià)能否預(yù)測以及如何預(yù)測,是廣大投資者所關(guān)注的熱點(diǎn)。
2013年,Eugene Fama等借由“可預(yù)期性”研究獲得諾貝爾經(jīng)濟(jì)學(xué)獎,他們認(rèn)為股票和債券的短期價(jià)格預(yù)測是不可行的,但是卻在長期預(yù)測上具有可行性。在成功證實(shí)了股票長期預(yù)測可行性的假設(shè)后,短期內(nèi)股價(jià)是否可以預(yù)測、怎樣預(yù)測進(jìn)一步成為學(xué)者們研究的熱點(diǎn)。
大部分股民在股價(jià)預(yù)測時(shí)采用簡便可行的算術(shù)平均數(shù)法估計(jì)股價(jià),但我們通過對金融市場的觀察可以發(fā)現(xiàn),歷史股價(jià)隨著時(shí)間由遠(yuǎn)及近對未來股價(jià)期望值的影響是不一樣的。比如說,一個(gè)之前股價(jià)表現(xiàn)很差而最近表現(xiàn)很好的證券要比之前表現(xiàn)很好而最近表現(xiàn)很差的證券具有更高的期望,即對不同時(shí)期的證券收益率關(guān)注度具有差異,我國學(xué)者王振山[1]和林虎[2]曾就關(guān)注度與證券收益率之間的關(guān)系做過研究,結(jié)果表明關(guān)注度與股票收益率之間存在聯(lián)系。而股民們普遍采用的算數(shù)平均數(shù)法將每期歷史股價(jià)等量齊觀,賦予相同權(quán)重值,缺乏對新信息的重視。因此本文參照會計(jì)學(xué)中固定資產(chǎn)折舊采用的年數(shù)總和法,基于厚今薄古思想對歷史股價(jià)由遠(yuǎn)及近賦予遞增的權(quán)重,提出一種短期股價(jià)預(yù)測模型即時(shí)序權(quán)重均值模型。
國內(nèi)外學(xué)者探究了諸多股價(jià)預(yù)測模型。早在2009年,依據(jù)建模理論,沈巍[3]已將國內(nèi)外股票價(jià)格預(yù)測模型劃分為兩大類:以統(tǒng)計(jì)原理為基礎(chǔ)的傳統(tǒng)型波動率預(yù)測模型(ARCH模型和SV模型)和創(chuàng)新型預(yù)測模型(神經(jīng)網(wǎng)絡(luò)、灰色理論、支持向量機(jī)等)。我國學(xué)者鄭亞磊[4]將股市預(yù)測基本方法分為基本面分析方法、技術(shù)分析方法、時(shí)間序列分析法和人工神經(jīng)網(wǎng)絡(luò)預(yù)測法。近年主要以時(shí)間序列預(yù)測模型、神經(jīng)網(wǎng)絡(luò)模型和支持向量機(jī)模型為主。
時(shí)間序列模型主要通過統(tǒng)計(jì)軟件對歷史股價(jià)有利信息的提取構(gòu)建預(yù)測模型。覃思乾[5]建立基于小樣本的GM(1,1)模型,選取波導(dǎo)股份股價(jià)數(shù)據(jù)檢驗(yàn)?zāi)P途炔⑴cARIMA模型對比分析,結(jié)果表明短期預(yù)測中GM(1,1)模型預(yù)測效果優(yōu)于ARIMA模型。吳玉霞[6]建立基于大樣本的ARIMA模型,并選取“華泰證券”250期歷史收盤價(jià)從動態(tài)和靜態(tài)兩個(gè)角度對未來三期股價(jià)進(jìn)行預(yù)測,結(jié)果顯示模型擬合效果良好。張斌[7]針對不同波動程度的股價(jià)建立了基于ESN的行業(yè)通用模型和KMeans-ESN預(yù)測模型,通過仿真實(shí)驗(yàn)發(fā)現(xiàn)股價(jià)短期預(yù)測中當(dāng)數(shù)據(jù)波動較大時(shí)適合采用基于ESN的行業(yè)通用模型,反之采用KMeans-ESN預(yù)測模型。
神經(jīng)網(wǎng)絡(luò)模型和支持向量機(jī)模型(SVM)均是非線性的系統(tǒng)預(yù)測模型。White[8]首次將BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于預(yù)測股價(jià)中,但由于算法存在缺陷導(dǎo)致預(yù)測準(zhǔn)確度較低。隨后一些學(xué)者結(jié)合不同智能算法通過優(yōu)化權(quán)值和閾值縮小神經(jīng)網(wǎng)絡(luò)模型對股價(jià)的預(yù)測誤差。李松[9]采用粒子群算法、孫晨[10]等使用布谷鳥算法、郭建峰[11]采用LM和GA算法等優(yōu)化神經(jīng)網(wǎng)絡(luò)。隨著數(shù)據(jù)挖掘和人工智能的進(jìn)一步發(fā)展,支持向量預(yù)測模型(SVM)出現(xiàn)。彭麗芳[12]構(gòu)建了基于時(shí)間序列的支持向量機(jī)模型(SVM),以沙河股份為樣本選取84天交易日收盤價(jià)數(shù)據(jù)為基期預(yù)測第85日收盤價(jià),預(yù)測結(jié)果優(yōu)于神經(jīng)網(wǎng)絡(luò)模型和時(shí)間序列模型。Francis[13]采用支持向量機(jī)模型(SVM)預(yù)測期貨數(shù)據(jù),相較于神經(jīng)網(wǎng)絡(luò)模型支持向量機(jī)模型(SVM)具有更高的泛化能力和預(yù)測精度。
為克服單一模型預(yù)測準(zhǔn)確度不高的問題,混合模型備受追捧。肖祎平[14]將幾種表現(xiàn)較好的預(yù)測模型(ARIMA、GM(1.1)等)進(jìn)行組合,對每個(gè)模型的預(yù)測結(jié)果賦予不同權(quán)重組合成新的預(yù)測值,研究結(jié)果表明組合模型的預(yù)測效果高于單一模型。Guresena[15]組合GARCH 模型和ANN 模型對股價(jià)進(jìn)行預(yù)測。陳亞靜[16]等結(jié)合非線性自回歸模型(NCF)與粒子濾波(PF),選取邯鄲鋼鐵股票的171期歷史收盤價(jià)進(jìn)行股價(jià)實(shí)時(shí)預(yù)測,發(fā)現(xiàn)組合后的PF-NCF預(yù)測模型的預(yù)測準(zhǔn)確度高于傳統(tǒng)的NCF模型。
現(xiàn)有股價(jià)預(yù)測模型構(gòu)建比較復(fù)雜,需要借助統(tǒng)計(jì)軟件回歸或訓(xùn)練機(jī)器學(xué)習(xí),不適合廣大投資者的實(shí)際應(yīng)用,而普遍采用的算數(shù)平均法缺乏對時(shí)間序列的考慮,導(dǎo)致預(yù)測準(zhǔn)確度較低。所以本文提出的時(shí)序權(quán)重均值模型具有較好的現(xiàn)實(shí)意義和實(shí)用價(jià)值,時(shí)序權(quán)重均值模型是基于厚今薄古的思想,考慮時(shí)間序列,對歷史股價(jià)由遠(yuǎn)及近賦予遞增權(quán)重的一種股價(jià)預(yù)測模型。它具有計(jì)算簡便和預(yù)測精度良好的優(yōu)勢,在廣大股民預(yù)測股價(jià)時(shí)具有較好的適用性。
時(shí)序權(quán)重均值模型的提出源于會計(jì)學(xué)中固定資產(chǎn)折舊的年數(shù)總和法思想。年數(shù)總和法認(rèn)為固定資產(chǎn)貶值速度是經(jīng)歷一個(gè)先快后慢的過程的,所以在對固定資產(chǎn)計(jì)提折舊時(shí),隨時(shí)間增長對固定資產(chǎn)計(jì)提折舊的權(quán)重值呈遞減趨勢。每期計(jì)提折舊的權(quán)重值的設(shè)定不同,假如該固定資產(chǎn)可使用年限為m年,那么第一年的折舊權(quán)重值為m/(1+2+…+m),第二年權(quán)重值為(m-1)/(1+2+…+m),…,第m年折舊權(quán)重值為1/(1+2+…+m)。即分母為該固定資產(chǎn)可使用年限的加總,分子為截至該期的尚可使用年限,折舊權(quán)重值的加總為1。
然而,相對于年數(shù)總和法計(jì)提折舊中的厚古薄今思想來說,對股價(jià)的預(yù)測與之相反,采用厚今薄古、新信息優(yōu)先的思想。由于證券市場不穩(wěn)定,在一定程度上投資者對證券投資相關(guān)信息的掌握會受時(shí)間變化及外部環(huán)境影響,離預(yù)測期越近的歷史價(jià)格對預(yù)測期的參考價(jià)值越大,離預(yù)測期較遠(yuǎn)的歷史價(jià)格對預(yù)測期的參考價(jià)值相對會小一些。因此,隨著與預(yù)測日距離由遠(yuǎn)及近的變化,我們對歷史股價(jià)賦予遞增的權(quán)重值,依據(jù)時(shí)間遠(yuǎn)近量化個(gè)股歷史價(jià)格的時(shí)序信息,借以度量不同時(shí)期歷史股價(jià)對預(yù)測值的影響。
(1)權(quán)重設(shè)置
……;
(2)時(shí)序權(quán)重均值模型構(gòu)建
(1)
為計(jì)算簡便適用廣泛,同時(shí)使預(yù)測值能夠更好地反映股價(jià)走勢,本文將股票歷史收盤價(jià)權(quán)重由遠(yuǎn)及近賦為等差數(shù)值且遞增,具體權(quán)重賦值以樣本涵蓋的時(shí)序區(qū)間的加總∑t為分母,樣本時(shí)序t為分子,對相應(yīng)時(shí)序的股票歷史收盤價(jià)進(jìn)行權(quán)重賦值,即設(shè)w1=1;w2=2,…,wt=t,每期的權(quán)重值ξi=i/(1+2+…+t),其中i∈(1,t)。預(yù)測值中更加強(qiáng)調(diào)股價(jià)之中包含的新信息,進(jìn)而求得時(shí)序權(quán)重均值模型的預(yù)測值,具體賦值情況如式(2)所示。
(2)
(3)時(shí)序權(quán)重均值模型與算數(shù)平均數(shù)法的區(qū)別
例如,下面是連續(xù)三期的某兩只股票收盤價(jià)的時(shí)間序列數(shù)據(jù)。
表1 某兩支股票連續(xù)三期收盤價(jià)數(shù)據(jù)
采用算術(shù)平均法和時(shí)序權(quán)重均值模型分別計(jì)算,得出如下結(jié)果:
通過上述計(jì)算可以看到時(shí)序權(quán)重均值模型的計(jì)算與算術(shù)平均法計(jì)算的均值的區(qū)別。時(shí)序權(quán)重均值模型更加重視股票近期的收盤價(jià)包含的信息,預(yù)測值對股價(jià)的變化反應(yīng)靈活,更好反應(yīng)股價(jià)未來發(fā)展趨勢。
本文隨機(jī)選取中國A股市場中的207支股票作為研究樣本,其中已經(jīng)剔除ST、*ST類和數(shù)據(jù)缺失的股票。為更好檢驗(yàn)預(yù)測效果,本文選取2018年1月1日至2018年12月31日共243個(gè)交易日的收盤價(jià)作為預(yù)測數(shù)據(jù),所有數(shù)據(jù)均來源于CSMAR數(shù)據(jù)庫。本文所有運(yùn)算采用JAVA和EXCEL 2010軟件。
對于短期預(yù)測的時(shí)間段選取,考慮到股票市場時(shí)常處于調(diào)整狀態(tài)[7],同時(shí)借鑒周兆麟和吳玉霞等學(xué)者的經(jīng)驗(yàn),主要選用了不超過五天的歷史收盤價(jià)為預(yù)測基期數(shù)據(jù)。鑒于動態(tài)預(yù)測容易產(chǎn)生累積誤差[6],本文主要是靜態(tài)預(yù)測,即用可獲得的歷史股價(jià)預(yù)測接下來的走勢。同時(shí)西方股市常常選取好幾種項(xiàng)數(shù)(時(shí)間段)對比分析其走勢預(yù)測的準(zhǔn)確性,本文也選取了三種不同區(qū)間預(yù)測。一是基于連續(xù)三日(T=3)歷史收盤價(jià)預(yù)測接下來第四日收盤價(jià),即1月2日-4日作為基期預(yù)測5日,1月3日-5日作為基期預(yù)測8日……12月25日-27日作為基期預(yù)測28日,共計(jì)觀測240次。二是基于連續(xù)四日(T=4)歷史收盤價(jià)預(yù)測接下來第五日收盤價(jià),即1月2日-5日作為基期預(yù)測8日,1月3日-8日作為基期預(yù)測9日……12月24日-27日作為基期預(yù)測28日,共計(jì)觀測239次。三是基于連續(xù)五日(T=5)歷史收盤價(jià)預(yù)測接下來第六日收盤價(jià),即1月2日-8日作為基期預(yù)測9日,1月3日-9日作為基期預(yù)測10日……12月21日-27日作為基期預(yù)測28日,共計(jì)觀測238次。具體樣本區(qū)間如表2所示。
表2 預(yù)測區(qū)間
基于T=3/4/5三個(gè)預(yù)測區(qū)間下,兩種方法的計(jì)算如下。
(1)算數(shù)平均數(shù)法預(yù)測值的計(jì)算,見式(2)-(4)所示。
(2)
(3)
(4)
其中:p1、p2、p3、p4、p5是按時(shí)間升序排序的連續(xù)五天歷史收盤。
(2)時(shí)序權(quán)重均值模型預(yù)測值的計(jì)算,見式(5)-(7)所示。
(5)
(6)
(7)
其中:p1、p2、p3、p4、p5是按時(shí)間升序排序的連續(xù)五天歷史收盤價(jià)。
圖1 兩種方法股價(jià)預(yù)測值與實(shí)際值組合圖
根據(jù)式(2)-式(7)計(jì)算兩種模型在三個(gè)基期下的預(yù)測值,為使預(yù)測精度具有對比性,又進(jìn)一步計(jì)算了平均絕對誤差(表3),同時(shí)為使結(jié)果更直觀,將兩種方法按預(yù)測時(shí)間繪制成預(yù)測年線。主要反應(yīng)一年之中(本文的樣本年為2018年)股價(jià)真實(shí)值走勢、算數(shù)平均數(shù)預(yù)測值走勢和時(shí)序權(quán)重均值模型預(yù)測值走勢,判斷哪一種預(yù)測方式下的預(yù)測值與真實(shí)值走勢趨同(圖2)。同時(shí),為清晰看到兩種方法的誤差情況,繪制了誤差差值圖(圖3),由于受篇幅限制,本文僅列出五天預(yù)測區(qū)間下的情況。
表3 預(yù)測精度表
圖2 T=5時(shí)兩種方法預(yù)測精度圖
圖3 T=5時(shí)兩種方法平均絕對誤差圖
(1)207支樣本股票分別采用了時(shí)序權(quán)重均值模型和算數(shù)平均法兩種方法預(yù)測,每只股票觀測次數(shù)最高達(dá)240次,預(yù)測精度表(表3)中的平均絕對誤差(MAE)顯示,從基于三日、四日和五日預(yù)測的整體效果上來看,時(shí)序權(quán)重均值模型預(yù)測值的平均絕對誤差(MAE)均低于算數(shù)平均數(shù)法,表明該種方法精準(zhǔn)度更高。觀察圖2可以看出,當(dāng)股價(jià)發(fā)生變化時(shí),算數(shù)平均數(shù)法的預(yù)測值存在更長的滯后性,相較之下時(shí)序權(quán)重均值模型對股價(jià)變化的反應(yīng)更加靈敏。比如當(dāng)真實(shí)股價(jià)呈上漲趨勢時(shí),時(shí)序權(quán)重均值模型的預(yù)測值也更傾向于上漲,更好地反應(yīng)實(shí)際情況,而算數(shù)平均數(shù)上漲幅度則較低,反應(yīng)速度較慢。圖3顯示時(shí)序權(quán)重均值模型的平均絕對誤差(MAE)更接近0,誤差值顯著小于算數(shù)平均數(shù)法。因此,時(shí)序權(quán)重均值模型具有較好的預(yù)測效果。
(2)進(jìn)一步發(fā)現(xiàn)不同預(yù)測基期所產(chǎn)生的預(yù)測效果也具有差異,一是隨著預(yù)測基期的增長,時(shí)序權(quán)重均值模型預(yù)測值的平均絕對誤差(MAE)逐漸增長,二是隨預(yù)測基期的增長,兩種方法平均絕對誤差(MAE)之差呈上升態(tài)勢?;谌?、四、五日基期下預(yù)測股價(jià),時(shí)序權(quán)重均值模型預(yù)測的平均絕對誤差(MAE)相較于算數(shù)平均數(shù)法分別降低了0.1015、0.1273、0.1428。綜合來看以連續(xù)三日歷史收盤價(jià)為預(yù)測基期,預(yù)測日為第四日時(shí),時(shí)序權(quán)重均值模型的預(yù)測效果優(yōu)于以四天和五天為基期的預(yù)測效果。
本文在傳統(tǒng)的預(yù)測手段之外,基于厚今薄古、新信息優(yōu)先理論,吸取會計(jì)學(xué)中固定資產(chǎn)折舊的年數(shù)總和法思想,對歷史股價(jià)注入時(shí)間概念,提出一種短期股價(jià)預(yù)測模型即時(shí)序權(quán)重均值模型。時(shí)序權(quán)重均值模型利用簡單的時(shí)間序列對不同時(shí)期收盤價(jià)賦予不同的權(quán)重計(jì)算預(yù)期收盤價(jià),是一種簡便高效的方法,克服了常用的算數(shù)平均數(shù)法的滯后性,對股價(jià)的變化具有更強(qiáng)的敏感性和靈活性,能更好地反映證券價(jià)格的走勢,具有較好的實(shí)際應(yīng)用價(jià)值。
證券投資時(shí)短期股價(jià)的變化趨勢是投資者關(guān)注的重點(diǎn),準(zhǔn)確預(yù)測股價(jià)變化可以幫助投資者規(guī)避風(fēng)險(xiǎn)。本文構(gòu)建的時(shí)序權(quán)重均值模型相較于投資者普遍采用的算數(shù)平均數(shù)法,在股價(jià)預(yù)測中具有更好的適用性,能平均降低11.6%的誤差,提高了投資者股價(jià)預(yù)測精確度,進(jìn)一步提高了規(guī)避市場風(fēng)險(xiǎn)的能力。
時(shí)序權(quán)重均值模型的清晰明了、簡便易算及預(yù)測精準(zhǔn)度高等優(yōu)勢,具有較好的運(yùn)用空間和前景。時(shí)序權(quán)重均值模型在實(shí)際應(yīng)用中可以有更廣泛的探究,如探究該模型的泛化能力。本文研究的是基于連續(xù)三天、四天和五天歷史收盤價(jià)預(yù)測接下來一天收盤價(jià),未來可深入探討預(yù)測日分別為周一至周五時(shí)預(yù)測效果是否有差異等。且本文僅預(yù)測一期股價(jià),未來可探究多期的動態(tài)預(yù)測效果。