程麗娟,馮潔明
(嶺南師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣東 湛江 524048)
在金融市場(chǎng)中,股票市場(chǎng)可以合理配置市場(chǎng)資源,控制市場(chǎng)金融風(fēng)險(xiǎn).對(duì)股票走勢(shì)的研究,主要有現(xiàn)代統(tǒng)計(jì)學(xué)分析法和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法[1-3].孟坤和李麗運(yùn)用ARMA模型對(duì)上證指數(shù)日收盤(pán)價(jià)進(jìn)行擬合靜態(tài)預(yù)測(cè)[4];陳倩文將ARMA模型和GARCH模型結(jié)合對(duì)滬深300股指期貨價(jià)格進(jìn)行預(yù)測(cè)[5].Kim和Shin將神經(jīng)網(wǎng)絡(luò)模型和遺傳算法相結(jié)合預(yù)測(cè)股票價(jià)格[6].
筆者選取中國(guó)聯(lián)通(600050)2020年7月1日至2020年9月18日的股票日收盤(pán)價(jià),通過(guò)均值-標(biāo)準(zhǔn)差分級(jí)法對(duì)股票日收盤(pán)價(jià)進(jìn)行狀態(tài)分級(jí),使用加權(quán)馬爾可夫模型對(duì)未來(lái)3天日收盤(pán)價(jià)區(qū)間進(jìn)行預(yù)測(cè),并使用模糊集理論的級(jí)別特征值對(duì)收盤(pán)價(jià)進(jìn)行預(yù)測(cè).為了提高模型的適用性,分別選取2020年7月1日至2020年9月18日及2019年12月2日至2020年2月28日的上證指數(shù)和恒瑞醫(yī)藥的收盤(pán)價(jià)對(duì)未來(lái)3天的數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)效果較好.
使用馬爾可夫模型預(yù)測(cè)股票時(shí),通??紤]前一時(shí)刻股票價(jià)格對(duì)后一時(shí)刻的影響,但前若干天的股票價(jià)格也可能對(duì)當(dāng)前時(shí)刻的價(jià)格有影響.因此,以各階自相關(guān)系數(shù)作為前若干天對(duì)當(dāng)天狀態(tài)的影響權(quán)重,最后用各狀態(tài)加權(quán)求和的概率來(lái)預(yù)測(cè)當(dāng)天股票收盤(pán)價(jià)所處的狀態(tài)[7].
由加權(quán)馬爾可夫模型預(yù)測(cè)得到股票日收盤(pán)價(jià)所處的區(qū)間,使用模糊集理論中的級(jí)別特征值計(jì)算出具體的股票日收盤(pán)價(jià).對(duì)各狀態(tài)賦予權(quán)重,根據(jù)權(quán)重公式計(jì)算出級(jí)別特征值,將級(jí)別特征值與預(yù)測(cè)狀態(tài)進(jìn)行比較,得出股票日收盤(pán)價(jià).權(quán)重公式為:
其中pi表示第i級(jí)別的預(yù)測(cè)概率,η表示最大概率作用系數(shù),通常η=2[8].級(jí)別特征值公式為:
計(jì)算股票日收盤(pán)價(jià)X方法有兩種,方法一為:
其中i與max{pi,i∈S}的i對(duì)應(yīng),Ti和Bi分別指狀態(tài)i對(duì)應(yīng)區(qū)間的上下限.
方法二為:
其中i是級(jí)別特征值H的整數(shù)部分,Ti+1和Bi+1分別是指狀態(tài)i+1對(duì)應(yīng)區(qū)間的上下限.
筆者選取中國(guó)聯(lián)通(600050)2020年7月1日至2020年9月18日共58天的股票日收盤(pán)價(jià)作為研究序列,用加權(quán)馬爾可夫模型對(duì)其進(jìn)行預(yù)測(cè),數(shù)據(jù)來(lái)源于網(wǎng)易財(cái)經(jīng)網(wǎng).
(1)這58天的中國(guó)聯(lián)通股票日收盤(pán)價(jià)的均值X=5.1821,標(biāo)準(zhǔn)差σ=0.137 7.
(2)根據(jù)均值-標(biāo)準(zhǔn)差分級(jí)法對(duì)中國(guó)聯(lián)通股票的日收盤(pán)價(jià)進(jìn)行狀態(tài)劃分(見(jiàn)表1).
表1 中國(guó)聯(lián)通股票日收盤(pán)價(jià)狀態(tài)劃分
(3)根據(jù)(2)得到的狀態(tài)分級(jí)表,對(duì)2020年7月1日至2020年9月18日共58天的中國(guó)聯(lián)通股票日收盤(pán)價(jià)序列進(jìn)行狀態(tài)劃分,結(jié)果見(jiàn)圖1.
圖1 中國(guó)聯(lián)通股票天數(shù)狀態(tài)圖
(4)一步轉(zhuǎn)移頻數(shù)矩陣和一步轉(zhuǎn)移概率矩陣為:
(5)由一步轉(zhuǎn)移頻數(shù)矩陣可以得到邊際概率值為:p1=7/57,p2=15/57,p3=18/57,p4=7/57,p5=7/57.統(tǒng)計(jì)量χ2的值,見(jiàn)表2.
表2 統(tǒng)計(jì)量χ2的計(jì)算過(guò)程
由表2可以得到統(tǒng)計(jì)量χ2=72.03>,則該股票的日收盤(pán)價(jià)序列通過(guò)馬氏性檢驗(yàn).
(6)各階自相關(guān)系數(shù)rk和標(biāo)準(zhǔn)化的各階自相關(guān)系數(shù)wk,見(jiàn)表3.
表3 1~5階的自相關(guān)系數(shù)和各步長(zhǎng)權(quán)重
(7)由一步轉(zhuǎn)移概率矩陣P(1)可以得到2~5階的轉(zhuǎn)移概率矩陣.
(8)根據(jù)前5天的中國(guó)聯(lián)通股票日收盤(pán)價(jià)及對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移概率矩陣對(duì)2020年9月21日的日收盤(pán)價(jià)及所處的狀態(tài)進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表4.
表4 2020年3月2日中國(guó)聯(lián)通股票日收盤(pán)價(jià)預(yù)測(cè)
由表4可得:max{pi,i∈S}=0.84,其中i=2,即這一天股票的日收盤(pán)價(jià)在5.04到5.11之間,由歷史資料得知,中國(guó)聯(lián)通2020年9月21日的日收盤(pán)價(jià)實(shí)際值為5.06,說(shuō)明預(yù)測(cè)結(jié)果與實(shí)際情況相符.把9月21日的日收盤(pán)價(jià)5.06代入原序列,重復(fù)步驟(1)~(8),得到9月22日的股票價(jià)格區(qū)間.
使用模糊集理論中的級(jí)別特征值預(yù)測(cè)股票的日收盤(pán)價(jià).根據(jù)公式(1)、(2)計(jì)算得到級(jí)別特征值為2.951 8.分別使用方法一和方法二得到股票未來(lái)3天的預(yù)測(cè)結(jié)果,見(jiàn)表5.
表5 未來(lái)3天的股票日收盤(pán)價(jià)的預(yù)測(cè)
方法一預(yù)測(cè)結(jié)果比加權(quán)馬爾可夫模型預(yù)測(cè)的區(qū)間要小,這是因?yàn)榉椒ㄒ挥?jì)算預(yù)測(cè)值的公式僅僅與狀態(tài)區(qū)間的上限或下限有關(guān)(見(jiàn)表5).而方法二預(yù)測(cè)結(jié)果的相對(duì)誤差明顯比方法一小,說(shuō)明基于方法二的加權(quán)馬爾可夫模型預(yù)測(cè)效果更好.
由于前文只對(duì)中國(guó)聯(lián)通1支股票進(jìn)行預(yù)測(cè),且選取的數(shù)據(jù)只包含正常周期的數(shù)據(jù),不包含春節(jié)假期以及特殊情況的數(shù)據(jù),為了提高模型的適用性,筆者還分別選取2020年7月1日至2020年9月18日以及2019年12月2日至2020年2月28日的上證指數(shù)和恒瑞醫(yī)藥的數(shù)據(jù)對(duì)未來(lái)3天的數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表6和表7.
表6 上證指數(shù)未來(lái)3天的股票日收盤(pán)價(jià)預(yù)測(cè)
表7 恒瑞醫(yī)藥未來(lái)3天的股票日收盤(pán)價(jià)預(yù)測(cè)
由表6、表7可知,使用加權(quán)馬爾可夫模型對(duì)股票進(jìn)行預(yù)測(cè),分別對(duì)正常周期的數(shù)據(jù)和疫情期間以及春節(jié)的數(shù)據(jù)進(jìn)行預(yù)測(cè),方法二的預(yù)測(cè)效果較好.
通過(guò)對(duì)中國(guó)聯(lián)通2020年7月1日至2020年9月18日共58天的股票日收盤(pán)價(jià)序列進(jìn)行χ2檢驗(yàn),得到α=0.05時(shí)滿(mǎn)足馬氏性.使用加權(quán)馬爾可夫模型預(yù)測(cè)得到9月21日的收盤(pán)價(jià)狀態(tài)為下跌,股價(jià)區(qū)間為[5.04,5.11),實(shí)際值為5.06元,在預(yù)測(cè)區(qū)間內(nèi).使用模糊集理論的級(jí)別特征值得到這3天的預(yù)測(cè)價(jià)格與實(shí)際價(jià)格的相對(duì)誤差為0.99%、1.99%和1.80%,說(shuō)明該模型對(duì)股票價(jià)格的短期預(yù)測(cè)效果較好.為了提高模型的適用性,分別選取2020年7月1日至2020年9月18日以及2019年12月2日至2020年2月28日的上證指數(shù)和恒瑞醫(yī)藥的數(shù)據(jù)對(duì)未來(lái)3天的數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)效果較好,說(shuō)明模型的適應(yīng)性較強(qiáng).
韶關(guān)學(xué)院學(xué)報(bào)2021年6期