楊嘉慶 周俊峰
摘要:本文系統(tǒng)地介紹了神經(jīng)網(wǎng)絡(luò)模型中徑向基函數(shù)網(wǎng)絡(luò)模型的數(shù)學(xué)理論,包括他的原理,算法步驟和實證過程。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)模型 徑向基函數(shù)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是一種基于腦與神經(jīng)系統(tǒng)的仿真模型,它是模擬人的神經(jīng)結(jié)構(gòu)思維并行計算方式啟發(fā)形成的一種信息描述和信息處理的數(shù)學(xué)模型。它具有自我學(xué)習(xí)能力,從一組輸入數(shù)據(jù)中學(xué)習(xí),然后不斷調(diào)整模型參數(shù),以建造更合適的模型。因此,神經(jīng)網(wǎng)絡(luò)的工作過程一般來講包含兩個階段:
訓(xùn)練階段:主要是調(diào)整網(wǎng)絡(luò)神經(jīng)元間的連接權(quán)值和連接方法等,因為事實上正是連接方式和連接權(quán)值決定了神經(jīng)網(wǎng)絡(luò)的信息處理能力,所以訓(xùn)練過程至關(guān)重要。同時,神經(jīng)網(wǎng)絡(luò)因為具有自學(xué)習(xí)和自組織的顯著特征,它既可以有導(dǎo)師也可以無導(dǎo)師的自主學(xué)習(xí),從而能夠適應(yīng)外界環(huán)境的復(fù)雜變化。
驗證階段:在這個階段網(wǎng)絡(luò)的各項已經(jīng)訓(xùn)練好的參數(shù)都不會發(fā)生變化,此階段的工作過程主要體現(xiàn)在建立輸入數(shù)據(jù),然后根據(jù)已經(jīng)訓(xùn)練好的最有參數(shù)建立系統(tǒng)模型,然后再得到輸出數(shù)據(jù),最后比較實際數(shù)據(jù)與輸出數(shù)據(jù)的誤差。
人工神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)上已經(jīng)得到證明,當(dāng)條件允許時,它可以無限可能地逼近實際函數(shù),這意味著無論反映實際規(guī)律的函數(shù)有多復(fù)雜,形式有多不規(guī)范,神經(jīng)網(wǎng)絡(luò)都能逼近那些并不“友好”的函數(shù),這樣得天獨(dú)厚的特點對于復(fù)雜多變的股票市場無疑具有特別實際的意義,也因此使得神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都得到了成功應(yīng)用。
目前學(xué)界比較重視同時實際應(yīng)用中也比較廣泛的神經(jīng)網(wǎng)絡(luò)預(yù)測方法有前饋式神經(jīng)網(wǎng)絡(luò)(BP網(wǎng)絡(luò)),徑向基函數(shù)網(wǎng)絡(luò)(RBF),反饋式網(wǎng)絡(luò)等。目前BP神經(jīng)網(wǎng)絡(luò)在各個領(lǐng)域中得到較多的應(yīng)用,但是BP神經(jīng)網(wǎng)絡(luò)也有一個比較致命的弱點,就是網(wǎng)絡(luò)收斂過程常常難以超越局部極小范圍而無法最終收斂到全局最小。徑向基函數(shù)網(wǎng)絡(luò)是一種三層前饋式神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,在RBF網(wǎng)絡(luò)中,隱含層節(jié)點的作用實際上就是執(zhí)行一種非線性變換,使當(dāng)有外界輸入后,它會利用基函數(shù)實現(xiàn)線性加權(quán)組合,從而達(dá)到從輸入空間到隱層空間的非線性映射。它具有特別出眾的非線性方面的擬合能力,理論上能夠無限度的逼近任意給定的非線性函數(shù)。這樣,徑向基函數(shù)網(wǎng)絡(luò)的學(xué)習(xí)過程可以看作是在高維空間中尋找對于一個已經(jīng)指定訓(xùn)練數(shù)據(jù)而言的最優(yōu)擬合超平面。
1.首先對原始數(shù)據(jù)進(jìn)行歸一化處理,然后構(gòu)建訓(xùn)練集的輸入向量和輸出向量。以每5天的收盤價作為輸入向量,這樣的做的好處是能夠使股票數(shù)據(jù)的趨勢性規(guī)律更明顯的顯現(xiàn)出來,然后以第6天的收盤價作為輸出向量。
2.確定最優(yōu)隱節(jié)點數(shù),通過不斷的嘗試,在1~50的范圍內(nèi),40是最優(yōu)隱節(jié)點數(shù)。
3.在確定好了隱節(jié)點數(shù)后,進(jìn)行實際值得預(yù)測。測試集的輸入向量是后20組的股票收盤價,直接采用MATLAB自帶工具箱進(jìn)行預(yù)測。
4.模型結(jié)果評價。得到預(yù)測數(shù)據(jù)之后,對測試結(jié)果進(jìn)行分析評價,評價的指標(biāo)即是上文所提到的均方根誤差(RMSE)、平均相對誤差(MAPE)和相關(guān)系數(shù)R,對同一個預(yù)測變量,其RMSE與MAPE取值越小,說明預(yù)測精度越高。R是對預(yù)測值序列和樣本序列線性相關(guān)程度的衡量。相關(guān)系數(shù)有如下性質(zhì):若R的值越大,預(yù)測值序列與參考值序列線性關(guān)系越密切,預(yù)測精度也就越高。一般而言,線性相關(guān)系數(shù)越大,其均方根誤差和平均相對誤差越小,對各個不同的預(yù)測變量RMSE與MAPE相差很大,沒有統(tǒng)一的標(biāo)準(zhǔn),而R是一個標(biāo)準(zhǔn)的位于[-L1]區(qū)間的數(shù)值,便于分析比較。所以在本例中,使用相關(guān)系數(shù)R作為衡量模型預(yù)測精度的標(biāo)準(zhǔn),RMSE與MAPE僅做輔助參考用。結(jié)果表明,神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度在預(yù)期范圍內(nèi),不過模型結(jié)果仍需進(jìn)一步完善。
總體來說,人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果還是比較可靠的,尤其針對小規(guī)模樣本,而且神經(jīng)網(wǎng)絡(luò)的時間和內(nèi)存空間的開銷都極其有限,需要注意的就是如何選取對預(yù)測精度其重要作用的隱節(jié)點數(shù)。