鄧穎睿
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
近年來(lái),隨著人工智能的飛速發(fā)展,交叉學(xué)科的日益深入,一些在其他領(lǐng)域應(yīng)用的技術(shù)不斷地運(yùn)用在股票預(yù)測(cè)中,如隨機(jī)過(guò)程、混淆理論以及小波分析等。這些新方法的引入為股票預(yù)測(cè)研究注入了強(qiáng)大的動(dòng)力。目前,人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等計(jì)算機(jī)技術(shù)已經(jīng)成為研究人員和投資者研究股市的重要方法。早在兩百年前,K線圖已用于預(yù)測(cè)價(jià)格方向和市場(chǎng)轉(zhuǎn)折點(diǎn)[3],通過(guò)不斷實(shí)踐和總結(jié),形成了較完整的理論體系,但這是一種基于感知的方法,極具主觀因素,沒(méi)有清晰的界定。因此,為模仿人腦的不確定性概念判斷和推理思維方式,以解決對(duì)界限不清晰的定性知識(shí)與經(jīng)驗(yàn)難以量化的問(wèn)題,前人將模糊邏輯使用到金融領(lǐng)域。模糊邏輯是一門建立在多值邏輯基礎(chǔ)上,運(yùn)用模糊集合的方法來(lái)研究模糊性思維、語(yǔ)言形式及其規(guī)律的學(xué)科。其原理是借助于隸屬度函數(shù)概念,區(qū)分模糊集合,處理模糊關(guān)系,模擬人腦實(shí)施規(guī)則推理。模糊邏輯為解決此類問(wèn)題提供了參考,實(shí)踐證明應(yīng)用模糊邏輯確實(shí)可以有效增強(qiáng)預(yù)測(cè)模型乃至交易模型的準(zhǔn)確率。
早在2004年,模糊邏輯已經(jīng)被用來(lái)將人類的認(rèn)知融入到技術(shù)模式地中來(lái);2006年首次將模糊邏輯應(yīng)用于基于K線圖的金融預(yù)測(cè)領(lǐng)域;隨著神經(jīng)網(wǎng)絡(luò)算法的興起,2016年 Kumar和 Ravi應(yīng)用神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)、模糊邏輯(Fuzzy Logic)開(kāi)發(fā)技術(shù)交易策略[4];2017年Garcia Santesmases在前人基礎(chǔ)上將模糊邏輯應(yīng)用于K線圖[5],設(shè)置模糊規(guī)則,用以模糊表達(dá)幾種K線圖特殊形態(tài),但這樣依然存在較大主觀性,對(duì)金融領(lǐng)域知識(shí)要求較高。因此,為進(jìn)一步降低主觀因素影響,在現(xiàn)有研究的基礎(chǔ)上,本文構(gòu)建了一個(gè)基于模糊K線圖的CNN股指預(yù)測(cè)模型,對(duì)下一周期股指趨勢(shì)實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)。
目前我國(guó)資本市場(chǎng)中正在交易的金融產(chǎn)品的金融產(chǎn)品不斷豐富,這些金融產(chǎn)品自每個(gè)交易日開(kāi)盤起,就不斷產(chǎn)生新的交易數(shù)據(jù),按照交易周期的不同,交易數(shù)據(jù)可分為年數(shù)據(jù)和季度數(shù)據(jù)等,研究者根據(jù)研究目的選擇,不同時(shí)間的劃分的數(shù)據(jù),這些交易數(shù)據(jù)的統(tǒng)一表達(dá)式(1)為:
其中:Dt是該周期的具體日期和時(shí)間;Opent是t周期的開(kāi)盤價(jià);Closet是t周期的收盤價(jià);Hight是t周期的最高價(jià);Lowt是t周期的最低價(jià);vt是t周期的成交量。
K線圖[6]源自日本,經(jīng)過(guò)不斷地演變,形成了擁有完整形式和分析理論的技術(shù)分析方法。K線圖同樣可根據(jù)所去交易周期的不同而劃分為:分鐘K線圖、日K線圖、周K線圖和月K線圖等,因此一個(gè)K線圖就是一個(gè)周期,其中最直觀的信息是在該周期內(nèi)的:最高價(jià)、最低價(jià)、開(kāi)盤價(jià)以及收盤價(jià)(為了方便使用,將其表示為:最高價(jià) High(t)、最低價(jià) Low(t)、開(kāi)盤價(jià) Open(t)、收盤價(jià)Close(t)),其中將開(kāi)盤價(jià)與收盤價(jià)的價(jià)格差以矩形繪制,是為實(shí)體;最高價(jià)與實(shí)體的上端使用線段繪制,是為上影線;最低價(jià)和實(shí)體的下端同樣使用線段繪制,是為下影線;因?yàn)殚_(kāi)盤價(jià)與收盤價(jià)的價(jià)格差值存在正負(fù),約定當(dāng)價(jià)格差為正時(shí),是為陽(yáng)線(實(shí)體用紅色繪制);為負(fù)時(shí),是為陰線(實(shí)體用綠色繪制);為零時(shí)(實(shí)體使用線段繪制),如圖1所示:
圖1 K線圖表示方法
為模糊表達(dá)上、下影線和實(shí)體的長(zhǎng)度,本文以字符“Length”表示其長(zhǎng)度[7],分別以下標(biāo) Upper(上影線)、Lower(下影線)和 body(實(shí)體)予以區(qū)分,high(t)是 t周期內(nèi)最高價(jià),low(t)是 t周期內(nèi)最低價(jià),open(t)是 t周期內(nèi)開(kāi)盤價(jià),close(t)是t周期內(nèi)收盤價(jià),m為時(shí)間增量,K線圖的上影線、下影線以及體的表達(dá)公式(2)、(3)、(4)依次如下:
將計(jì)算值作為隸屬度函數(shù)的輸入(x),帶入計(jì)算隸屬度(y)以確定隸屬的模糊集合,本文研究的是對(duì)線與體長(zhǎng)度的描述,因此選擇“無(wú)”,“短”,“中長(zhǎng)”,“長(zhǎng)”作為模糊集的特征,并且在模糊集交點(diǎn)時(shí),統(tǒng)一約定選擇下一個(gè)模糊集作為其所在集,例如當(dāng)對(duì)于“中長(zhǎng)”和“長(zhǎng)”隸屬都為0.5時(shí),該數(shù)據(jù)所屬模糊集合是“長(zhǎng)”。本次選用的隸屬度函數(shù)為梯形形式[9],并且為區(qū)分陽(yáng)線陰線,選有以下兩種模糊集的表示方法,如圖2、3所示:
圖2 Lengthupper和lengthlower的隸屬度函數(shù)圖
圖3 Lengthbody的隸屬度函數(shù)圖
“Trend(t)”是指t+m時(shí)刻相對(duì)t時(shí)刻的趨勢(shì),如公式(5)所示:
為保證特征數(shù)據(jù)的代表性和豐富性,經(jīng)過(guò)多方對(duì)比篩選,本文選擇滬深三百(下文簡(jiǎn)稱HS300)2013年1月4日分到2017年12月13日,以Dt=60min為周期(包含最高價(jià)、最低價(jià)、開(kāi)盤價(jià)、收盤價(jià)),生成K線圖后,使用上述公式,計(jì)算其隸屬度,確定所在模糊集合(分別以 0,1,2,3 分別對(duì)應(yīng)模糊集合“無(wú)”、“短”、“中長(zhǎng)”、“長(zhǎng)”,區(qū)分陰陽(yáng)線在對(duì)應(yīng)數(shù)字前面用正負(fù)號(hào),正號(hào)為陽(yáng)線,負(fù)號(hào)為陰線),并將處理后的數(shù)據(jù)按照表1所示,作為CNN的輸入。
表1 基于模糊邏輯的輸入
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[7],是一種專門處理高維度網(wǎng)格性數(shù)據(jù)而設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)。經(jīng)典的CNN由輸入層、卷積層、池化層、全連接層和輸出層組成,如圖4所示。CNN是一種前饋神經(jīng)網(wǎng)絡(luò),其核心操作就是卷積操作,即對(duì)數(shù)據(jù)和卷積核做內(nèi)積的操作叫卷積。
圖4 卷積神經(jīng)網(wǎng)絡(luò)示意圖
(1)數(shù)據(jù)預(yù)處理
本文使用數(shù)據(jù)的是HS300自2013年1月4日9:30分到2017年12月13日14:55,以Dt=60min為周期,根據(jù)數(shù)據(jù)確定 Lengthupper、Lengthlower、Lengthbody所在模糊集合。
(2)參數(shù)優(yōu)化
實(shí)驗(yàn)選擇Python語(yǔ)言實(shí)現(xiàn)CNN,輸入為模糊處理后的數(shù)據(jù),隨機(jī)初始化網(wǎng)絡(luò)參數(shù):學(xué)習(xí)率=0.01,訓(xùn)練循環(huán)次數(shù)=10000,隨著訓(xùn)練次數(shù)增加,準(zhǔn)確值達(dá)到最高,趨于穩(wěn)定。
為了測(cè)試模糊K線圖與CNN的結(jié)合模型在趨勢(shì)預(yù)測(cè)方面的性能,在實(shí)驗(yàn)中將神經(jīng)網(wǎng)絡(luò)、CNN、模糊規(guī)則模型進(jìn)行預(yù)測(cè)準(zhǔn)確率比較,選取多次實(shí)驗(yàn)中預(yù)測(cè)效果較好的6次結(jié)果如表4、圖6所示。
表2 模型準(zhǔn)確率對(duì)比
圖5 模型準(zhǔn)確率對(duì)比
從預(yù)測(cè)準(zhǔn)確率實(shí)驗(yàn)可以看出,同樣實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集條件下,模糊規(guī)則和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率較差,CNN模型預(yù)測(cè)準(zhǔn)確率一般,模糊K線圖與CNN的混合模型的預(yù)測(cè)結(jié)果最好,準(zhǔn)確率最高達(dá)到92%,四種模型最好的預(yù)測(cè)準(zhǔn)確率比較如表5所示。
表3 最好準(zhǔn)確率對(duì)比
股指趨勢(shì)預(yù)測(cè)是一個(gè)熱門且經(jīng)典的研究課題。本文結(jié)合模糊邏輯將K線圖特征更進(jìn)一步描述,在降低主觀影響的同時(shí),不降低方法的準(zhǔn)確度,通過(guò)“專家識(shí)圖”的方法,實(shí)現(xiàn)了滬深300股指趨勢(shì)的較為準(zhǔn)確的預(yù)測(cè),但該模型需再進(jìn)一步優(yōu)化,例如數(shù)據(jù)時(shí)間周期的變換,也可將持倉(cāng)量交易量等進(jìn)行模糊表達(dá),用于優(yōu)化模型。