李曉寒,王俊,賈華丁,蕭劉
基于多重注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)股市波動(dòng)預(yù)測(cè)方法
李曉寒1*,王俊1,賈華丁1,蕭劉2
(1.西南財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)信息工程學(xué)院,成都 611130; 2.四川久遠(yuǎn)銀海軟件股份有限公司 住房金融行業(yè)部,成都 610063)( ? 通信作者電子郵箱lixiaohan134@163.com)
股票市場(chǎng)是金融市場(chǎng)關(guān)鍵組成部分,因此對(duì)股票市場(chǎng)波動(dòng)的研究對(duì)合理化控制金融市場(chǎng)風(fēng)險(xiǎn)、提高投資收益提供了重要支持,一直以來(lái)都是學(xué)術(shù)界和相關(guān)業(yè)界的關(guān)注焦點(diǎn),然而,股票市場(chǎng)會(huì)受到各種因素的影響。面對(duì)股票市場(chǎng)中多源化、異構(gòu)化的信息,如何高效挖掘、融合股票市場(chǎng)的多源異構(gòu)數(shù)據(jù)具有挑戰(zhàn)性。為了充分解釋不同信息及信息間相互作用對(duì)于股票市場(chǎng)價(jià)格波動(dòng)的影響,提出一種基于多重注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)股票市場(chǎng)的價(jià)格波動(dòng)。首先,引入關(guān)系維度構(gòu)建股票市場(chǎng)交易數(shù)據(jù)和新聞文本的異構(gòu)子圖,并利用多重注意力機(jī)制實(shí)現(xiàn)圖數(shù)據(jù)的融合;其次,通過(guò)圖神經(jīng)網(wǎng)絡(luò)門(mén)控循環(huán)單元(GRU)進(jìn)行圖分類(lèi),在此基礎(chǔ)上完成對(duì)股票市場(chǎng)中上證綜合指數(shù)、滬深300指數(shù)、深證成份指數(shù)這三個(gè)重要指數(shù)波動(dòng)的預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,從異構(gòu)信息特性角度,相較于股票市場(chǎng)交易數(shù)據(jù),股市新聞信息對(duì)于股票價(jià)格影響存在滯后性;從異構(gòu)信息融合角度,所提方法與支持向量機(jī)(SVM)、隨機(jī)森林、多核-means (MKKM)聚類(lèi)等算法相比,預(yù)測(cè)準(zhǔn)確率分別提升了17.88個(gè)百分點(diǎn)、30.00個(gè)百分點(diǎn)和38.00個(gè)百分點(diǎn),并進(jìn)行了模型交易策略的量化投資模擬。
股市預(yù)測(cè);多重注意力機(jī)制;圖神經(jīng)網(wǎng)絡(luò);股市新聞;圖數(shù)據(jù)
為實(shí)現(xiàn)金融風(fēng)險(xiǎn)防范、投資獲利等,股票市場(chǎng)作為金融市場(chǎng)重要組成部分,得到了學(xué)者和投資者們廣泛關(guān)注。在過(guò)去三十多年里,中國(guó)股票市場(chǎng)作為發(fā)展最為迅速的新興資本市場(chǎng),成為學(xué)者們重點(diǎn)研究和關(guān)注的對(duì)象。在對(duì)股票市場(chǎng)研究中,有效市場(chǎng)假說(shuō)和行為金融理論得到普遍認(rèn)可?;谟行袌?chǎng)假說(shuō)[1]認(rèn)為完全理性的投資者能夠根據(jù)獲得足夠完全信息,作出迅速、合理的投資行為。該理論認(rèn)為在市場(chǎng)有效假設(shè)條件下,投資者很難實(shí)現(xiàn)超額投資收益。然而隨著金融行為學(xué)研究的深入,學(xué)者們發(fā)現(xiàn)投資者會(huì)受到文化、心理等因素影響,市場(chǎng)中人們的金融行為存在非理性[2-3]特征。隨著對(duì)以上兩種理論研究的深入,學(xué)者們逐漸形成共識(shí),認(rèn)為影響股市波動(dòng)的因素眾多,而且不同信息可以反映不同因素對(duì)于股市波動(dòng)影響。股票市場(chǎng)各因素的相互關(guān)系及作用成為研究的方向和熱點(diǎn)[4-5]。信息技術(shù)發(fā)展為研究分析股市價(jià)格波動(dòng)提供了數(shù)據(jù)基礎(chǔ)。交易數(shù)據(jù)[6]如開(kāi)盤(pán)價(jià)、收盤(pán)價(jià)、成交量等逐漸衍生出動(dòng)量[7]、重量[8]等衍生指標(biāo)用于預(yù)測(cè)分析股票市場(chǎng)價(jià)格波動(dòng)。隨著互聯(lián)網(wǎng)及移動(dòng)互聯(lián)技術(shù)發(fā)展,股市新聞對(duì)于股票市場(chǎng)投資者的影響越發(fā)顯著。股市新聞包羅萬(wàn)象,從反映股票市場(chǎng)行情、公司經(jīng)營(yíng)事件的客觀、中立性新聞,到帶有傾向性的新聞報(bào)道,都會(huì)對(duì)股票市場(chǎng)短期走勢(shì)產(chǎn)生影響[9-10]。目前,研究者們提出了大量基于股市新聞情感分析的方法用于股市預(yù)測(cè)[11-12]。Simon[13]針對(duì)新聞數(shù)量進(jìn)行研究,驗(yàn)證了大量信息將會(huì)導(dǎo)致注意力貧乏。Chan[14]以新聞標(biāo)題為切入點(diǎn),研究了投資者對(duì)于新聞的敏感程度。王曉丹等[15]則從新聞媒體關(guān)注度和情感指標(biāo)兩個(gè)方面研究了新聞報(bào)道對(duì)股票市場(chǎng)價(jià)格波動(dòng)的影響。Liu等[16]提出了利用企業(yè)知識(shí)圖嵌入系統(tǒng)擴(kuò)展企業(yè)相關(guān)新聞信息。在此基礎(chǔ)上,采用門(mén)控循環(huán)單元(Gated Recurrent Unit, GRU)模型結(jié)合股票新聞情緒和焦點(diǎn)股票的數(shù)量特征來(lái)預(yù)測(cè)股票價(jià)格波動(dòng)。隨著研究深入,為能夠更加準(zhǔn)確預(yù)測(cè)股市波動(dòng),用于預(yù)測(cè)的股市信息逐漸由交易數(shù)據(jù)、股市新聞數(shù)據(jù)等單一指標(biāo)逐漸發(fā)展為多維度指標(biāo)數(shù)據(jù)。多維度指標(biāo)數(shù)據(jù)呈現(xiàn)多源化、異構(gòu)化特性。對(duì)于多源異構(gòu)數(shù)據(jù)的融合、處理、分析成為預(yù)測(cè)股市價(jià)格波動(dòng)亟待探索和解決的問(wèn)題。Thakkar等[17]將股票市場(chǎng)融合技術(shù)分為信息融合、特征融合和模型融合。信息融合[18]主要是通過(guò)對(duì)新聞信息進(jìn)行提取,與股市交易數(shù)據(jù)等實(shí)現(xiàn)數(shù)據(jù)融合,以獲得用于股市預(yù)測(cè)的綜合性數(shù)據(jù)。特征融合[19]則多采用算法模型將同源數(shù)據(jù)表達(dá)為不同形式,從而實(shí)現(xiàn)多維特征提取。模型融合[20]則主要是對(duì)統(tǒng)計(jì)模型、人工智能算法模型、深度學(xué)習(xí)模型等進(jìn)行組合,形成復(fù)合模型分析預(yù)測(cè)股票市場(chǎng)波動(dòng)。在最新研究中,融合方法和技術(shù)得到進(jìn)一步發(fā)展,Zhang等[21]采用長(zhǎng)短期記憶網(wǎng)絡(luò)中引入注意力機(jī)制識(shí)別長(zhǎng)期時(shí)間依賴(lài)以突出關(guān)鍵特征,構(gòu)建了基于多種數(shù)據(jù)來(lái)源的分析框架。Patel等[22]提出了一種基于支持向量回歸兩階段融合的方法,對(duì)智能算法融合以預(yù)測(cè)印度股市價(jià)格波動(dòng)。
但是目前研究存在一定局限性,總結(jié)概括如下:首先,對(duì)于股票市場(chǎng)新聞文本信息處理,當(dāng)前研究主要停留在對(duì)指定來(lái)源新聞文本進(jìn)行量化研究,然而面對(duì)多種來(lái)源的股市信息如何高效甄別客觀、真實(shí)信息,并未有更為深入的探索研究;其次,傳統(tǒng)融合方式一定程度上忽略了部分融合指標(biāo)的金融特性、指標(biāo)間關(guān)系及時(shí)間序列特征;再次,現(xiàn)有融合分析方法在挖掘股票市場(chǎng)數(shù)據(jù)金融特征、相互作用、時(shí)間序列等隱含語(yǔ)義信息時(shí)有待進(jìn)一步擴(kuò)展;最后,為彌補(bǔ)作者之前研究[23]股市預(yù)測(cè)信息維度過(guò)于單一的問(wèn)題,本文對(duì)圖神經(jīng)網(wǎng)絡(luò)在股票市場(chǎng)價(jià)格預(yù)測(cè)進(jìn)行了更加深入的探索。同時(shí),將研究對(duì)象由美國(guó)股市調(diào)整為中國(guó)股票市場(chǎng),中國(guó)股票市場(chǎng)作為全球最大新興資本市場(chǎng),其研究意義得到顯著提升。本文的主要工作如下:1)構(gòu)建新聞文本子圖數(shù)據(jù),利用文本相似性完成頂點(diǎn)聚合,進(jìn)行新聞文本信息挖掘融合; 2)引入關(guān)系維度充分表示時(shí)間序列相關(guān)關(guān)系,構(gòu)建具有股市指標(biāo)特征信息的異構(gòu)圖數(shù)據(jù),實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)融合; 3)為挖掘多源異構(gòu)數(shù)據(jù)隱含語(yǔ)義信息,結(jié)合異構(gòu)圖數(shù)據(jù)構(gòu)建多重注意力圖神經(jīng)網(wǎng)絡(luò)進(jìn)行股市波動(dòng)預(yù)測(cè)。股市波動(dòng)預(yù)測(cè)及策略回測(cè)實(shí)驗(yàn)結(jié)果表明,本文方法在股市預(yù)測(cè)方面取得了較好效果。
有效市場(chǎng)假說(shuō)闡述在投資者理性及市場(chǎng)信息被完全獲得且理解的假設(shè)下,股票價(jià)格將實(shí)現(xiàn)對(duì)信息的充分反映。另外與之對(duì)應(yīng)的理論體系是行為金融理論[24],該理論認(rèn)為影響股市波動(dòng)的因素存在非理性特征,解釋了股票市場(chǎng)中日歷效應(yīng)、動(dòng)量效應(yīng)等異?,F(xiàn)象。以上兩種理論在股票市場(chǎng)中得到了驗(yàn)證、發(fā)展,為股票市場(chǎng)預(yù)測(cè)奠定了理論基礎(chǔ)。在過(guò)去三十多年里,對(duì)股票價(jià)格波動(dòng)的研究和預(yù)測(cè)從未停止過(guò)。學(xué)者們利用各種交易數(shù)據(jù)及衍生出的技術(shù)指標(biāo)預(yù)測(cè)股市走勢(shì)[25]。采用統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)等方法構(gòu)建時(shí)間序列[26]、因子定價(jià)模型[27]用于研究股市波動(dòng)。如Jegadeesh等[28]提出股票價(jià)格有延續(xù)原來(lái)運(yùn)動(dòng)方向的趨勢(shì),成交量、換手率均衍生出動(dòng)量因子用于股票價(jià)格走勢(shì)預(yù)測(cè)。Fama等[29]利用總市值、賬面市值比等衍生指標(biāo)因子構(gòu)建了因子定價(jià)模型用于解釋預(yù)期股票報(bào)酬率橫截面變化。然而隨著金融行為學(xué)理論的發(fā)展,學(xué)者們發(fā)現(xiàn)投資者受到文化、心理等因素影響,存在非理性特征。新聞事件[30]、社交媒體[11]、股吧[31]等數(shù)據(jù)經(jīng)過(guò)自然語(yǔ)言處理后成為此類(lèi)研究的主要指標(biāo),學(xué)者們不斷拓展文本嵌入方法,引入卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)等機(jī)器學(xué)習(xí)算法用于股市研究[32-33]。
股票市場(chǎng)融合技術(shù)主要包括信息融合、特征融合和模型融合。Zhang等[18]分別從網(wǎng)絡(luò)新聞、社交媒體中提取事件和用戶(hù)情緒,并通過(guò)一個(gè)耦合矩陣和張量分解框架提取信息,研究其對(duì)于股價(jià)波動(dòng)的綜合影響。Kim等[19]提出了特征融合長(zhǎng)短期記憶卷積神經(jīng)網(wǎng)絡(luò)模型,結(jié)合同一數(shù)據(jù)不同表示,將股票時(shí)間序列和股票圖表圖像進(jìn)行特征融合。Hassan等[20]對(duì)隱馬爾可夫模型、人工神經(jīng)網(wǎng)絡(luò)和遺傳算法進(jìn)行融合得到復(fù)合模型預(yù)測(cè)金融市場(chǎng)行為。近年來(lái),股市新聞與歷史交易指標(biāo)數(shù)據(jù)融合應(yīng)用于股市走勢(shì)預(yù)測(cè),成為熱門(mén)研究方向,如Tan等[34]提出了用張量代替串聯(lián)向量實(shí)現(xiàn)數(shù)據(jù)信息融合來(lái)建模獲取市場(chǎng)信息,并利用事件驅(qū)動(dòng)機(jī)制平衡不同數(shù)據(jù)類(lèi)型的異構(gòu)性完成數(shù)據(jù)預(yù)測(cè)。Chai等[35]對(duì)多源數(shù)據(jù)預(yù)加工提取相應(yīng)特征,采用擴(kuò)展隱馬爾可夫模型對(duì)量化預(yù)處理特征進(jìn)行建模,捕獲數(shù)據(jù)中潛在的時(shí)間依賴(lài)性用于金融時(shí)序預(yù)測(cè)。主流方法針對(duì)股市異構(gòu)數(shù)據(jù)的融合、處理進(jìn)行了大量研究[36-38]。然而,當(dāng)今股市新聞數(shù)量龐大,新聞來(lái)源渠道多樣,新聞?wù)鎮(zhèn)坞y辨。如何高效處理海量數(shù)據(jù),對(duì)有用、真實(shí)新聞信息進(jìn)行甄別,并與結(jié)構(gòu)化的股市歷史交易數(shù)據(jù)進(jìn)行有效融合成了亟待解決的問(wèn)題。
為能夠解決圖數(shù)據(jù)深度學(xué)習(xí)問(wèn)題,圖神經(jīng)網(wǎng)絡(luò)應(yīng)運(yùn)而生。短短幾年時(shí)間中圖神經(jīng)網(wǎng)絡(luò)技術(shù)突飛猛進(jìn),得到了廣泛應(yīng)用[39-41]。Bruna等[42]2013年首次提出圖卷積神經(jīng)網(wǎng)絡(luò),采用譜空間方法定義圖卷積。利用切比雪夫多項(xiàng)式的近似擬合卷積核(ChebNet)[43]和圖卷積網(wǎng)絡(luò)(Graph Convolutional Network, GCN)[44],為降低時(shí)空復(fù)雜度,從空間角度定義節(jié)點(diǎn)權(quán)重矩陣,對(duì)核函數(shù)進(jìn)行參數(shù)優(yōu)化。Kim等[40]提出了一種利用關(guān)系數(shù)據(jù)進(jìn)行股票市場(chǎng)預(yù)測(cè)的分層注意力網(wǎng)絡(luò)。選擇性地聚合關(guān)于不同關(guān)系類(lèi)型的信息,并將這些信息添加到每個(gè)公司的表示中,此方法用于預(yù)測(cè)個(gè)股價(jià)格和市場(chǎng)指數(shù)走勢(shì)。Liu等[16,45]提出了一種利用上市公司之間關(guān)系知識(shí)圖譜,采用封閉式回歸單元模型結(jié)合相關(guān)股票新聞情緒、焦點(diǎn)新聞情緒和焦點(diǎn)股票數(shù)量特征預(yù)測(cè)股票價(jià)格波動(dòng)。Matsunaga等[46]驗(yàn)證了市場(chǎng)預(yù)測(cè)和圖形神經(jīng)網(wǎng)絡(luò)交叉工作的有效性,將公司知識(shí)圖譜引入預(yù)測(cè)模型模仿投資者投資決策,使用滾動(dòng)窗口回溯測(cè)試不同市場(chǎng)和較長(zhǎng)時(shí)間跨度的有效性。學(xué)者們將圖神經(jīng)網(wǎng)絡(luò)應(yīng)用于股市預(yù)測(cè)進(jìn)行了大量探索,圖數(shù)據(jù)根據(jù)關(guān)系維度拓展特征指標(biāo),用于股票市場(chǎng)走勢(shì)預(yù)測(cè)。為分析預(yù)測(cè)股票市場(chǎng)波動(dòng),目前所開(kāi)展的股票市場(chǎng)信息圖結(jié)構(gòu)數(shù)據(jù)構(gòu)建及分析研究均處于起步階段。
為解決股市新聞信息的挖掘和交易指標(biāo)數(shù)據(jù)多時(shí)間尺度問(wèn)題,本文基于開(kāi)放世界假設(shè),構(gòu)建股市新聞子圖和交易指標(biāo)數(shù)據(jù)子圖,通過(guò)異構(gòu)圖融合表示股票市場(chǎng)多源異構(gòu)數(shù)據(jù)隱含語(yǔ)義信息,提出多重注意力圖神經(jīng)網(wǎng)絡(luò)模型用于分析預(yù)測(cè)股票市場(chǎng)價(jià)格波動(dòng)。
本文提出一種基于多重注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)模型用于股市波動(dòng)預(yù)測(cè)分析。圖1展示了所提方法的模型整體框架。
圖1 本文模型整體框架
圖2為圖1①部分中子圖數(shù)據(jù)嵌入方法示意圖,如圖2(a)所示,選取5個(gè)交易日作為節(jié)點(diǎn)構(gòu)建交易指標(biāo)子圖。結(jié)合相鄰交易日的延續(xù)性,交易日節(jié)點(diǎn)之間設(shè)置邊。開(kāi)盤(pán)指數(shù)、最高指數(shù)、最低指數(shù)、收盤(pán)指數(shù)、成交量、成交金額6個(gè)指標(biāo)作為節(jié)點(diǎn)特征。圖2(b)股市新聞子圖將每個(gè)交易日股市新聞作為一個(gè)指標(biāo)子圖,以每條新聞作為子圖節(jié)點(diǎn),新聞文本詞向量作為節(jié)點(diǎn)特征,新聞文本相似度作為邊的權(quán)重構(gòu)建新聞文本之間的聯(lián)系。圖2(c)將兩類(lèi)子圖中的節(jié)點(diǎn)按照異構(gòu)節(jié)點(diǎn)設(shè)立邊,構(gòu)建股市復(fù)雜網(wǎng)絡(luò)圖數(shù)據(jù)。
圖2 圖數(shù)據(jù)嵌入方法
注意力機(jī)制如式(6)所示:
為了避免梯度爆炸及消失問(wèn)題,引入殘差連接將權(quán)重矩陣及特征直接相加作為隱藏層輸入,如式(7)(8)所示:
采用GRU進(jìn)一步提取特征形成特征向量矩陣,通過(guò)遞歸神經(jīng)網(wǎng)絡(luò)忘記門(mén)舍棄部分特征信息,而輸入門(mén)則添加部分新的信息到節(jié)點(diǎn)特征中,并進(jìn)行式(8)的狀態(tài)層歸一化處理:
通過(guò)聚合更新過(guò)程,不斷更新權(quán)重矩陣。模型采用交叉熵?fù)p失函數(shù)完成訓(xùn)練過(guò)程。本文引入多重注意力機(jī)制完成股票市場(chǎng)異構(gòu)圖數(shù)據(jù)分類(lèi),從而完成股票市場(chǎng)波動(dòng)的預(yù)測(cè)分析。
程序首先定義所取交易日的區(qū)間,構(gòu)建子圖,按照交易日設(shè)立子圖節(jié)點(diǎn),取交易日交易數(shù)據(jù)指標(biāo)作為節(jié)點(diǎn)特征。
對(duì)于股市新聞子圖的構(gòu)建,則采用兩個(gè)核心函數(shù)。第1個(gè)函數(shù)EWEIGHT()主要用來(lái)計(jì)算新聞之間相似度,在子圖數(shù)據(jù)構(gòu)建過(guò)程中,作為邊權(quán)重值。采用函數(shù)jieba()進(jìn)行分詞,并采用函數(shù)SparseMatrixSimilarity()進(jìn)行文本之間相似度的計(jì)算。第2個(gè)函數(shù)CREATNEWSUB()作為子圖構(gòu)建函數(shù),每一條新聞文本作為一個(gè)節(jié)點(diǎn),函數(shù)add_edge()增加節(jié)點(diǎn)之間的邊,并利用函數(shù)EWEIGHT()對(duì)邊權(quán)重進(jìn)行賦值。新聞文本向量作為節(jié)點(diǎn)特征。
本文所提出的多重注意力圖神經(jīng)網(wǎng)絡(luò)在2.2節(jié)中進(jìn)行了詳細(xì)闡述。代碼利用for循環(huán)利用多重注意力完成頂點(diǎn)特征嵌入提取過(guò)程,更新權(quán)重參數(shù)。其中權(quán)重參數(shù)包括邊權(quán)重和節(jié)點(diǎn)特征權(quán)重,利用權(quán)重矩陣完成異構(gòu)圖數(shù)據(jù)有效信息提取,完成圖分類(lèi)進(jìn)行股市波動(dòng)預(yù)測(cè)。
本文采用CSMAR數(shù)據(jù)庫(kù)(China Stock Market & Accounting Research Database)進(jìn)行實(shí)驗(yàn),使用該數(shù)據(jù)庫(kù)2013-01-11至2018-12-31數(shù)據(jù)信息分別構(gòu)建上證綜合指數(shù)、滬深300指數(shù)、深證成份指數(shù)的股市圖數(shù)據(jù)。其中2013-01-11至2017-12-31數(shù)據(jù)設(shè)置為訓(xùn)練數(shù)據(jù),采用dgl(https://docs.dgl.ai/)構(gòu)建圖數(shù)據(jù)并進(jìn)行相應(yīng)卷積操作,每日新聞文本數(shù)據(jù)隨機(jī)取500條,新聞指標(biāo)子圖以每條新聞作為圖節(jié)點(diǎn),新聞文本詞向量作為節(jié)點(diǎn)特征,新聞文本相似度作為邊的權(quán)重構(gòu)建新聞文本之間的聯(lián)系,每個(gè)交易日為一個(gè)子圖。采用gensim(https://radimrehurek.com/gensim/)庫(kù)將新聞文本轉(zhuǎn)換成200維詞向量作為節(jié)點(diǎn)特征。Word2Vec設(shè)置參數(shù)為(=20,=7,_=0,=1,=0.15,=10,_=10 000),其他均采用默認(rèn)參數(shù)。Similarities模塊計(jì)算新聞文本之間的相似度作為新聞子圖邊的權(quán)重。交易數(shù)據(jù)指標(biāo)子圖則選擇預(yù)測(cè)之前的5個(gè)工作日,將每個(gè)交易日開(kāi)盤(pán)指數(shù)、最高指數(shù)、最低指數(shù)、收盤(pán)指數(shù)、成交量、成交金額六個(gè)指標(biāo)作為聚合后的節(jié)點(diǎn)特征,通過(guò)連接操作與聚合頂點(diǎn)特征拼接。圖3(a)中邊的深淺與新聞文本相似度成正比,節(jié)點(diǎn)大小則與節(jié)點(diǎn)度成正比。圖3(b)中灰度標(biāo)識(shí)新聞之間的相似度。兩類(lèi)子圖節(jié)點(diǎn)如圖2所示構(gòu)建的異構(gòu)圖數(shù)據(jù),作為輸入訓(xùn)練及測(cè)試數(shù)據(jù),該數(shù)據(jù)具有任意兩節(jié)點(diǎn)間的平均路徑相對(duì)較短。股市新聞子圖中,關(guān)鍵新聞節(jié)點(diǎn)度值較大,與其他新聞節(jié)點(diǎn)具有緊密的關(guān)聯(lián)性,具有律度分布特性。兩類(lèi)指標(biāo)所屬模塊度值較低,平均模塊度為-0.36。本文輸入數(shù)據(jù)具有小世界特性、律度分布特性、社區(qū)結(jié)構(gòu)特性,屬于復(fù)雜網(wǎng)絡(luò)圖數(shù)據(jù)。復(fù)雜網(wǎng)絡(luò)圖數(shù)據(jù)以交易日之前的5個(gè)工作日交易指標(biāo)節(jié)點(diǎn)和當(dāng)日股市新聞節(jié)點(diǎn)構(gòu)成,標(biāo)簽為+1指數(shù)較前一交易日漲與跌進(jìn)行二分類(lèi)標(biāo)記0:<0、1:0。模型訓(xùn)練及測(cè)試輸出預(yù)測(cè)數(shù)據(jù)為復(fù)雜圖數(shù)據(jù)分類(lèi)結(jié)果,即指數(shù)漲跌分類(lèi)。
圖3 股市新聞圖數(shù)據(jù)
為能達(dá)到模型理想訓(xùn)練效果,本文主要從兩個(gè)方面優(yōu)化提升訓(xùn)練效果。首先,損失值收斂情況,當(dāng)模型逐漸收斂到一個(gè)較小的損失值,并且測(cè)試預(yù)測(cè)準(zhǔn)確率達(dá)到預(yù)期要求且穩(wěn)定,在這期間調(diào)整dropout值等參數(shù),防止過(guò)擬合;其次,設(shè)置合理的訓(xùn)練循環(huán)次數(shù),為合理利用計(jì)算資源,提高訓(xùn)練效率,訓(xùn)練循環(huán)次數(shù)由初始值100次逐漸遞增,遞增幅度為100。直到在訓(xùn)練循環(huán)次數(shù)內(nèi),損失值收斂,訓(xùn)練預(yù)測(cè)準(zhǔn)確率達(dá)到預(yù)期。經(jīng)多次調(diào)整參數(shù)進(jìn)行實(shí)驗(yàn)后,本文設(shè)計(jì)網(wǎng)絡(luò)模型基本達(dá)到預(yù)期要求,訓(xùn)練過(guò)程如圖4所示。
圖4 圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程
本文混淆矩陣如表1所示。將股市收盤(pán)價(jià)的上漲和下跌作為分類(lèi)預(yù)測(cè)結(jié)果:預(yù)測(cè)結(jié)果與真實(shí)結(jié)果都為上升,則為真陽(yáng)性(True Postive,);預(yù)測(cè)結(jié)果為上升而真實(shí)結(jié)果為下降,則為假陽(yáng)性(False Positive,);預(yù)測(cè)結(jié)果為下降而真實(shí)結(jié)果為上升,則為假陰性(False Negative,);預(yù)測(cè)結(jié)果為下降而真實(shí)結(jié)果也為下降,則為真陰性(True Negative,)。
表1 混淆矩陣
準(zhǔn)確率(accuracy)和召回率(recall)是評(píng)價(jià)機(jī)器學(xué)習(xí)預(yù)測(cè)模型的重要指標(biāo)。模型的準(zhǔn)確率與預(yù)測(cè)性能密切相關(guān)。本文的準(zhǔn)確率及召回率如式(12)和式(13)所示:
為能夠探究新聞文本影響的滯后性及各算法的最優(yōu)參數(shù)設(shè)置,本文采用2018-10-01至2018-12-31交易日數(shù)據(jù)用于測(cè)試,實(shí)驗(yàn)結(jié)果表明模型對(duì)上證綜合指數(shù)、滬深300指數(shù)、深證成份指數(shù)的預(yù)測(cè)結(jié)果。本文所提出方法基于圖關(guān)系權(quán)重注意力網(wǎng)絡(luò)進(jìn)行表示。首先,與GATConv(Graph Attention Network Convolution)[18]、RelGraphConv(Relational Data with Graph Convolutional Networks)[37]、文獻(xiàn)[38]中提出的一種新的神經(jīng)網(wǎng)絡(luò)模塊EdgeConv、SAGEConv(Graph SAmple and aggreGatE Convolution)[39]等嵌入操作進(jìn)行對(duì)比。
為能夠進(jìn)一步驗(yàn)證所構(gòu)建模型對(duì)新聞文本信息挖掘及融合技術(shù)的優(yōu)越性,本文引入多源指標(biāo)方法支持向量機(jī)(Support Vector Machine, SVM)、隨機(jī)森林(Random Forest, RF)、多核-means(Multiple Kernel-Means, MKKM)聚類(lèi)[40]、基于張量的股票信息分析器(Tensor-based Stock Information Analyzer, TeSIA)[41]用于模型對(duì)比,對(duì)比方法并未考慮新聞數(shù)據(jù)之間的關(guān)系維度,對(duì)特征進(jìn)行向量數(shù)據(jù)拼接,所引入用于對(duì)比的模型參數(shù)設(shè)置如表2所示。本文提出的模型則按照表3中相關(guān)參數(shù)進(jìn)行設(shè)置。
SVM 是一種應(yīng)用廣泛的機(jī)器學(xué)習(xí)分類(lèi)算法。將這兩種類(lèi)型的特征拼接成向量,并將向量輸入支持向量機(jī)進(jìn)行預(yù)測(cè)。
RF 在多源特征分類(lèi)任務(wù)中表現(xiàn)出優(yōu)異的性能,本文將拼接成的向量使用隨機(jī)森林方法進(jìn)行預(yù)測(cè)。
MKKM MKKM聚類(lèi)的目標(biāo)是從一組指定的核中找到最優(yōu)組合,從而能夠準(zhǔn)確地將特征向量劃分為若干類(lèi)。在本研究中,將來(lái)自?xún)蓚€(gè)股市評(píng)價(jià)指標(biāo)的特征串聯(lián)起來(lái),在核空間中探索出最佳聚類(lèi)結(jié)果用于股票市場(chǎng)走勢(shì)判斷。
TeSIA 將2.2節(jié)中提取的兩種指標(biāo)特征結(jié)合起來(lái)構(gòu)造一個(gè)二階張量。然后通過(guò)張量分解去除冗余,根據(jù)價(jià)格運(yùn)動(dòng)方向建立張量流模型進(jìn)行預(yù)測(cè)。TeSIA融合多源信息建立基線(xiàn)用于預(yù)測(cè),在部分多源數(shù)據(jù)預(yù)測(cè)項(xiàng)目中取得了較好的效果。
預(yù)測(cè)標(biāo)簽則為股市當(dāng)天收盤(pán)價(jià)與前一交易日收盤(pán)價(jià)的對(duì)比。表4和圖5分別從預(yù)測(cè)的準(zhǔn)確率和穩(wěn)定性?xún)蓚€(gè)方向展示了本文所提出方法與其他預(yù)測(cè)方法的比較結(jié)果。表4中,考慮到股市新聞對(duì)于股市影響的滯后性,實(shí)驗(yàn)中分別通過(guò)模型挖掘的股市新聞對(duì)T+1、T+2、T+3時(shí)刻的股市走勢(shì)進(jìn)行了預(yù)測(cè)。
表2 實(shí)驗(yàn)網(wǎng)絡(luò)參數(shù)設(shè)置
表3 實(shí)驗(yàn)?zāi)P蛥?shù)設(shè)置
表4 不同指數(shù)預(yù)測(cè)結(jié)果對(duì)比
通過(guò)圖5和表4中呈現(xiàn)的結(jié)果,可以得出本文所提出的方法對(duì)于T+2時(shí)刻的股票走勢(shì)具有較好的預(yù)測(cè)能力。進(jìn)一步分析數(shù)據(jù),發(fā)現(xiàn)新聞圖數(shù)據(jù)中節(jié)點(diǎn)度較大的節(jié)點(diǎn),如2018年11月13日“天然氣價(jià)格上漲”的新聞,當(dāng)日大于關(guān)系權(quán)重閾值的相關(guān)節(jié)點(diǎn)新聞達(dá)到13條。在模型中也準(zhǔn)確預(yù)測(cè)出了相關(guān)股票之后的走勢(shì)。2018年11月28日“關(guān)稅會(huì)威脅 蘋(píng)果這個(gè)假期季過(guò)得有點(diǎn)艱難”的新聞,當(dāng)日大于關(guān)系權(quán)重閾值的相關(guān)節(jié)點(diǎn)新聞達(dá)到23條,也準(zhǔn)確地標(biāo)記了之后的股票走勢(shì)。為進(jìn)一步了解模型預(yù)測(cè)性能,本文將模型對(duì)T+2時(shí)刻股市走勢(shì)預(yù)測(cè)的ROC(Receiver Operating Characteristic)、AUC(Area Under Curve)進(jìn)行了對(duì)比。通過(guò)實(shí)驗(yàn)驗(yàn)證,SVM、RF、MKKM聚類(lèi)等算法在表4中T+2交易日平均準(zhǔn)確率分別為:55.12%、55.00%、53.00%,本文方法準(zhǔn)確率與SVM、RF、MKKM聚類(lèi)等算法平均準(zhǔn)確率相比,對(duì)3種指數(shù)波動(dòng)預(yù)測(cè)準(zhǔn)確率分別提升了17.88個(gè)百分點(diǎn)、30.00個(gè)百分點(diǎn)和38.01個(gè)百分點(diǎn)。本文所提出的方法與GATConv、RelGraphConv、EdgeConv、SAGEConv、SVM、RF、MKKM、TeSIA方法相比在預(yù)測(cè)準(zhǔn)確率和穩(wěn)定性方面具有明顯優(yōu)勢(shì)。
圖5 不同分類(lèi)器預(yù)測(cè)的ROC AUC圖
如表4和圖5所示,本文方法在T+2股市走勢(shì)預(yù)測(cè)中,明顯優(yōu)于其他方法。為進(jìn)一步論證本文方法形成的策略在量化交易中收益情況。選取2019-11-25至2020-04-22期間100個(gè)交易日上證綜合指數(shù)、滬深300指數(shù)、深證成份指數(shù)數(shù)據(jù)進(jìn)行本文策略的回測(cè)。模型預(yù)測(cè)上漲,則生成買(mǎi)入信號(hào),下降則生成賣(mài)出信號(hào),連續(xù)相同信號(hào)不觸發(fā)交易操作。策略初始資金為10 000,以交易日收盤(pán)價(jià)作為收益結(jié)算標(biāo)準(zhǔn)。本文具體展示了上證綜合指數(shù)、滬深300指數(shù)、深證成份指數(shù)收益情況實(shí)驗(yàn)結(jié)果并進(jìn)行分析。圖6分別采用表4中所提及的方法進(jìn)行交易策略回測(cè)。為能夠清晰呈現(xiàn)策略收益情況,對(duì)圖5、表4中預(yù)測(cè)效率較好的SVM、RF、MKKM、TeSIA預(yù)測(cè)模型形成的交易策略進(jìn)行回測(cè)比較。
圖6 不同指數(shù)策略收益
圖6分別對(duì)根據(jù)策略投資上證綜合指數(shù)、滬深300指數(shù)、深證成份指數(shù)收益情況進(jìn)行了展示。如圖6所示,因受2020年3月份新型冠狀病毒疫情影響,同期上證綜合指數(shù)下跌1.43%,滬深300指數(shù)下跌0.28%,深證成份指數(shù)上漲10.29%。本文所提出的方法投資收益率為19.53%、17.32%和25.6%,收益率為最高,收益優(yōu)于三種指數(shù)的整體走勢(shì)和其他策略收益。因本文策略中并未考慮股市預(yù)測(cè)中的做空收益,所以本文策略回測(cè)收益與預(yù)測(cè)指數(shù)的走勢(shì)密切相關(guān)。股市在經(jīng)歷突如其來(lái)的黑天鵝事件(新型冠狀病毒疫情爆發(fā))引起的兩次大幅下跌情況下,通過(guò)本文策略起到了止損的重要作用,取得了較好的收益。面對(duì)大量的新聞數(shù)據(jù),本文所提方法對(duì)于股市預(yù)測(cè)更加準(zhǔn)確、迅速,不但有效挖掘突如其來(lái)的利空新聞,更是能夠通過(guò)日常股市新聞準(zhǔn)確提取預(yù)測(cè)股票走勢(shì)的有效信息,與歷史交易數(shù)據(jù)融合形成有效的股市波動(dòng)評(píng)價(jià)體系。
本文提出一種經(jīng)過(guò)優(yōu)化的圖神經(jīng)網(wǎng)絡(luò)用于股市新聞信息挖掘和異構(gòu)數(shù)據(jù)融合?;陂_(kāi)放世界假設(shè),構(gòu)建股票市場(chǎng)異構(gòu)圖數(shù)據(jù),設(shè)立新聞數(shù)據(jù)的節(jié)點(diǎn)、節(jié)點(diǎn)特征、邊及邊的權(quán)重。根據(jù)邊的權(quán)重優(yōu)化卷積模塊注意力機(jī)制,利用注意力機(jī)制實(shí)現(xiàn)股票市場(chǎng)異構(gòu)數(shù)據(jù)融合,預(yù)測(cè)股市價(jià)格波動(dòng)。在實(shí)驗(yàn)驗(yàn)證中,采用本文方法取得了較好的效果,擴(kuò)展了圖數(shù)據(jù)及圖神經(jīng)網(wǎng)絡(luò)在股票市場(chǎng)新聞挖掘和異構(gòu)數(shù)據(jù)融合中的應(yīng)用。本文提出方法提高了股市新聞文本的挖掘效率,但是影響股票走勢(shì)因素非常多。在接下來(lái)的研究中將考慮增加交易衍生、圖形化指標(biāo)等數(shù)據(jù),嘗試構(gòu)建、優(yōu)化圖神經(jīng)網(wǎng)絡(luò)模型,提高模型訓(xùn)練效率及預(yù)測(cè)性能,使模型可以應(yīng)用到股市風(fēng)險(xiǎn)防控及量化投資中,并泛化應(yīng)用到其他金融產(chǎn)品的走勢(shì)預(yù)測(cè)中。
[1] FAMA E F. Efficient capital markets: a review of theory and empirical work[J]. The Journal of Finance, 1970, 25(2): 383-417.
[2] KAHNEMAN D. Maps of bounded rationality: psychology for behavioral economics[J]. The American Economic Review, 2003, 93(5): 1449-1475.
[3] SHILLER R J. Irrational Exuberance[M]. Revised and Expanded 3rd Ed. Princeton: Princeton University Press, 2016:237-267.
[4] HONG H, KUBIK J D, STEIN J C. Social interaction and stock-market participation[J]. The Journal of Finance, 2004, 59(1): 137-163.
[5] STROHSAL T, WEBER E. Time-varying international stock market interaction and the identification of volatility signals[J]. Journal of Banking and Finance, 2015, 56: 28-36.
[6] OLIVEIRA N, CORTEZ P, AREAL N. The impact of microblogging data for stock market prediction: using Twitter to predict returns, volatility, trading volume and survey sentiment indices[J]. Expert Systems with Applications, 2017, 73: 125-144.
[7] CAKICI N, FABOZZI F J, TAN S. Size, value, and momentum in emerging market stock returns[J]. Emerging Markets Review, 2013, 16: 46-65.
[8] BURTON R F. Why is the body mass index calculated as mass/height2, not as mass/height3?[J]. Annals of Human Biology, 2007, 34(6): 656-663.
[9] TETLOCK P C. Giving content to investor sentiment: the role of media in the stock market[J]. The Journal of Finance, 2007, 62(3): 1139-1168.
[10] BARBER B M, ODEAN T. All that glitters: the effect of attention and news on the buying behavior of individual and institutional investors[J]. The Review of Financial Studies, 2008, 21(2): 785-818.
[11] ATKINS A, NIRANJAN M, GERDING E. Financial news predicts stock market volatility better than close price[J]. The Journal of Finance and Data Science, 2018, 4(2): 120-137.
[12] WEI Y C, LU Y C, CHEN J N, et al. Informativeness of the market news sentiment in the Taiwan stock market[J]. The North American Journal of Economics and Finance, 2017, 39: 158-181.
[13] SIMON H A. Designing organizations for an information-rich world[J]. International Library of Critical Writings in Economics, 1996, 70: 187-202.
[14] CHAN W S. Stock price reaction to news and no-news: drift and reversal after headlines[J]. Journal of Financial Economics, 2003, 70(2): 223-260.
[15] 王曉丹,尚維,汪壽陽(yáng). 互聯(lián)網(wǎng)新聞媒體報(bào)道對(duì)我國(guó)股市的影響分析[J]. 系統(tǒng)工程理論與實(shí)踐, 2019, 39(12):3038-3047.(WANG X D, SHANG W, WANG S Y. The effects of online news on the Chinese stock market[J]. System Engineering — Theory and Practice, 2019, 39(12):3038-3047.)
[16] LIU J, LU Z C, DU W. Combining enterprise knowledge graph and news sentiment analysis for stock price prediction[C/OL]// Proceedings of the 52nd Hawaii International Conference on System Sciences. [2021-07-02].https://scholarspace.manoa.hawaii.edu/bitstream/10125/59565/0125.pdf.
[17] THAKKAR A, CHAUDHARI K. Fusion in stock market prediction: a decade survey on the necessity, recent developments, and potential future directions[J]. Information Fusion, 2021, 65: 95-107.
[18] ZHANG X, ZHANG Y J, WANG S Z, et al. Improving stock market prediction via heterogeneous information fusion[J]. Knowledge-Based Systems, 2018, 143: 236-247.
[19] KIM T, KIM H Y. Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data[J]. PLoS ONE, 2019, 14(2): No.e0212320.
[20] HASSAN M R, NATH B, KIRLEY M. A fusion model of HMM, ANN and GA for stock market forecasting[J]. Expert Systems with Applications, 2007, 33(1): 171-180.
[21] ZHANG Q, YANG L J, ZHOU F. Attention enhanced long short-term memory network with multi-source heterogeneous information fusion: an application to BGI Genomics[J]. Information Sciences, 2021, 553: 305-330.
[22] PATEL J, SHAH S, THAKKAR P, et al. Predicting stock market index using fusion of machine learning techniques[J]. Expert Systems with Applications, 2015, 42(4): 2162-2172.
[23] 李曉寒,賈華丁,程雪,等. 基于改進(jìn)遺傳算法和圖神經(jīng)網(wǎng)絡(luò)的股市波動(dòng)預(yù)測(cè)方法[J/OL]. 計(jì)算機(jī)應(yīng)用. (2021-08-17) [2021-08-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20210816.1658.012.html.(LI X H, JIA H D, CHENG X, et al. Stock market fluctuation prediction method based on improved genetic algorithm and graph neural network[J/OL]. Journal of Computer Applications. (2021-08-17) [2021-08-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20210816.1658.012.html.)
[24] KAHNEMAN D, TVERSKY A. On the interpretation of intuitive probability: a reply to Jonathan Cohen[J]. Cognition, 1979, 7(4): 409-411.
[25] LO A W, MacKINLAY A C. Stock market prices do not follow random walks: evidence from a simple specification test[J]. The Review of Financial Studies, 1988, 1(1): 41-66.
[26] TANG H, CHIU K C, XU L. Finite mixture of ARMA-GARCH model for stock price prediction[C/OL]// Proceedings of the 3rd International Workshop on Computational Intelligence in Economics and Finance. [2018-10-10].http://www.cse.cuhk.edu.hk/~lxu/papers/conf-chapters/TangCIEF2003.pdf.
[27] ROJAS I, VALENZUELA O, ROJAS F, et al. Soft-computing techniques and ARMA model for time series prediction[J]. Neurocomputing, 2008, 71(4/5/6): 519-537.
[28] JEGADEESH N, TITMAN S. Returns to buying winners and selling losers: implications for stock market efficiency[J]. The Journal of Finance, 1993, 48(1): 65-91.
[29] FAMA E F, FRENCH K R. The cross-section of expected stock returns[J]. The Journal of Finance, 1992, 47(2):427-465.
[30] FAMA E F, FRENCH F K R. Multifactor explanations of asset pricing anomalies[J]. The Journal of Finance, 1996, 51(1):55-84.
[31] SI J F, MUKHERJEE A, LIU B, et al. Exploiting topic based twitter sentiment for stock prediction[C]// Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). Stroudsburg, PA: Association for Computational Linguistics, 2013: 24-29.
[32] DING X, ZHANG Y, LIU T, et al. Deep learning for event-driven stock prediction[C]// Proceedings of the 24th International Joint Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015: 2327-2333.
[33] DING X, ZHANG Y, LIU T, et al. Using structured events to predict stock price movement: an empirical investigation[C]// Proceedings of the Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2014: 1415-1425.
[34] TAN J H, WANG J, RINPRASERTMEECHAI D, et al. A tensor-based eLSTM model to predict stock price using financial news[C/OL]// Proceedings of the 52nd Hawaii International Conference on System Sciences. [2021-07-02].https://scholarspace.manoa.hawaii.edu/bitstream/10125/59606/0166.pdf.
[35] CHAI L, XU H F, LUO Z M, et al. A multi-source heterogeneous data analytic method for future price fluctuation prediction[J]. Neurocomputing, 2020, 418: 11-20.
[36] ZHANG X, LI Y X, WANG S Z, et al. Enhancing stock market prediction with extended coupled hidden Markov model over multi-sourced data[J]. Knowledge and Information Systems, 2019, 61(2): 1071-1090.
[37] KIM R, SO C H, JEONG M, et al. HATS: a hierarchical graph attention network for stock movement prediction[EB/OL]. (2019-11-12) [2021-06-20].https://arxiv.org/pdf/1908.07999.pdf.
[38] LI Q, WANG J, WANG F, et al. The role of social sentiment in stock markets: a view from joint effects of multiple information sources[J]. Multimedia Tools and Applications, 2017, 76(10): 12315-12345.
[39] 呼延康,樊鑫,余樂(lè)天,等. 圖神經(jīng)網(wǎng)絡(luò)回歸的人臉超分辨率重建[J]. 軟件學(xué)報(bào), 2018, 29(4):914-925.(HUYAN K, FAN X, YU L T, et al. Graph based neural network regression strategy for facial image super-resolution[J]. Journal of Software, 2018, 29(4):914-925.)
[40] KIM K-J, HAN I. Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index[J]. Expert Systems with Applications, 2000, 19(2): 125-132.
[41] LI Q, JIANG L L, LI P, et al. Tensor-based learning for predicting stock movements[C]// Proceedings of 29th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015:1784-1790.
[42] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[EB/OL]. (2014-05-21) [2021-06-20].https://arxiv.org/pdf/1312.6203.pdf.
[43] DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]// Proceedings of the 30th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2016: 3844-3852.
[44] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. (2017-02-22) [2021-06-20].https://arxiv.org/pdf/1609.02907.pdf.
[45] LIU Y, ZENG Q G, YANG H R, et al. Stock price movement prediction from financial news with deep learning and knowledge graph embedding[C]// Proceedings of the 2018 Pacific Rim Knowledge Acquisition Workshop, LNCS 11016. Cham: Springer, 2018: 102-113.
[46] MATSUNAGA D, SUZUMURA T, TAKAHASHI T. Exploring graph neural networks for stock market predictions with rolling window analysis[EB/OL]. (2019-11-27) [2021-06-20].https://arxiv.org/pdf/1909.10660.pdf.
[47] HUANG T L. The puzzling media effect in the Chinese stock market[J]. Pacific-Basin Finance Journal, 2018, 49: 129-146.
[48] ARASU A, WIDOM J. Resource sharing in continuous sliding-window aggregates[C]// Proceedings of the 30th International Conference on Very Large Data Bases. [S.l.]: VLDB Endowment, 2004: 336-347.
LI Xiaohan, born in 1985, Ph. D. candidate. His research interests include financial information management, intelligent decision-making, big data, business intelligence.
WANG Jun, born in 1987, Ph. D., associate professor. His research interests include financial technology, financial intelligence.
JIA Huading, born in 1956, Ph. D., professor. His research interests include machine learning, algorithmic trading, spread spectrum sequence design.
XIAO Liu, born in 1986, senior engineer. His research interests include machine learning, big data,social security, economics and finance.
Stock market volatility prediction method based on graph neural network with multi-attention mechanism
LI Xiaohan1*, WANG Jun1, JIA Huading1, XIAO Liu2
(1,,611130,;2,,610063,)
Stock market is an essential element of financial market, therefore, the study on volatility of stock market plays a significant role in taking effective control of financial market risks and improving returns on investment. For this reason, it has attracted widespread attention from both academic circle and related industries. However, there are multiple influencing factors for stock market. Facing the multi-source and heterogeneous information in stock market, it is challenging to find how to mine and fuse multi-source and heterogeneous data of stock market efficiently. To fully explain the influence of different information and information interaction on the price changes in stock market, a graph neural network based on multi-attention mechanism was proposed to predict price fluctuation in stock market. First of all, the relationship dimension was introduced to construct heterogeneous subgraphs for the transaction data and news text of stock market, and multi-attention mechanism was adopted for fusion of the graph data. Then, the graph neural network Gated Recurrent Unit (GRU) was applied to perform graph classification. On this basis, prediction was made for the volatility of three important indexes: Shanghai Composite Index, Shanghai and Shenzhen 300 Index, Shenzhen Component Index. Experimental results show that from the perspective of heterogeneous information characteristics, compared with the transaction data of stock market, the news information of stock market has the lagged influence on stock volatility; from the perspective of heterogeneous information fusion, compared with algorithms such as Support Vector Machine (SVM), Random Forest (RF) and Multiple Kernel-Means (MKKM) clustering, the proposed method has the prediction accuracy improved by 17.88 percentage points, 30.00 percentage points and 38.00 percentage points respectively; at the same time, the quantitative investment simulation was performed according to the model trading strategy.
stock market prediction; multi-attention mechanism; graph neural network; stock market news; graph data
This work is partially supported by Science and Technology Program of Sichuan Province (2020JDJQ0061, 2021YFG0099).
TP391.7; TP18
A
1001-9081(2022)07-2265-09
10.11772/j.issn.1001-9081.2021081487
2021?08?19;
2021?11?30;
2021?12?03。
四川省科技計(jì)劃項(xiàng)目(2020JDJQ0061, 2021YFG0099)。
李曉寒(1985—),男,山東濟(jì)南人,博士研究生,CCF會(huì)員,主要研究方向:金融信息管理、智能決策、大數(shù)據(jù)、商務(wù)智能; 王?。?987—),男,山東青島人,副教授,博士,CCF會(huì)員,主要研究方向:金融科技、金融智能; 賈華?。?956—),男,四川成都人,教授,博士,CCF高級(jí)會(huì)員,主要研究方向:機(jī)器學(xué)習(xí)、算法交易、擴(kuò)頻序列設(shè)計(jì); 蕭劉(1986—),男,四川成都人,高級(jí)工程師,主要研究方向:機(jī)器學(xué)習(xí)、大數(shù)據(jù)、社會(huì)保障經(jīng)濟(jì)與金融。