摘" 要:針對(duì)股票價(jià)格受復(fù)雜因素及投資者情緒影響導(dǎo)致的預(yù)測(cè)難題,提出了一種融合情感分析與Informer模型的股票價(jià)格預(yù)測(cè)方法。首先,運(yùn)用AdaBoost模型從大量數(shù)據(jù)中提取關(guān)鍵特征變量,以降低模型過(guò)擬合的風(fēng)險(xiǎn)。其次,構(gòu)建金融情感詞典,對(duì)通過(guò)網(wǎng)絡(luò)爬蟲(chóng)獲取的金融文本數(shù)據(jù)進(jìn)行情感分析,并計(jì)算情緒指數(shù)。最后,利用Informer模型對(duì)中信證券、華泰證券、東方財(cái)富三只具有代表性的證券龍頭股票進(jìn)行預(yù)測(cè)。評(píng)估結(jié)果顯示,該方法有效提升了預(yù)測(cè)的準(zhǔn)確性,驗(yàn)證了其有效性和實(shí)用性。
關(guān)鍵詞:情感分析;股票預(yù)測(cè);Informer模型
中圖分類(lèi)號(hào):TP181;TP391;F832.5" 文獻(xiàn)標(biāo)識(shí)碼:A" 文章編號(hào):2096-4706(2025)04-0139-06
Stock Prediction Method Based on Sentiment Analysis and Informer
NI Xueyao
(School of Information Engineering, Huzhou University, Huzhou" 313000, China)
Abstract: Aiming at the prediction problem of stock price caused by complex factors and investor sentiment, a stock price prediction method based on sentiment analysis and Informer model is proposed. Firstly, the AdaBoost model is used to extract key feature variables from a large amount of data to reduce the risk of model overfitting. Secondly, a financial sentiment dictionary is constructed to analyze the sentiment of the financial text data obtained by the web crawler, and the sentiment index is calculated. Finally, the Informer model is used to predict three representative security leading stocks of CITIC Securities, Huatai Securities and Eastmoney Securities. The evaluation results show that the method effectively improves the accuracy of prediction, and verifies its effectiveness and practicability.
Keywords: sentiment analysis; stock prediction; Informer model
0" 引" 言
期投資者主要通過(guò)技術(shù)分析和經(jīng)典時(shí)間序列模型預(yù)測(cè)股價(jià)。技術(shù)分析基于市場(chǎng)指標(biāo)(如成交量和價(jià)格)來(lái)判斷股價(jià)趨勢(shì)。常用的時(shí)間序列模型包括ARIMA、GARCH和VAR。此外,灰色模型、BP神經(jīng)網(wǎng)絡(luò)和模糊理論也被應(yīng)用于股價(jià)預(yù)測(cè),但它們對(duì)非線(xiàn)性、長(zhǎng)期時(shí)間序列的效果較差。隨后,為了解決多重共線(xiàn)性問(wèn)題,研究者們使用主成分分析(PCA)[1]或LASSO方法[2]進(jìn)行變量的降維篩選。智能優(yōu)化算法也被廣泛應(yīng)用于參數(shù)優(yōu)化,尤其是果蠅算法、狼群算法、遺傳算法等,常被用于優(yōu)化機(jī)器學(xué)習(xí)模型(如BP神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)和SVM)的最優(yōu)權(quán)值結(jié)構(gòu)[3]。由于單一模型各有局限性,有學(xué)者開(kāi)始集成多個(gè)模型的預(yù)測(cè)結(jié)果,以提高預(yù)測(cè)準(zhǔn)確性。此外,結(jié)合CNN和LSTM的方法也被提出,用于提取股價(jià)的圖像和時(shí)序特征[4]。小波分析和經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)也被用于股價(jià)的預(yù)測(cè)與重構(gòu),并取得了良好的效果,尤其是EMD與LSTM、TSVR等模型的結(jié)合,被證實(shí)能有效預(yù)測(cè)股價(jià)[5]。
隨著人工智能的發(fā)展,深度學(xué)習(xí)在股價(jià)預(yù)測(cè)中越來(lái)越受歡迎。LSTM能夠捕捉股價(jià)序列中的關(guān)鍵信息,并克服RNN的梯度消失和梯度爆炸問(wèn)題,因此在股價(jià)預(yù)測(cè)中得到了廣泛應(yīng)用。此外,研究者們將技術(shù)性指標(biāo)和基本面數(shù)據(jù)與LSTM、GRU模型結(jié)合,構(gòu)建了新的預(yù)測(cè)模型。同時(shí),MDT和CBAM也被有效地融入LSTM模型中[6]。近年來(lái),研究者們開(kāi)始關(guān)注投資者的心理情緒因素,例如百度搜索指數(shù)和新浪微博情緒指數(shù)等,這些因素在股價(jià)預(yù)測(cè)中發(fā)揮了重要作用。此外,研究者還利用非結(jié)構(gòu)化數(shù)據(jù)信息(如新聞資訊、股吧評(píng)論等)來(lái)提取情感時(shí)間序列,以增強(qiáng)預(yù)測(cè)效果[7]。
近年來(lái),Transformer及其變體模型已成為時(shí)間序列預(yù)測(cè)領(lǐng)域的研究熱點(diǎn)。這些模型憑借其獨(dú)特的編碼-解碼結(jié)構(gòu)和自注意力機(jī)制,能夠有效捕捉時(shí)序特征的長(zhǎng)時(shí)相關(guān)性,同時(shí)支持并行訓(xùn)練,并具備出色的特征提取、多模態(tài)融合和可解釋性。例如,基于分層多尺度高斯改進(jìn)的Transformer[8]能夠很好地刻畫(huà)股票價(jià)格的長(zhǎng)短期相互依賴(lài)關(guān)系;而將經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)與嵌入時(shí)間注意力網(wǎng)絡(luò)相結(jié)合的股票價(jià)格預(yù)測(cè)方法[9]則可以提高股票價(jià)格的預(yù)測(cè)準(zhǔn)確率。此外,Stockformer模型[10]基于因果自注意力機(jī)制,挖掘股價(jià)與特征因素之間的時(shí)序依賴(lài),并提出了一種基于趨勢(shì)增強(qiáng)模塊的預(yù)測(cè)方法,提供序列趨勢(shì)特征,同時(shí)利用編碼器直接提供輸入特征的先驗(yàn)信息。
然而,根據(jù)以上文獻(xiàn),目前基于Transformer的股票預(yù)測(cè)研究仍較少,且在考慮特征變量時(shí),尚未充分結(jié)合情緒分析。本文基于流行的Informer模型,綜合考慮了基本面、技術(shù)分析和投資者情緒等多種因素作為特征,對(duì)股價(jià)進(jìn)行分析和預(yù)測(cè)。為了量化投資者情緒,本文構(gòu)建了金融情感詞典庫(kù),并借助SnowNLP模型計(jì)算和分析投資者情緒。
1" 方法與原理
1.1" Informer模型
Informer模型[11]是一種專(zhuān)為時(shí)間序列預(yù)測(cè)設(shè)計(jì)的深度學(xué)習(xí)模型,它基于Transformer的序列建模方法,尤其擅長(zhǎng)解決長(zhǎng)序列預(yù)測(cè)的挑戰(zhàn)。Informer模型采用了一種新的注意力機(jī)制,即概率自注意機(jī)制,該機(jī)制在降低時(shí)間復(fù)雜度和內(nèi)存使用至O(nlogn)的同時(shí),保持了出色的序列依賴(lài)對(duì)齊性能。
如圖1所示,Informer模型的核心結(jié)構(gòu)采用了編碼器-解碼器的框架。編碼器和解碼器均包含多層自注意力機(jī)制、全連接層和正則化層,這種設(shè)計(jì)使得模型能夠全面捕捉不同時(shí)間尺度的信息。此外,一個(gè)跨時(shí)間步的交互層被引入在編碼器和解碼器之間,以有效捕捉時(shí)間步之間的復(fù)雜依賴(lài)關(guān)系。
ProbSparse Self-Attention是Informer模型中的一個(gè)關(guān)鍵組件。它通過(guò)稀疏化的方式有效減少了計(jì)算量和內(nèi)存使用量,同時(shí)保持了模型的性能。Self-Attention Distilling技術(shù)則進(jìn)一步提高了模型的計(jì)算效率和特征提取能力。此外,Informer模型通過(guò)復(fù)制和堆疊多個(gè)相同的層,增強(qiáng)了模型的魯棒性和表達(dá)能力。
Informer模型的關(guān)鍵在于其獨(dú)特的注意力機(jī)制和自適應(yīng)能力。自注意力機(jī)制能夠建模輸入序列中每個(gè)元素與其他元素之間的關(guān)系,從而生成一個(gè)全局性的表征。這種機(jī)制使得模型能夠?qū)W習(xí)并捕捉輸入序列中不同位置之間的相關(guān)性,有效處理長(zhǎng)期依賴(lài)問(wèn)題。同時(shí),Informer模型具備強(qiáng)大的自適應(yīng)能力,無(wú)須針對(duì)特定任務(wù)設(shè)計(jì)特定的模型結(jié)構(gòu),即可適應(yīng)不同的時(shí)間序列預(yù)測(cè)任務(wù)。其高效處理長(zhǎng)期依賴(lài)和缺失值問(wèn)題的能力,以及出色的計(jì)算性能和自適應(yīng)能力,使得Informer模型在股票預(yù)測(cè)等時(shí)間序列預(yù)測(cè)任務(wù)中表現(xiàn)出色,為相關(guān)領(lǐng)域的研究和應(yīng)用提供了新的思路和方法。
1.2" 基于情感分析方法
情感分析的一種主要方法是基于詞典的方法,它通過(guò)對(duì)正、負(fù)兩種情緒詞匯的加權(quán)來(lái)判定一個(gè)句子的情緒極性。相對(duì)于機(jī)器學(xué)習(xí)方法,該方法具有更好的解釋性。目前,已有大量開(kāi)源的情感詞典,例如Hownet和NTUSD等。然而,這些詞典大多是針對(duì)通用情緒設(shè)計(jì)的,并不能涵蓋所有具體領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ),比如金融領(lǐng)域的“牛市/熊市”和“背離”等。因此,研究者們常采用與領(lǐng)域相關(guān)的詞典相結(jié)合的方法來(lái)進(jìn)行情感分析。例如,Li等人[12]將Harvard心理情緒詞典與Loughran–McDonald金融情緒詞典相結(jié)合,探討了財(cái)經(jīng)新聞對(duì)股價(jià)的影響;Tan等人[13]針對(duì)財(cái)經(jīng)新聞文章,提出了基于規(guī)則的情感分析方法。Day等人[14]基于四種數(shù)據(jù)集建立了一個(gè)情感詞庫(kù),并利用Suffix Array算法對(duì)其進(jìn)行擴(kuò)展,用于情感分析。結(jié)果顯示,利用財(cái)經(jīng)領(lǐng)域詞典進(jìn)行情感分析能夠有效提升投資者的投資收益率。此外,Zhang等人[15]基于六種詞庫(kù)構(gòu)建了微博情感詞典,并以此對(duì)微博文本進(jìn)行情感分析。還有研究[16]通過(guò)構(gòu)建心理情感詞典,利用字典法分析Twitter信息對(duì)股市的影響;Xu等人[17]則通過(guò)計(jì)算情感詞和語(yǔ)句詞向量之間的相似性來(lái)進(jìn)行情感分析,進(jìn)而提取股票特征并預(yù)測(cè)股票走勢(shì)。
2" 方法描述
本文所采用的方法的主要步驟如下:
1)獲取量?jī)r(jià)數(shù)據(jù)和基本面數(shù)據(jù)。
2)使用AdaBoost模型對(duì)技術(shù)指標(biāo)特征進(jìn)行重要性分析,提取相對(duì)重要的特征變量。
3)爬取東方財(cái)富網(wǎng)的財(cái)經(jīng)新聞、評(píng)論和資訊。
4)使用哈工大訊飛SnowNLP模型進(jìn)行情感分析,并計(jì)算情緒指數(shù)。
5)使用Informer模型對(duì)股價(jià)進(jìn)行預(yù)測(cè)。
6)評(píng)估模型性能。
模型的技術(shù)路線(xiàn)圖如圖2所示。
2.1" 金融領(lǐng)域情感詞典構(gòu)建
證券投資者在進(jìn)行投資時(shí),往往會(huì)參考有關(guān)股票市場(chǎng)的消息,例如網(wǎng)絡(luò)平臺(tái)上的意見(jiàn)等。對(duì)股票市場(chǎng)消息進(jìn)行情緒傾向性分析是其中的一個(gè)關(guān)鍵環(huán)節(jié),對(duì)后續(xù)的預(yù)測(cè)有一定的指導(dǎo)作用。為了準(zhǔn)確判斷金融文本的情感傾向,我們采用了基于詞典的方法。這種方法首先利用Jieba分詞算法將文本切分成單詞,并去除無(wú)意義的停用詞。接著,我們將正面情緒詞匯的初始權(quán)重設(shè)為1,負(fù)面情緒詞匯設(shè)為-1。如果在表示情緒的詞語(yǔ)前面有否定詞,則將其權(quán)重調(diào)整為相反數(shù)。如果在情感詞語(yǔ)之前存在程度副詞,則將該情感詞語(yǔ)的權(quán)重乘以對(duì)應(yīng)的程度副詞權(quán)重。最后,通過(guò)對(duì)一個(gè)句子中正面和負(fù)面單詞的加權(quán)總和,我們可以判斷句子的情感極性。
情感詞典的構(gòu)建對(duì)于情感分析的結(jié)果至關(guān)重要。在本文中,我們使用了多個(gè)情感詞典,如表1所示,包括HowNet、NTUSD和金融情緒詞典[18]。我們計(jì)劃進(jìn)一步融合通用詞典和金融領(lǐng)域的情緒詞典,以提升情感分析的準(zhǔn)確率。
2.2" 情感指數(shù)計(jì)算
通過(guò)爬蟲(chóng)技術(shù),從東方財(cái)富網(wǎng)等財(cái)經(jīng)網(wǎng)站爬取新聞、資訊、評(píng)論等數(shù)據(jù)。其中,中信證券相關(guān)數(shù)據(jù)共爬取了434 134條,華泰證券相關(guān)數(shù)據(jù)共爬取了163 381條,東方財(cái)富相關(guān)數(shù)據(jù)共爬取了631 137條。對(duì)這些文本數(shù)據(jù)進(jìn)行預(yù)處理,去除重復(fù)數(shù)據(jù)以及不符合要求的內(nèi)容。隨后,利用哈工大訊飛SnowNLP模型計(jì)算每條數(shù)據(jù)的情緒極性,判斷其為積極或消極。
情感計(jì)算通常采用機(jī)器學(xué)習(xí)方法,通過(guò)分類(lèi)模型(如SVM、樸素貝葉斯等)將文本劃分為正面和負(fù)面,并訓(xùn)練這些模型以應(yīng)用于實(shí)際數(shù)據(jù),從而計(jì)算每條文本的情緒得分。另一種方法是構(gòu)建情感詞典,利用所建立的情感詞典篩選出文本中的正面詞和負(fù)面詞。因此,構(gòu)建一個(gè)完善且詳盡的中文金融情感詞典是非常重要的。本文結(jié)合這兩種方法,利用建立的情感詞典訓(xùn)練SnowNLP模型,并將其應(yīng)用于情感分析。具體而言,打分大于0.55的文本被判定為積極情感(標(biāo)記為1),打分小于0.45的文本被判定為消極情感(標(biāo)記為-1),而打分在兩者之間的文本則被判定為中性情感(標(biāo)記為0),如表3所示。
最終,每個(gè)文本數(shù)據(jù)都會(huì)被賦予一個(gè)情感極性。股市歷史數(shù)據(jù)是一個(gè)隨時(shí)間變化的序列,因此需要每天計(jì)算情緒的波動(dòng)趨勢(shì)。情緒指標(biāo)用于衡量事件與輿情的總體傾向,其計(jì)算式為:
(1)
其中:pn表示這一天中正面的新聞資訊、股吧評(píng)論總量,而nn表示這一天中負(fù)面的新聞資訊、股吧評(píng)論總量。
2.3" 變量篩選
為防止過(guò)擬合和多重共線(xiàn)性等問(wèn)題,需要對(duì)各變量進(jìn)行篩選。為此,采用Adaboost模型對(duì)各變量進(jìn)行分類(lèi)分析,評(píng)估各變量的重要性,并進(jìn)行相關(guān)性和顯著性檢驗(yàn)。同時(shí),利用常見(jiàn)的方差膨脹因子(VIF)對(duì)變量進(jìn)行判定,以完成變量的篩選。
如圖3所示,根據(jù)變量的重要性進(jìn)行排序。中信證券的分析結(jié)果表明,按重要性從高到低排序,具有顯著影響的變量依次為WR、OBV、MACD、KDJ_D、MFI、RSI6等。華泰證券的分析結(jié)果表明,按重要性由高至低排序,影響較大的特征依次為OBV、MFI、MOM12、CCI、MACD、WR等。東方財(cái)富的分析結(jié)果表明,按重要性從高至低排序,影響較大的變量依次為MFI、WR、OBV、ROC、KDJ_J、MACD等。
3" 實(shí)證研究
3.1" 評(píng)價(jià)指標(biāo)
為更清晰、更精確地評(píng)判該模型的有效性,本文使用以下評(píng)價(jià)指標(biāo)對(duì)該模型的預(yù)測(cè)效果進(jìn)行評(píng)估。
3.1.1" MSE均方誤差
MSE是一種用于衡量預(yù)測(cè)模型誤差的指標(biāo),用于評(píng)估模型的預(yù)測(cè)能力。MSE越小,說(shuō)明模型的預(yù)測(cè)能力越好。其計(jì)算式為:
(2)
3.1.2" RMSE均方根誤差
RMSE是一種常用的衡量預(yù)測(cè)準(zhǔn)確度的指標(biāo),通過(guò)計(jì)算預(yù)測(cè)值與真實(shí)值之間的平方誤差,并平均后開(kāi)方。其計(jì)算式為:
(3)
3.1.3" MAE平均絕對(duì)誤差
MAE是一種衡量預(yù)測(cè)準(zhǔn)確度的指標(biāo),計(jì)算預(yù)測(cè)值和真實(shí)值的絕對(duì)誤差的平均值,可以用于評(píng)估預(yù)測(cè)模型的精度。MAE越小表示預(yù)測(cè)模型的精度越高。其計(jì)算式為:
(4)
3.1.4" MAPE平均絕對(duì)百分比誤差
MAPE是一種衡量預(yù)測(cè)準(zhǔn)確度的指標(biāo)。它計(jì)算的是預(yù)測(cè)值與實(shí)際值之間的誤差百分比平均值,不受量綱的影響,可以用于評(píng)估預(yù)測(cè)模型的精度。MAPE越小表示預(yù)測(cè)模型的精度越高。其計(jì)算式為:
(5)
3.1.5" R2擬合優(yōu)度
決定系數(shù)(R2)是用于衡量回歸模型擬合數(shù)據(jù)好壞的一個(gè)統(tǒng)計(jì)量。R2的值介于0和1之間,值越接近1,說(shuō)明模型擬合得越好。計(jì)算式為:
(6)
3.2" 預(yù)測(cè)分析
由于中信證券、華泰證券和東方財(cái)富是我國(guó)證券行業(yè)的龍頭企業(yè),具有一定的代表性,因此本文選取了中信證券、華泰證券和東方財(cái)富這三支個(gè)股的量?jī)r(jià)數(shù)據(jù)作為研究對(duì)象。研究數(shù)據(jù)涵蓋2013年至2023年的量?jī)r(jià)數(shù)據(jù),并計(jì)算了股民們較為常用的技術(shù)指標(biāo)。由于股票價(jià)格屬于時(shí)間序列預(yù)測(cè),需要保證其時(shí)序性,因此選擇前80%的數(shù)據(jù)作為訓(xùn)練集,中間10%的數(shù)據(jù)用于驗(yàn)證,最后10%的數(shù)據(jù)用于預(yù)測(cè)和評(píng)估。利用滾動(dòng)預(yù)測(cè)法,基于前64天的特征自變量信息,預(yù)測(cè)未來(lái)5天的收盤(pán)價(jià)。由于Informer模型的特性,需要額外回顧5天的數(shù)據(jù)?;谇捌谘芯拷Y(jié)果,中信證券選取了以下變量:OBV、MOM6、ROC、L_line、RSI12、KDJ_D;華泰證券選取的特征變量包括:OBV、MFI、MOM12、CCI、MACD、WR;東方財(cái)富選取的特征變量包括:MFI、WR、OBV、ROC、KDJ_J、MACD。此外,還結(jié)合了根據(jù)金融詞典計(jì)算得到的情緒指數(shù)(Emotion)和初始的量?jī)r(jià)數(shù)據(jù),共13個(gè)特征變量。
隨后,將數(shù)據(jù)集輸入Informer模型進(jìn)行訓(xùn)練。圖4展示了中信證券的訓(xùn)練損失變化和驗(yàn)證損失變化。
圖5至圖7分別展示了三支股票的預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)的對(duì)比曲線(xiàn)圖。從圖中可以看出AdaBoost-Emotion-Informer模型的預(yù)測(cè)結(jié)果與真實(shí)值最接近,誤差最小。
在使用Informer模型時(shí),我們發(fā)現(xiàn)即使不加入情感因素,Informer的預(yù)測(cè)能力已經(jīng)很出色。接下來(lái),我們對(duì)融入了AdaBoost算法和情感指數(shù)的模型進(jìn)行了比較,具體評(píng)測(cè)指標(biāo)的數(shù)值如表4所示。從表中可以看出,在加入AdaBoost算法和情感指數(shù)后,模型的預(yù)測(cè)性能得到了顯著提升。具體來(lái)說(shuō),AdaBoost-Emotion-Informer模型在所有5個(gè)評(píng)估指標(biāo)上均表現(xiàn)更好。這表明融入情感因素和AdaBoost算法后,Informer模型的預(yù)測(cè)能力得到了進(jìn)一步增強(qiáng)。
4" 結(jié)" 論
基于中信證券、華泰證券和東方財(cái)富等證券公司的股價(jià)變化,本文從技術(shù)指標(biāo)、基本面數(shù)據(jù)、投資者情緒和關(guān)注度等方面進(jìn)行了深入分析,并開(kāi)展了相關(guān)的實(shí)證研究,取得了一系列具有重要價(jià)值的研究結(jié)果:
1)多源數(shù)據(jù)能夠更好地挖掘和解釋數(shù)據(jù)的內(nèi)在特征,并提高股市預(yù)測(cè)的準(zhǔn)確性。在股市預(yù)測(cè)中,需要重視與股票市場(chǎng)走勢(shì)緊密相關(guān)的技術(shù)指標(biāo),例如CCI、MACD、MFI、ROC等。在個(gè)股投資時(shí),投資者應(yīng)綜合考慮基本面數(shù)據(jù)和技術(shù)指標(biāo),同時(shí)注意不同股票可能適用不同的技術(shù)指標(biāo)。
2)情緒指數(shù)對(duì)股票市場(chǎng)至關(guān)重要,它與股價(jià)波動(dòng)緊密相關(guān)。投資者應(yīng)關(guān)注股市情緒變化,特別是能反映投資者情緒的指數(shù),并且在市場(chǎng)出現(xiàn)異常情緒變化時(shí),應(yīng)及時(shí)調(diào)整投資策略以避免虧損。
本文通過(guò)Informer模型,利用過(guò)去64個(gè)交易日的數(shù)據(jù)對(duì)未來(lái)5個(gè)交易日的走勢(shì)進(jìn)行預(yù)測(cè)。雖然該模型能夠有效地把握股市的長(zhǎng)期走勢(shì),但存在時(shí)效性和粒度較大的問(wèn)題。為了更準(zhǔn)確地揭示多源數(shù)據(jù)對(duì)股市波動(dòng)性的長(zhǎng)期影響,未來(lái)研究可以考慮采用更短的時(shí)間周期,從而更深刻地認(rèn)識(shí)多源數(shù)據(jù)對(duì)股市波動(dòng)性的直接作用與動(dòng)態(tài)影響。
參考文獻(xiàn):
[1] 謝心蕊,雷秀仁,趙巖.MI和改進(jìn)PCA的降維算法在股價(jià)預(yù)測(cè)中的應(yīng)用 [J].計(jì)算機(jī)工程與應(yīng)用,2020,56(21):139-144.
[2] 胡聿文.基于優(yōu)化LSTM模型的股票預(yù)測(cè) [J].計(jì)算機(jī)科學(xué),2021,48(S1):151-157.
[3] 尹湘鋒,崔浩鋒,文雪婷.基于兩類(lèi)核函數(shù)的TSVR在股價(jià)預(yù)測(cè)中的比較 [J].統(tǒng)計(jì)與決策,2021,37(12):43-46.
[4] 方義秋,盧壯,葛君偉.聯(lián)合RMSE損失LSTM-CNN模型的股價(jià)預(yù)測(cè) [J].計(jì)算機(jī)工程與應(yīng)用,2022,58(9):294-302.
[5] 劉銘,單玉瑩.基于EMD-LSTM模型的股指收盤(pán)價(jià)預(yù)測(cè) [J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué),2021,35(12):269-276.
[6] 曹超凡,羅澤南,謝佳鑫,等. MDT-CNN-LSTM模型的股價(jià)預(yù)測(cè)研究 [J].計(jì)算機(jī)工程與應(yīng)用,2022,58(5):280-286.
[7] 許雪晨,田侃.一種基于金融文本情感分析的股票指數(shù)預(yù)測(cè)新方法 [J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2021,38(12):124-145.
[8] DING Q G,WU S,SUN H,et al. Hierarchical Multi-Scale Gaussian Transformer for Stock Movement Prediction [C]//Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence Special Track on AI in FinTech.Yokohama:IJCAI,2020:4640-4646.
[9] 林昱,常晉源,黃雁勇.融合經(jīng)驗(yàn)?zāi)B(tài)分解與深度時(shí)序模型的股價(jià)預(yù)測(cè) [J].系統(tǒng)工程理論與實(shí)踐,2022,42(6):1663-1677.
[10] 任佳屹,王愛(ài)銀. 融合因果注意力Transformer模型的股價(jià)預(yù)測(cè)研究 [J].計(jì)算機(jī)工程與應(yīng)用,2023,59(13):325-334.
[11] ZHOU H Y,ZHANG S H,PENG J Q,et al. Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting [C]//Proceedings of the AAAI Conference on Artificial Intelligence [S.I.]:AAAI Press,2021,35(12):11106-11115.
[12] LI X D,XIE H R,CHEN L,et al. News Impact on Stock Price Return Via Sentiment Analysis [J].Knowledge-Based Systems,2014,69:14-23.
[13] TAN L I,PHANG W S,CHIN K O,et al.Rule-Based Sentiment Analysis for Financial News [C]//2015 IEEE International Conference on Systems, Man, and Cybernetics.Hong Kong:IEEE,2015:1601-1606.
[14] DAY M Y,LEE C C.Deep Learning for Financial Sentiment Analysis on Finance News Providers [C]//2016 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining(ASONAM). San Francisco:IEEE,2016:1127-1134.
[15] ZHANG S X,WEI Z L,WANG Y,et al. Sentiment Analysis of Chinese Micro-Blog Text Based on Extended Sentiment Dictionary [J].Future Generation Computer Systems,2018,81:395-403.
[16] LI M,YANG C,ZHANG J,et al.Stock Market Analysis Using Social Networks [C]//Proceedings of the Australasian Computer Science Week Multiconference.New York:ACM,2018:1-10.
[17] XU J W,MURATA T. Stock Market Trend Prediction with Sentiment Analysis based on LSTM Neural Network [C]//International Multiconference of Engineers and Computer Scientists.Hong Kong:IAENG,2019:475-479.
[18] 姚加權(quán),馮緒,王贊鈞,等.語(yǔ)調(diào)、情緒及市場(chǎng)影響:基于金融情緒詞典 [J].管理科學(xué)學(xué)報(bào),2021,24(5):26-46.
作者簡(jiǎn)介:倪學(xué)曜(1998.03—),男,漢族,浙江湖州人,碩士研究生在讀,研究方向:股票預(yù)測(cè)與量化交易。
收稿日期:2024-09-26