趙 琪 徐維軍,2 季昱丞 劉桂芳 張衛(wèi)國,2
(1.華南理工大學(xué)工商管理學(xué)院;2.廣州市金融服務(wù)創(chuàng)新與風(fēng)險(xiǎn)管理研究基地;3.廣東財(cái)經(jīng)大學(xué)金融學(xué)院)
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域重要的基礎(chǔ)學(xué)科之一,致力于研究使計(jì)算機(jī)程序能夠從數(shù)據(jù)中學(xué)習(xí)經(jīng)驗(yàn)知識(shí),以改善其針對某任務(wù)的處理性能的算法。近年來,得益于大數(shù)據(jù)技術(shù)帶來的海量數(shù)據(jù)和并行計(jì)算帶來的計(jì)算效率提升,機(jī)器學(xué)習(xí)這一研究領(lǐng)域得以飛速發(fā)展,這也吸引著不同領(lǐng)域的學(xué)者將其應(yīng)用到計(jì)算機(jī)技術(shù)以外的研究中。在金融領(lǐng)域,隨著不斷提升的金融數(shù)據(jù)分析需求,機(jī)器學(xué)習(xí)的應(yīng)用已經(jīng)成為新的研究熱點(diǎn),其中,尤以“金融市場預(yù)測”(資產(chǎn)價(jià)格預(yù)測)方面的研究最具代表性。研究表明,自2007年開始,包含“機(jī)器學(xué)習(xí)”“金融市場預(yù)測”等關(guān)鍵詞的文獻(xiàn)數(shù)量呈顯著增長,并且至今仍保持著穩(wěn)定的增長趨勢[1]。與此同時(shí),機(jī)器學(xué)習(xí)算法在資產(chǎn)配置的實(shí)踐中也被廣泛應(yīng)用,量化投資者倡導(dǎo)應(yīng)用機(jī)器學(xué)習(xí)來尋找最優(yōu)的交易策略或基準(zhǔn)投資組合[2]。無論是從學(xué)術(shù)研究還是金融實(shí)踐的角度而言,在人工智能飛速發(fā)展的今天,機(jī)器學(xué)習(xí)的應(yīng)用已成為金融市場預(yù)測及資產(chǎn)配置這一研究課題的題中應(yīng)有之義。
相比于利用傳統(tǒng)的計(jì)量和統(tǒng)計(jì)模型對金融市場進(jìn)行預(yù)測并得出資產(chǎn)配置決策,機(jī)器學(xué)習(xí)的優(yōu)勢主要體現(xiàn)在兩個(gè)方面:①機(jī)器學(xué)習(xí)具有從數(shù)據(jù)中學(xué)習(xí)經(jīng)驗(yàn)知識(shí)的能力。機(jī)器學(xué)習(xí)算法對未來價(jià)格趨勢的預(yù)測,主要基于其從數(shù)據(jù)中學(xué)習(xí)到的經(jīng)驗(yàn)知識(shí),并非完全依賴于人為給定的先驗(yàn)知識(shí),這就使得從數(shù)據(jù)中挖掘出更多與未來資產(chǎn)價(jià)格相關(guān)的信息成為可能;此外,機(jī)器學(xué)習(xí)中的某些分支算法能夠更好地處理文本等非結(jié)構(gòu)化數(shù)據(jù),而這類數(shù)據(jù)中蘊(yùn)含的信息往往是對結(jié)構(gòu)化數(shù)據(jù)的重要補(bǔ)充[3]。②金融數(shù)據(jù)所具有的特征決定了機(jī)器學(xué)習(xí)在這一課題中的適用性。金融時(shí)間序列數(shù)據(jù)所具有的非線性性、高維度特性及噪聲性質(zhì),使得應(yīng)用傳統(tǒng)計(jì)量方法的研究難以有進(jìn)一步的突破[4,5],而機(jī)器學(xué)習(xí)對模型的函數(shù)形式并未做出嚴(yán)格的假設(shè),對變量之間的相互作用以及參數(shù)的統(tǒng)計(jì)分布假設(shè),相較于傳統(tǒng)計(jì)量方法更為寬松[6],因而在分析和預(yù)測金融數(shù)據(jù)時(shí)更具優(yōu)勢。綜上所述,機(jī)器學(xué)習(xí)算法的應(yīng)用,其意義并不僅止于簡單引入跨學(xué)科的研究方法,更重要的是為傳統(tǒng)研究中數(shù)據(jù)和方法上的局限性引入針對性的解決思路。
有別于現(xiàn)有文獻(xiàn),本研究聚焦于機(jī)器學(xué)習(xí)在金融資產(chǎn)價(jià)格預(yù)測和配置這一子課題中的應(yīng)用,對已有文獻(xiàn)的研究方法及內(nèi)容進(jìn)行梳理、分析(1)本研究首先以“機(jī)器學(xué)習(xí)”“投資組合”“價(jià)格預(yù)測”及其類似表達(dá)作為關(guān)鍵詞,同時(shí)在Google Scholar和知網(wǎng)進(jìn)行檢索;然后用檢索結(jié)果的參考文獻(xiàn)進(jìn)一步擴(kuò)充所選論文,保留近15年內(nèi)的論文,并根據(jù)摘要內(nèi)容刪除與研究內(nèi)容關(guān)系不大的論文;最后追蹤這些論文的發(fā)表期刊和被引情況。對于會(huì)議論文,僅保留發(fā)表于中國計(jì)算機(jī)學(xué)會(huì)推薦會(huì)議的論文;對于期刊論文,首先保留金融領(lǐng)域頂級(jí)期刊和中文CSSCI期刊論文,其次保留被引率較高的其他期刊論文(影響因子較高的SCI和SSCI索引期刊)。由于涉及深度學(xué)習(xí)的論文較少,在篩選時(shí)也考慮了公開的工作論文。最終篩選出中英文論文共35篇。,并從以下兩個(gè)方面對既有的綜述文獻(xiàn)[1,4]進(jìn)行補(bǔ)充:①不同于HENRIQUE等[1]對文獻(xiàn)的總結(jié)性梳理,本研究在文獻(xiàn)的基礎(chǔ)上分析了機(jī)器學(xué)習(xí)的適用性和局限性,并進(jìn)一步探討了未來可能的研究方向;②有別于蘇治等[4]的研究,本研究全面回顧應(yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的相關(guān)文獻(xiàn),對比兩種方法在應(yīng)用于金融資產(chǎn)價(jià)格預(yù)測和配置研究中的優(yōu)勢和不足。這是本研究對現(xiàn)有文獻(xiàn)的重要邊際貢獻(xiàn)。
機(jī)器學(xué)習(xí)是“人工智能”領(lǐng)域最重要的基礎(chǔ)學(xué)科之一[7],隸屬于計(jì)算機(jī)科學(xué)領(lǐng)域。這一學(xué)科致力于研究“使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)經(jīng)驗(yàn)知識(shí)”的算法,即“機(jī)器學(xué)習(xí)算法”。與通常意義上的計(jì)算機(jī)算法不同,機(jī)器學(xué)習(xí)算法并非靜態(tài)的代碼指令,而是通過一定算法,使得計(jì)算機(jī)能根據(jù)輸入的經(jīng)驗(yàn)數(shù)據(jù)產(chǎn)生解決特定問題的模型,并利用該模型對新的數(shù)據(jù)產(chǎn)生相應(yīng)的判斷。通常,輸入數(shù)據(jù)并不能以其原始形式被計(jì)算機(jī)讀取,而是要轉(zhuǎn)化為特定的表示后,再作為機(jī)器學(xué)習(xí)算法的輸入。這類特定表示稱為“特征”。從數(shù)據(jù)中習(xí)得模型的過程,稱為“學(xué)習(xí)”或“訓(xùn)練”。通過訓(xùn)練,機(jī)器學(xué)習(xí)算法能夠習(xí)得從“特征”到特定問題的解之間的映射關(guān)系,并且在面對訓(xùn)練數(shù)據(jù)以外的新數(shù)據(jù)時(shí)提供相應(yīng)問題的解。機(jī)器學(xué)習(xí)算法的一般流程框架見圖1。
圖1 機(jī)器學(xué)習(xí)算法的一般流程
傳統(tǒng)機(jī)器學(xué)習(xí)算法的性能很大程度上依賴于用于表示數(shù)據(jù)的特征。數(shù)據(jù)的特征通常由研究者手動(dòng)設(shè)計(jì),但對于大多數(shù)問題來說,手動(dòng)設(shè)計(jì)的特征往往并不一定和問題的解相關(guān)。解決這個(gè)問題的一個(gè)方法是,利用機(jī)器學(xué)習(xí)來學(xué)習(xí)特征本身,這類方法稱為表示學(xué)習(xí)。當(dāng)下研究火熱的深度學(xué)習(xí)正是表示學(xué)習(xí)的一種形式,它通過將復(fù)雜的特征表示分解為一系列嵌套的簡單特征表示,從原始數(shù)據(jù)中習(xí)得數(shù)據(jù)的高層次抽象特征[8]。與傳統(tǒng)機(jī)器學(xué)習(xí)算法不同,深度學(xué)習(xí)更類似于一種“端到端”的形式(即不包含圖1的特征提取步驟),能夠直接從原始數(shù)據(jù)中學(xué)習(xí)經(jīng)驗(yàn)知識(shí);經(jīng)過合理設(shè)計(jì)的深度學(xué)習(xí)結(jié)構(gòu),能夠習(xí)得與特定問題更具相關(guān)性的特征,從而達(dá)到比傳統(tǒng)機(jī)器學(xué)習(xí)方法更優(yōu)的性能。然而,深度學(xué)習(xí)也有其局限性:相較于傳統(tǒng)機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)對超參數(shù)更為敏感,對深度學(xué)習(xí)模型的充分訓(xùn)練往往需要更大量級(jí)的數(shù)據(jù)[9]。對于具體的應(yīng)用問題而言,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)孰優(yōu)孰劣并不能一概而論,而是要結(jié)合可用數(shù)據(jù)的特點(diǎn)來進(jìn)行具體分析。
廣義的金融資產(chǎn)包括股票、債券、期貨等多種金融產(chǎn)品,而本研究中討論的資產(chǎn)價(jià)格預(yù)測和配置主要落點(diǎn)于股票市場。這也是資產(chǎn)價(jià)格預(yù)測和配置研究中被討論最多的一個(gè)問題。
傳統(tǒng)實(shí)證研究中的資產(chǎn)價(jià)格預(yù)測主要包含:基于價(jià)量信息的技術(shù)分析方法、基于基本面信息的基本面分析和時(shí)間序列預(yù)測模型。這3類研究中所采用的數(shù)據(jù)均可作為機(jī)器學(xué)習(xí)算法的輸入特征,以應(yīng)用于資產(chǎn)價(jià)格預(yù)測的研究。下面將根據(jù)輸入數(shù)據(jù)的類型分別對代表性文獻(xiàn)進(jìn)行分類梳理和討論。
(1)基于技術(shù)分析指標(biāo)的資產(chǎn)價(jià)格預(yù)測KIM[10]提出的模型是應(yīng)用機(jī)器學(xué)習(xí)以預(yù)測未來資產(chǎn)價(jià)格的一個(gè)典型例子。該研究采用12種技術(shù)分析指標(biāo)作為特征,用支持向量機(jī)(support vector machine,SVM)對韓國股票市場指數(shù)(KOSPI)的單日變動(dòng)方向進(jìn)行分類,并將結(jié)果與神經(jīng)網(wǎng)絡(luò)(neural networks,NN)和基于案例的推理(case based reasoning,CBR)預(yù)測的結(jié)果進(jìn)行比較,證明SVM具有更好的預(yù)測性能。HUANG等[11]則采用支持向量回歸(support vector regression,SVR)對單日股票價(jià)格的具體數(shù)值進(jìn)行回歸預(yù)測。該文獻(xiàn)通過特征選擇方法來優(yōu)化輸入特征,并運(yùn)用自組織特征圖(self-organizing feature maps,SOFM)技術(shù),對輸入SVR的訓(xùn)練樣本進(jìn)行篩選,以提升SVR的預(yù)測準(zhǔn)確度。不同于上述文獻(xiàn),CHANG等[12]應(yīng)用神經(jīng)網(wǎng)絡(luò),將未來的資產(chǎn)價(jià)格變動(dòng)直接預(yù)測為買入點(diǎn)和賣出點(diǎn),并采用基于案例的動(dòng)態(tài)窗口(case based dynamic window,CBDW)進(jìn)一步優(yōu)化預(yù)測結(jié)果,在實(shí)證中取得了較高的收益。KUMAR等[13]研究了多種特征選擇方法的性能。他們將特征選擇與SVM結(jié)合起來,利用4種特征選擇方法,從55個(gè)原始的技術(shù)指標(biāo)中選擇特征,用于訓(xùn)練近似支持向量機(jī)(proximal support vector machine,PSVM),并發(fā)現(xiàn)結(jié)合了特征選擇方法的PSVM,比單一的PSVM具有更優(yōu)的股票價(jià)格預(yù)測性能,且隨機(jī)森林(random forest,RF)方法能夠挑選出最優(yōu)的特征。PATEL等[14]對比了神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林和樸素貝葉斯(Na?ve Bayes,NB)4種機(jī)器學(xué)習(xí)算法的預(yù)測性能,同樣發(fā)現(xiàn)隨機(jī)森林算法能夠達(dá)到最佳的預(yù)測效果。除此之外,PATEL等[14]還發(fā)現(xiàn),將技術(shù)分析指標(biāo)本身指示的未來價(jià)格趨勢信息作為機(jī)器學(xué)習(xí)算法的輸入,能夠進(jìn)一步提升機(jī)器學(xué)習(xí)算法的預(yù)測性能。這表明在資產(chǎn)價(jià)格預(yù)測問題中,通過改良傳統(tǒng)實(shí)證研究中已有的預(yù)測變量,使之成為更適合機(jī)器學(xué)習(xí)的特征,能夠有效地提升機(jī)器學(xué)習(xí)模型的預(yù)測性能。除對輸入特征的選擇和優(yōu)化以外,模型的優(yōu)化也是現(xiàn)有文獻(xiàn)研究的重要方向。ARMANO等[15]提出了模型選擇的方法。通過在神經(jīng)網(wǎng)絡(luò)之前添加一個(gè)用于選擇預(yù)測模型的層,該研究能夠利用遺傳算法選擇性能最好的預(yù)測模型,以此提高預(yù)測的準(zhǔn)確度。
(2)基于基本面信息的資產(chǎn)價(jià)格預(yù)測ENKE等[16]選取了31個(gè)金融和經(jīng)濟(jì)變量,利用基于信息增益的數(shù)據(jù)挖掘方法,選取了其中15個(gè)與未來資產(chǎn)價(jià)格具有更高相關(guān)性的變量,并采用神經(jīng)網(wǎng)絡(luò)對標(biāo)普500指數(shù)的變動(dòng)趨勢進(jìn)行預(yù)測。在此基礎(chǔ)上,ZHONG等[17]選取了60個(gè)金融和經(jīng)濟(jì)變量,并對比了3種主成分分析(principal component analysis,PCA)方法的特征選擇性能,證明原始的PCA方法挑選出的36個(gè)變量能夠更好地預(yù)測標(biāo)普500指數(shù)的日線方向。以上研究表明,在機(jī)器學(xué)習(xí)的應(yīng)用中,引入更多的預(yù)測變量,可以有效地提升機(jī)器學(xué)習(xí)模型的性能;這也從側(cè)面證明,傳統(tǒng)實(shí)證研究中所用的預(yù)測變量,遠(yuǎn)不足以反映出金融市場數(shù)據(jù)中所包含的所有有關(guān)未來資產(chǎn)價(jià)格的信息,對這一課題的研究來說,進(jìn)一步的數(shù)據(jù)挖掘仍然是必要的。BALLINGS等[18]研究了集成學(xué)習(xí)算法的性能,構(gòu)建并結(jié)合多個(gè)同類型的分類器來預(yù)測資產(chǎn)價(jià)格的年度變動(dòng)趨勢,并證明相比于AdaBoost和Kernel Factory方法,隨機(jī)森林方法能夠更好地集成多個(gè)分類器的分類結(jié)果。不同于一般的集成學(xué)習(xí)算法,BARAK等[19]研究了不同類型的單分類器(包括SVM、NN、決策樹)的集成,使用基于數(shù)據(jù)集聚類和候選分類器準(zhǔn)確度的方法確定基礎(chǔ)分類器的數(shù)量和類型,并對比了Bagging、Boosting和AdaBoost 3種集成學(xué)習(xí)方法,證明利用Bagging方法集成的模型能夠達(dá)到最高的預(yù)測準(zhǔn)確度。
(3)結(jié)合技術(shù)分析指標(biāo)和基本面信息的資產(chǎn)價(jià)格預(yù)測YU等[20]的研究采用技術(shù)指標(biāo)和基本面數(shù)據(jù)作為特征,提出了一種演化的最小二乘SVM,利用遺傳算法進(jìn)行特征選擇和模型的參數(shù)選擇,并證明這一模型的性能優(yōu)于傳統(tǒng)SVM以及自回歸移動(dòng)平均(autoregressive integrated moving average,ARIMA)模型、NN及線性判別分析。TSAI等[21]將NN作為基準(zhǔn)預(yù)測模型,研究了PCA、遺傳算法和決策樹3種特征選擇方法的作用,發(fā)現(xiàn)與單一特征選擇方法相比,多種特征選擇方法的組合能夠提供更高的預(yù)測準(zhǔn)確度。PAN等[22]認(rèn)為,資產(chǎn)價(jià)格預(yù)測的輸入特征應(yīng)當(dāng)包含不同頻率采樣的數(shù)據(jù),且輸出預(yù)測也可以為多個(gè)。通過構(gòu)建多個(gè)SVM,并應(yīng)用無限制混合數(shù)據(jù)采樣方法,該研究能夠利用多種采樣頻率的輸入特征,預(yù)測多種時(shí)間長度下的未來股票指數(shù)變動(dòng)趨勢,其性能優(yōu)于采用單一采樣頻率輸入特征的預(yù)測模型和單一輸出的預(yù)測模型。這一研究通過使用不同采樣頻率來構(gòu)建輸入特征,從時(shí)間維度豐富了輸入特征中包含的信息。
(4)基于價(jià)格時(shí)間序列數(shù)據(jù)的資產(chǎn)價(jià)格預(yù)測HASSAN等[23]將每日股票價(jià)格作為NN的輸入特征,并將NN的輸出作為隱馬爾科夫模型的輸入,以預(yù)測單日的股票價(jià)格;隱馬爾科夫模型的參數(shù)優(yōu)化由遺傳算法完成。實(shí)驗(yàn)表明,這一融合模型能夠達(dá)到與ARIMA模型相近的預(yù)測性能,證明了機(jī)器學(xué)習(xí)在處理價(jià)格時(shí)間序列數(shù)據(jù)的適用性。NGUYEN等[24]和REN等[25]同時(shí)采用了歷史價(jià)格數(shù)據(jù)和情緒指標(biāo)作為預(yù)測變量,訓(xùn)練SVM以預(yù)測股票價(jià)格變動(dòng),證明了情緒變量的引入能夠進(jìn)一步提高機(jī)器學(xué)習(xí)模型的預(yù)測準(zhǔn)確度。YAN等[26]提出了一種基于貝葉斯正則化的神經(jīng)網(wǎng)絡(luò)模型,根據(jù)網(wǎng)絡(luò)權(quán)重的概率性質(zhì)來提升模型的泛化性能,并進(jìn)一步使用粒子群算法來優(yōu)化網(wǎng)絡(luò)參數(shù)。實(shí)證結(jié)果表明,這一改進(jìn)的神經(jīng)網(wǎng)絡(luò)模型,在預(yù)測能力上優(yōu)于普通神經(jīng)網(wǎng)絡(luò)、SVM及HASSAN等[23]提出的模型。SERMPINIS等[27]利用NN、k近鄰算法和平滑過渡自回歸模型(smooth transition autoregressive models,STAR),從歷史價(jià)格數(shù)據(jù)中構(gòu)建非線性的預(yù)測變量,并將這些變量作為SVR算法的輸入,預(yù)測5個(gè)歐洲ETF指數(shù)的買入和賣出點(diǎn)。與以上研究不同,KRAUSS等[28]將歷史價(jià)格序列轉(zhuǎn)化為歷史收益序列,并將其作為輸入特征,對比了神經(jīng)網(wǎng)絡(luò)、梯度提升樹(gradient boosting decision trees,GBDT)及隨機(jī)森林3種機(jī)器學(xué)習(xí)算法的預(yù)測性能,并證明隨機(jī)森林的性能優(yōu)于其他兩種,且3種算法的等權(quán)重組合能夠達(dá)到比其他權(quán)重組合更高的預(yù)測準(zhǔn)確率。除直接用于處理時(shí)間序列數(shù)據(jù)以外,機(jī)器學(xué)習(xí)還能以與經(jīng)典時(shí)間序列模型結(jié)合的方式應(yīng)用于資產(chǎn)價(jià)格的預(yù)測。PAI等[29]和WANG等[30]將機(jī)器學(xué)習(xí)算法與時(shí)間序列預(yù)測模型結(jié)合起來,以提升預(yù)測性能。前者使用SVM作為ARIMA模型的補(bǔ)充,用于捕捉時(shí)間序列中的非線性特征;后者則將指數(shù)平滑模型(exponential smoothing model,ESM)、ARIMA和神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果結(jié)合起來,并用遺傳算法優(yōu)化3種模型的權(quán)重,得到了比3種單一模型及等權(quán)重模型更優(yōu)的預(yù)測性能。對本節(jié)中所述文獻(xiàn)使用的數(shù)據(jù)及主要方法的總結(jié)見表1。
由表1可見,價(jià)格數(shù)據(jù)和基本面數(shù)據(jù)是最主要的輸入特征來源。大部分文獻(xiàn)都聚焦于預(yù)測未來市場的變動(dòng)趨勢或投資決策時(shí)機(jī),預(yù)測具體數(shù)值的文獻(xiàn)相對較少。其中,SVM(SVR)和NN是應(yīng)用最多的兩種方法,包括二者的原始形式及改進(jìn)形式。但應(yīng)當(dāng)注意到,有研究表明[14,28],RF在預(yù)測準(zhǔn)確度上比這兩種經(jīng)典方法表現(xiàn)得更好。從文獻(xiàn)中應(yīng)用的改進(jìn)方法來看,對已有方法的改進(jìn)主要集中于輸入特征和算法兩個(gè)方面。在輸入特征方面,特征選擇方法的引入是比較普遍的做法,其目的在于,從已有特征中篩選出與未來資產(chǎn)價(jià)格變動(dòng)更相關(guān)的特征,以提高預(yù)測的準(zhǔn)確度。也有文獻(xiàn)考慮到將不同數(shù)據(jù)來源的特征結(jié)合起來,如同時(shí)采用技術(shù)分析指標(biāo)和基本面指標(biāo)作為特征,從文本數(shù)據(jù)中挖掘情緒指標(biāo)和主題特征[24,25]等。除此之外,對輸入特征本身的特性進(jìn)行探討,并嘗試改進(jìn)特征的構(gòu)建方法[14,22,27],也是一個(gè)被證明可行的思路。從算法的改進(jìn)來看,已有文獻(xiàn)主要做了3個(gè)方面的嘗試:采用改進(jìn)的經(jīng)典機(jī)器學(xué)習(xí)方法[13,20,27],改進(jìn)模型的參數(shù)選擇方法[20,23,26,30]以及多種方法的結(jié)合或集成[12,15,18,19,23,29,30]。在參數(shù)選擇方法中,啟發(fā)式算法是應(yīng)用最多的一類方法,包括遺傳算法、粒子群優(yōu)化算法等,用以尋找使預(yù)測準(zhǔn)確度更高的模型參數(shù)。對于方法的結(jié)合和集成,不僅存在對不同方法的簡單結(jié)合(如使用不同算法完成預(yù)測中的不同步驟、多個(gè)模型的加權(quán)組合等),也存在利用集成學(xué)習(xí)方法對多個(gè)單一的預(yù)測模型進(jìn)行集成。此外,機(jī)器學(xué)習(xí)方法和傳統(tǒng)時(shí)間序列預(yù)測模型的結(jié)合,也能帶來預(yù)測準(zhǔn)確度的提升。
表1 應(yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)算法的資產(chǎn)價(jià)格預(yù)測研究匯總
盡管應(yīng)用機(jī)器學(xué)習(xí)的資產(chǎn)價(jià)格預(yù)測這一研究問題隸屬于計(jì)算機(jī)和金融的交叉領(lǐng)域,但從以上梳理的文獻(xiàn)中不難看出,對這一問題研究較多的大部分是計(jì)算機(jī)領(lǐng)域的學(xué)者,發(fā)表期刊也以計(jì)算機(jī)領(lǐng)域的期刊為主,因此,針對這一問題的研究思路也多以計(jì)算機(jī)角度的算法改進(jìn)方面見長。然而,單純的算法優(yōu)化必然存在瓶頸,對資產(chǎn)價(jià)格預(yù)測這一具體研究問題而言,更重要的是從金融理論的角度出發(fā),探索和發(fā)現(xiàn)與市場趨勢變動(dòng)有關(guān)的因素,進(jìn)而改進(jìn)現(xiàn)有的資產(chǎn)價(jià)格預(yù)測方法。PAN等[22]對不同采樣頻率的輸入數(shù)據(jù)的討論即是一個(gè)很好的嘗試。從長遠(yuǎn)來看,這不僅有賴于相關(guān)金融理論的發(fā)展,也需要金融領(lǐng)域的學(xué)者更多地進(jìn)入這一交叉領(lǐng)域,探討如何利用已有的金融知識(shí)對這一領(lǐng)域的研究提出針對性的優(yōu)化思路。
作為近年來機(jī)器學(xué)習(xí)領(lǐng)域的熱點(diǎn)研究之一,深度學(xué)習(xí)也逐漸被應(yīng)用于資產(chǎn)價(jià)格預(yù)測與配置的研究。但是,由于深度學(xué)習(xí)相比于傳統(tǒng)機(jī)器學(xué)習(xí)的發(fā)展時(shí)間尚短,目前,公開發(fā)表于權(quán)威期刊與頂級(jí)會(huì)議的相關(guān)研究還較少,因此,這里將不再對相關(guān)文獻(xiàn)進(jìn)行分類,而是將應(yīng)用深度學(xué)習(xí)的所有研究合并討論。
在資產(chǎn)價(jià)格預(yù)測中,未經(jīng)處理的原始數(shù)據(jù)主要包括價(jià)格序列和文本數(shù)據(jù),這也是傳統(tǒng)研究中常用指標(biāo)的數(shù)據(jù)來源,因此,應(yīng)用深度學(xué)習(xí)的研究,主要從這兩類數(shù)據(jù)中提取特征并進(jìn)行預(yù)測。FISCHER等[31]對比了傳統(tǒng)機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法在處理收益時(shí)間序列上的性能。他們采用了與KRAUSS等[28]相同的輸入,分別對比了邏輯回歸、隨機(jī)森林和長短時(shí)記憶(long short-term memory,LSTM)網(wǎng)絡(luò)在預(yù)測標(biāo)普500成分股價(jià)格趨勢時(shí)的準(zhǔn)確度,發(fā)現(xiàn)LSTM能夠達(dá)到比隨機(jī)森林算法更高的預(yù)測準(zhǔn)確度,而后者在KRAUSS等[28]中被證明是表現(xiàn)最優(yōu)的傳統(tǒng)機(jī)器學(xué)習(xí)算法。這一結(jié)果證明,深度學(xué)習(xí)確實(shí)能夠從時(shí)間序列數(shù)據(jù)中提取出更優(yōu)的特征。此外,他們還嘗試探究深度學(xué)習(xí)的“黑箱”性質(zhì),初步探討了LSTM預(yù)測中看漲的股票的共性特征,發(fā)現(xiàn)其與股票市場中的“短期反轉(zhuǎn)效應(yīng)”存在一致性。TROIANO等[32]同樣采用了LSTM來處理時(shí)間序列數(shù)據(jù),將運(yùn)用傳統(tǒng)技術(shù)指標(biāo)方法做出的投資決策作為訓(xùn)練數(shù)據(jù)的標(biāo)簽,將己有的歷史價(jià)格序列數(shù)據(jù)作為輸入,利用LSTM算法“復(fù)制”這一投資決策的產(chǎn)生過程,習(xí)得的模型可從特定資產(chǎn)的歷史價(jià)格中預(yù)測可能盈利的交易行為。SEZER等[33]將15種不同時(shí)間間隔的15個(gè)技術(shù)指標(biāo)轉(zhuǎn)化為灰度圖像,以預(yù)測資產(chǎn)價(jià)格的未來趨勢。具體地,將每種時(shí)間間隔的技術(shù)指標(biāo)表示為15×15像素圖中的像素點(diǎn),每個(gè)技術(shù)指標(biāo)的具體數(shù)值用像素點(diǎn)的灰度值表示;隨后,采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)分析該灰度圖像,將未來的價(jià)格變動(dòng)趨勢預(yù)測為買入、賣出、持倉3種交易信號(hào)(與CHANG等[12]類似),并通過樣本外測試,證明這一預(yù)測能夠獲得比“買入-持有”策略更高的收益。DING等[34]針對事件驅(qū)動(dòng)的股票市場變動(dòng),提出了一種預(yù)測股票價(jià)格變動(dòng)的深度學(xué)習(xí)方法。在該研究中,從新聞文本中提取的事件,經(jīng)過神經(jīng)張量網(wǎng)絡(luò)訓(xùn)練后被表示為密集向量,而后被送入深度卷積神經(jīng)網(wǎng)絡(luò),用于根據(jù)新聞事件預(yù)測未來可能的股票價(jià)格變動(dòng)。實(shí)驗(yàn)結(jié)果表明,該模型能夠分別在標(biāo)普500指數(shù)預(yù)測和個(gè)股預(yù)測兩方面均實(shí)現(xiàn)可觀的改進(jìn)。以上兩個(gè)研究都將深度學(xué)習(xí)的輸入數(shù)據(jù)轉(zhuǎn)化為特定的形式,這能夠更好地發(fā)揮特殊設(shè)計(jì)的深度學(xué)習(xí)模型在處理對應(yīng)結(jié)構(gòu)的數(shù)據(jù)時(shí)的優(yōu)勢。DENG等[35]將深度學(xué)習(xí)算法引入“金融信號(hào)處理+在線交易”的學(xué)習(xí)框架,構(gòu)建了一個(gè)基于深度強(qiáng)化學(xué)習(xí)的交易系統(tǒng)。深度學(xué)習(xí)算法用于從動(dòng)態(tài)的市場變化中學(xué)習(xí)特征(金融信號(hào)處理),強(qiáng)化學(xué)習(xí)算法基于這些特征學(xué)習(xí)具有高累積收益率的實(shí)時(shí)交易模式(在線交易)。另外,他們還將模糊學(xué)習(xí)擴(kuò)展到深度學(xué)習(xí)模型中,以減少原始時(shí)間序列中的不確定性,這是針對數(shù)據(jù)中可能存在的噪聲的優(yōu)化。KRAUS等[36]利用LSTM方法對文本數(shù)據(jù)進(jìn)行處理,根據(jù)上市公司年報(bào)文件中的文本信息預(yù)測未來回報(bào),并采用了遷移學(xué)習(xí)的思想,以進(jìn)一步提高預(yù)測準(zhǔn)確度,在預(yù)測變動(dòng)趨勢(分類任務(wù))和具體數(shù)值上(回歸任務(wù))都取得了可觀的預(yù)測性能。
與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,深度學(xué)習(xí)在理解輸入數(shù)據(jù)方面往往更具優(yōu)勢:嚴(yán)格意義上來講,F(xiàn)ISCHER等[31]與SEZER等[33]使用的訓(xùn)練數(shù)據(jù)并非純粹的原始數(shù)據(jù),但他們的成功也恰恰證明了深度學(xué)習(xí)在提取數(shù)據(jù)特征表示上的優(yōu)越性能,即使是面對已經(jīng)過人工編輯的輸入數(shù)據(jù)。FISCHER等[31]的分析也表明,深度學(xué)習(xí)足以從數(shù)據(jù)中學(xué)習(xí)到被傳統(tǒng)金融實(shí)證研究證實(shí)的規(guī)律。而在文本數(shù)據(jù)處理中,深度學(xué)習(xí)的特征提取能力,使其能夠從文本中提取出與資產(chǎn)價(jià)格變動(dòng)相關(guān)的信息,并在資產(chǎn)價(jià)格預(yù)測問題中表現(xiàn)出比應(yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)的自然語言處理方法更好的性能。但同樣應(yīng)當(dāng)注意到,由于深度學(xué)習(xí)提取的特征往往無法在邏輯上與相關(guān)問題關(guān)聯(lián)起來,因此很難根據(jù)具體的應(yīng)用問題來對深度學(xué)習(xí)模型進(jìn)行優(yōu)化,如基于傳統(tǒng)機(jī)器學(xué)習(xí)的研究中通過改良輸入特征來提升模型性能?,F(xiàn)有研究也未曾涉及對深度學(xué)習(xí)方法中各個(gè)環(huán)節(jié)的進(jìn)一步優(yōu)化。另外,成功的深度學(xué)習(xí)模型往往與輸入數(shù)據(jù)的形式相關(guān),除金融時(shí)間序列數(shù)據(jù)可以被直接用于適合序列數(shù)據(jù)的深度學(xué)習(xí)算法以外,部分?jǐn)?shù)據(jù)仍需要被轉(zhuǎn)換為特定形式后再輸入深度學(xué)習(xí)模型。這就對深度學(xué)習(xí)的應(yīng)用提出了更高的要求,使得其不像傳統(tǒng)機(jī)器學(xué)習(xí)那樣更容易被遷移到資產(chǎn)價(jià)格預(yù)測與配置的相關(guān)研究中。
資產(chǎn)配置是將資產(chǎn)分散投資于多種資產(chǎn)的過程,其目的是通過調(diào)整投資組合中不同資產(chǎn)的比例來平衡風(fēng)險(xiǎn)和回報(bào)??煽康奈磥碣Y產(chǎn)價(jià)格預(yù)測能夠?yàn)橘Y產(chǎn)配置策略提供一定的先驗(yàn)信息,從而在控制一定風(fēng)險(xiǎn)的情況下獲取更高的回報(bào)?,F(xiàn)有應(yīng)用機(jī)器學(xué)習(xí)的資產(chǎn)配置研究主要基于對資產(chǎn)價(jià)格的預(yù)測,但仍有部分文獻(xiàn)討論了如何將機(jī)器學(xué)習(xí)直接應(yīng)用于資產(chǎn)配置問題。下面將對以上兩類文獻(xiàn)分別進(jìn)行梳理,探討機(jī)器學(xué)習(xí)算法在資產(chǎn)配置方面的應(yīng)用現(xiàn)狀。
(1)基于價(jià)格預(yù)測的資產(chǎn)配置研究李斌等[37]利用3種機(jī)器學(xué)習(xí)算法(SVM、NN和AdaBoost)預(yù)測股票未來的漲跌,根據(jù)預(yù)測結(jié)果構(gòu)建等權(quán)重投資組合,并證明根據(jù)機(jī)器學(xué)習(xí)算法預(yù)測結(jié)果構(gòu)建的投資組合績效,顯著優(yōu)于“買入-持有”策略和傳統(tǒng)技術(shù)分析策略。KRAUSS等[28]與FISCHER等[31]用機(jī)器學(xué)習(xí)方法,預(yù)測標(biāo)普500中的每只成分股的收益是否大于500只成分股收益的中位數(shù),并根據(jù)預(yù)測結(jié)果構(gòu)建可能盈利的投資組合。具體地,通過買入看漲概率值(即收益大于500只成分股中位數(shù)的概率)最大的k只股票,并做空概率值最小的k只股票,構(gòu)建多空投資組合。實(shí)證結(jié)果表明,這一基于預(yù)測的投資組合能夠獲得較高的期望收益。同時(shí),F(xiàn)ISCHER等[31]證明采用LSTM模型具有更高的預(yù)測準(zhǔn)確度,從而可以帶來更高的投資組合回報(bào)。HEATON等[38]采用棧式自編碼器來對股票未來的表現(xiàn)進(jìn)行預(yù)測。他們訓(xùn)練自編碼器以得到單只股票的編碼,根據(jù)股票與其編碼之間的范數(shù)差異大小,選擇多只股票構(gòu)建投資組合。實(shí)驗(yàn)表明,該方法構(gòu)建的投資組合能夠獲得比IBB指數(shù)更高的收益。MALANDRI等[39]提出了一種基于機(jī)器學(xué)習(xí)和情緒指標(biāo)的預(yù)測算法,用于構(gòu)建并調(diào)整在線投資組合策略。他們采用價(jià)量信息、社交媒體上的正負(fù)面評(píng)論數(shù)及變化率等7種指標(biāo)作為輸入,預(yù)測投資組合中的5支股票成為其中收益最高的股票的可能性,并將這些概率值歸一化之后作為每只股票的權(quán)重,以構(gòu)建投資組合。實(shí)驗(yàn)表明,增加了情緒指標(biāo)的預(yù)測模型能顯著提升在線投資組合策略的收益,而LSTM算法能提供比隨機(jī)森林和多層感知機(jī)更高的投資組合收益。HUANG等[40]應(yīng)用無監(jiān)督機(jī)器學(xué)習(xí)算法來學(xué)習(xí)股票的交易規(guī)則。無監(jiān)督機(jī)器學(xué)習(xí)算法是一類無需將特定問題的解作為訓(xùn)練數(shù)據(jù)的機(jī)器學(xué)習(xí)算法,其訓(xùn)練過程通常用來學(xué)習(xí)數(shù)據(jù)的內(nèi)在性質(zhì)和規(guī)律[41],再將其與特定問題聯(lián)系起來。該研究應(yīng)用雙聚類方法對技術(shù)指標(biāo)矩陣進(jìn)行聚類,挖掘出技術(shù)指標(biāo)矩陣的列常數(shù)型雙聚類作為交易規(guī)則,并將其分為買入、賣空、持有3種交易信號(hào);在樣本外測試中,采用k近鄰法(對應(yīng)于有監(jiān)督算法學(xué)習(xí)到的預(yù)測模型)確定測試樣本的交易信號(hào),并根據(jù)相應(yīng)的交易策略進(jìn)行交易。與有監(jiān)督機(jī)器學(xué)習(xí)方法不同,這一研究中學(xué)習(xí)交易規(guī)則的過程并不受歷史數(shù)據(jù)中資產(chǎn)價(jià)格的漲跌標(biāo)簽影響,從而在一定程度上避免了噪聲數(shù)據(jù)的影響。
(2)機(jī)器學(xué)習(xí)算法與經(jīng)典投資組合模型的結(jié)合除基于預(yù)測的投資組合優(yōu)化外,機(jī)器學(xué)習(xí)算法與經(jīng)典投資組合模型的結(jié)合也在引起研究者的關(guān)注。BAN等[42]采用正則化和交叉驗(yàn)證兩種機(jī)器學(xué)習(xí)中常用的優(yōu)化方法,對投資組合模型進(jìn)行優(yōu)化。正則化是機(jī)器學(xué)習(xí)中用于提升模型泛化性能的方法,通過在機(jī)器學(xué)習(xí)的損失函數(shù)中加入懲罰項(xiàng)來約束模型復(fù)雜度,從而避免機(jī)器學(xué)習(xí)模型的過擬合問題。該研究創(chuàng)新地將正則化方法用于降低投資組合中風(fēng)險(xiǎn)(方差)和收益(期望)的估計(jì)誤差,用以改善基于有限樣本的期望和方差估計(jì)。具體地,他們定義了一個(gè)基于模型性能的正則項(xiàng)(performance-based regularization,PBR),令該正則項(xiàng)小于一個(gè)給定的約束值,并將其作為投資組合優(yōu)化問題中的約束條件。而交叉驗(yàn)證則是機(jī)器學(xué)習(xí)中一種常用的超參數(shù)調(diào)試方法,在該研究中用于確定正則化約束項(xiàng)的約束值。實(shí)證研究表明,基于PBR的投資組合模型(均值-方差模型和均值-CVaR模型)比普通的樣本估計(jì)具有更高的年化夏普比率,也同樣優(yōu)于等權(quán)重投資組合和基于L1正則化、L2正則化(機(jī)器學(xué)習(xí)中常用的正則化方法)的模型。TSANG等[43]則用深度神經(jīng)網(wǎng)絡(luò)來解決多期投資組合優(yōu)化問題,并證明了這種方法的收斂性。具體地,該文獻(xiàn)用兩層神經(jīng)網(wǎng)絡(luò)作為模擬馬爾科夫決策過程中單次狀態(tài)轉(zhuǎn)移的子網(wǎng),多個(gè)子網(wǎng)疊加后即可用于模擬多期投資組合的決策過程。這一方法將神經(jīng)網(wǎng)絡(luò)的優(yōu)化過程與多期投資組合的決策產(chǎn)生過程聯(lián)系起來,能夠有效地求解多期投資組合優(yōu)化問題。XING等[44,45]則在Black-Litterman資產(chǎn)配置模型的基礎(chǔ)上應(yīng)用了機(jī)器學(xué)習(xí)算法。前者提出了一種可解釋的學(xué)習(xí)架構(gòu)來模擬生成市場觀點(diǎn),并將該市場觀點(diǎn)作為Black-Litterman模型中的投資者觀點(diǎn)變量,根據(jù)模型計(jì)算相應(yīng)的投資組合權(quán)重。具體地,他們訓(xùn)練神經(jīng)網(wǎng)絡(luò)(LSTM和動(dòng)態(tài)進(jìn)化神經(jīng)模糊推理系統(tǒng)),使其能夠在已知?dú)v史價(jià)格、成交量及市場情緒指數(shù)的情況下,盡可能地逼近最優(yōu)觀點(diǎn)(與未來實(shí)際收益最接近的觀點(diǎn)),這模擬了投資者在多期投資中的學(xué)習(xí)過程,提高了模型生成的投資組合權(quán)重的可解釋性。他們還將提出的模型與傳統(tǒng)的均值-方差模型及Value-Weighted(按市值分配權(quán)重,即大盤指數(shù))投資組合模型進(jìn)行了對比,發(fā)現(xiàn)包含情緒指數(shù)的市場觀點(diǎn)能夠顯著提升投資組合的表現(xiàn)。與單純的價(jià)格預(yù)測不同,這一工作將機(jī)器學(xué)習(xí)算法用于產(chǎn)生投資組合模型的先驗(yàn)信息,為機(jī)器學(xué)習(xí)在投資組合研究中的應(yīng)用提供了一個(gè)新的切入點(diǎn)。在XING等[44]的基礎(chǔ)上,XING等[45]應(yīng)用在線聚類算法改進(jìn)了生成投資者觀點(diǎn)的LSTM的性能,使得LSTM網(wǎng)絡(luò)的每次更新都能夠引入和過去信息的均值差別較大的信息(即非噪聲信息)。實(shí)驗(yàn)表明,該模型能夠獲得顯著高于等權(quán)重投資組合及基于時(shí)間序列預(yù)測模型的投資組合(ARIMA模型和Holt-Winters模型)的年化收益,而改進(jìn)的LSTM模型的表現(xiàn)也顯著優(yōu)于純LSTM模型。這一研究為處理輸入數(shù)據(jù)中的噪聲提供了成功的示例。
與資產(chǎn)價(jià)格預(yù)測不同,現(xiàn)有文獻(xiàn)將機(jī)器學(xué)習(xí)算法應(yīng)用于資產(chǎn)配置問題的形式更加多樣,缺乏固定的應(yīng)用框架。在基于資產(chǎn)價(jià)格預(yù)測的資產(chǎn)配置問題中,資產(chǎn)價(jià)格的預(yù)測內(nèi)容被進(jìn)一步擴(kuò)展,除直接預(yù)測單一資產(chǎn)的價(jià)格變動(dòng)趨勢或收益之外,投資組合中資產(chǎn)的相對收益也是重要的預(yù)測內(nèi)容之一。囿于資產(chǎn)價(jià)格預(yù)測所能提供的信息,現(xiàn)有文獻(xiàn)主要集中于根據(jù)預(yù)測結(jié)果選取股票并構(gòu)建等權(quán)重的投資組合,較少進(jìn)一步考慮投資組合中單個(gè)資產(chǎn)的權(quán)重優(yōu)化;但考慮到資產(chǎn)價(jià)格的預(yù)測準(zhǔn)確度遠(yuǎn)沒有達(dá)到精確的程度,權(quán)重的分配對于投資組合的收益而言尤為重要。對于這一問題,MALANDRI等[39]將概率值歸一化的方法提供了一個(gè)很好的示例,但這也僅僅是簡單地依據(jù)預(yù)測的概率值來做判斷。由此可見,如何根據(jù)資產(chǎn)價(jià)格預(yù)測結(jié)果來為投資組合分配合理的權(quán)重,應(yīng)當(dāng)是這一類研究需要深入探討的問題。而在將機(jī)器學(xué)習(xí)算法與經(jīng)典投資組合模型結(jié)合的研究中,機(jī)器學(xué)習(xí)不僅被用來直接生成投資組合策略,還為經(jīng)典投資組合模型的實(shí)證研究提供方法借鑒或所需變量。其中,BAN等[42]的研究嚴(yán)格意義上來說是對機(jī)器學(xué)習(xí)算法思想的一種借鑒,而非直接利用機(jī)器學(xué)習(xí)算法來解決相關(guān)問題。但這一研究反而為這一交叉領(lǐng)域的研究提供了新的思路,即借鑒機(jī)器學(xué)習(xí)算法中的優(yōu)化思想來解決經(jīng)典投資組合實(shí)證研究中的優(yōu)化求解問題。
從文獻(xiàn)梳理中不難看出,在資產(chǎn)價(jià)格預(yù)測問題中,機(jī)器學(xué)習(xí)的應(yīng)用大部分遵循其一般流程。通常,與未來資產(chǎn)價(jià)格變動(dòng)相關(guān)的數(shù)據(jù)(特征)被作為機(jī)器學(xué)習(xí)算法的輸入,經(jīng)過訓(xùn)練后,產(chǎn)生相應(yīng)的預(yù)測模型,用于根據(jù)新的數(shù)據(jù)進(jìn)行預(yù)測。有關(guān)資產(chǎn)配置的研究大都基于對未來資產(chǎn)價(jià)格的預(yù)測,預(yù)測的內(nèi)容從單一資產(chǎn)的價(jià)格變動(dòng)進(jìn)一步擴(kuò)展到投資組合中各個(gè)資產(chǎn)的相對變動(dòng)。除此之外,仍有部分文獻(xiàn)探討了應(yīng)用機(jī)器學(xué)習(xí)的其他方式。
對于應(yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)算法的研究而言,輸入特征往往是傳統(tǒng)研究中常用的結(jié)構(gòu)化數(shù)據(jù)。一方面,雖然傳統(tǒng)機(jī)器學(xué)習(xí)算法同樣能夠處理經(jīng)過特征提取的文本數(shù)據(jù),但一般都用于分析投資者情緒[24,25]并將其作為預(yù)測變量,很少直接用于資產(chǎn)價(jià)格預(yù)測,因此在本研究中未作深入討論;另一方面,傳統(tǒng)機(jī)器學(xué)習(xí)算法在自然語言處理任務(wù)中的性能,往往受限于自然語言本身的復(fù)雜性和歧義性,而深度學(xué)習(xí)算法從數(shù)據(jù)中提取特征的能力恰恰解決了這一問題[36],并在多個(gè)主要的自然語言處理任務(wù)中,表現(xiàn)出相對于傳統(tǒng)方法的顯著優(yōu)勢[46]。鑒于此,與上述機(jī)器學(xué)習(xí)算法的基本流程不同,已有文獻(xiàn)在應(yīng)用深度學(xué)習(xí)算法時(shí),也將非結(jié)構(gòu)化數(shù)據(jù)作為輸入以直接預(yù)測未來資產(chǎn)價(jià)格。另外,深度學(xué)習(xí)所用的數(shù)據(jù)往往被重新表示為特定形式后再作為輸入,以更好地發(fā)揮深度學(xué)習(xí)的性能[33,34]?,F(xiàn)有關(guān)于資產(chǎn)價(jià)格預(yù)測和配置的文獻(xiàn)中深度學(xué)習(xí)的一般應(yīng)用框架見圖2,其中,虛線框部分省略了深度學(xué)習(xí)的一般流程,如前文所述,深度學(xué)習(xí)的一般流程與圖1類似,但不含特征提取步驟,而是直接將其整合進(jìn)了訓(xùn)練過程中。
圖2 深度學(xué)習(xí)算法在資產(chǎn)價(jià)格預(yù)測與配置中的一般框架
如前文所述,機(jī)器學(xué)習(xí)是一類被用來分析和理解數(shù)據(jù)的算法;而在金融和經(jīng)濟(jì)領(lǐng)域中,資產(chǎn)價(jià)格預(yù)測和配置的相關(guān)文獻(xiàn),則更多地涉及到用于分析歷史數(shù)據(jù)的方法和實(shí)際應(yīng)用。這也就解釋了為什么機(jī)器學(xué)習(xí)首先被廣泛地應(yīng)用于這一具體研究課題中,也概括地體現(xiàn)了機(jī)器學(xué)習(xí)在這一課題的適用性。
從機(jī)器學(xué)習(xí)算法本身的角度來看,首先,機(jī)器學(xué)習(xí)的算法框架決定了其可以直接被應(yīng)用于“從數(shù)據(jù)中得出結(jié)論”這類問題,而無需限定該問題的具體應(yīng)用背景。資產(chǎn)價(jià)格預(yù)測和配置恰恰遵循這一模式:傳統(tǒng)實(shí)證研究中的資產(chǎn)價(jià)格預(yù)測與配置,正是從歷史數(shù)據(jù)中獲取與未來資產(chǎn)價(jià)格相關(guān)的信息以完成預(yù)測,并在準(zhǔn)確預(yù)測的基礎(chǔ)上構(gòu)建可盈利的資產(chǎn)配置策略。其次,具體到資產(chǎn)價(jià)格預(yù)測和配置研究中所使用的數(shù)據(jù),其在預(yù)測中的有效性已經(jīng)被傳統(tǒng)實(shí)證研究充分證明,這就為機(jī)器學(xué)習(xí)算法的應(yīng)用提供了可靠的輸入數(shù)據(jù)。尤其是對于傳統(tǒng)機(jī)器學(xué)習(xí)算法而言,研究者和實(shí)踐者們已經(jīng)基于原始金融數(shù)據(jù)構(gòu)建了多個(gè)與未來資產(chǎn)價(jià)格相關(guān)的指標(biāo),如技術(shù)分析指標(biāo)、公司基本面信息、宏觀經(jīng)濟(jì)指標(biāo)等,這些因素可直接作為機(jī)器學(xué)習(xí)的輸入特征,從而避免了額外的特征設(shè)計(jì)步驟。
從資產(chǎn)價(jià)格預(yù)測和配置這一具體研究課題來看,傳統(tǒng)的實(shí)證研究面臨的最主要問題是,如何更好地分析金融市場這一復(fù)雜的動(dòng)態(tài)系統(tǒng),而機(jī)器學(xué)習(xí)的引入則為這一問題帶來了新的思路。首先,相對于傳統(tǒng)的統(tǒng)計(jì)和計(jì)量方法,機(jī)器學(xué)習(xí)能夠更好地描述輸入變量與預(yù)測結(jié)果之間復(fù)雜的非線性關(guān)系。傳統(tǒng)的統(tǒng)計(jì)和計(jì)量方法一般通過一定的函數(shù)形式對數(shù)據(jù)進(jìn)行建模,這些單一形式的模型在面對變量關(guān)系更加多樣化的數(shù)據(jù)時(shí),往往表現(xiàn)出一定的不適性。反之,機(jī)器學(xué)習(xí)并不嚴(yán)格假設(shè)變量之間非線性關(guān)系的函數(shù)形式,而是通過一系列算法來描述變量之間的關(guān)系,這使得機(jī)器學(xué)習(xí)不僅能夠更準(zhǔn)確地?cái)M合變量之間的非線性關(guān)系,也能夠更好地處理多樣化的金融數(shù)據(jù)。其次,深度學(xué)習(xí)所具備的特征提取能力使其能夠更好地理解輸入數(shù)據(jù),從而更好地?cái)M合預(yù)測結(jié)果與輸入數(shù)據(jù)之間的關(guān)系。正如前文所言,深度學(xué)習(xí)提取的特征是從數(shù)據(jù)中學(xué)習(xí)得到的,在學(xué)習(xí)過程中,這些特征不斷逼近使其與預(yù)測結(jié)果相關(guān)性最高的形式,從而使預(yù)測的準(zhǔn)確度不斷提高。與人工設(shè)計(jì)的特征相比,來源于數(shù)據(jù)的特征往往能更客觀地反映出原始數(shù)據(jù)中與目標(biāo)任務(wù)相關(guān)的信息,這也是深度學(xué)習(xí)的關(guān)鍵優(yōu)勢[8]。
盡管從以上兩個(gè)角度論述了機(jī)器學(xué)習(xí)在資產(chǎn)價(jià)格預(yù)測與配置這一課題中的適用性,但不可否認(rèn)的是,機(jī)器學(xué)習(xí)算法仍有其局限性:①機(jī)器學(xué)習(xí)的“黑箱”性質(zhì)。不同于傳統(tǒng)的實(shí)證研究和金融實(shí)踐,機(jī)器學(xué)習(xí)的內(nèi)在邏輯是依靠特定的算法來使計(jì)算機(jī)自行理解輸入數(shù)據(jù)與輸出結(jié)論之間的相關(guān)關(guān)系,這一理解并非建立在金融理論的基礎(chǔ)上,因而很難從邏輯上描述其輸出與輸入數(shù)據(jù)的相關(guān)關(guān)系。這一問題在深度學(xué)習(xí)中表現(xiàn)得尤為明顯。傳統(tǒng)機(jī)器學(xué)習(xí)中所需的輸入特征與輸出數(shù)據(jù)尚可能具備直觀認(rèn)知上的聯(lián)系,如公司的基本面信息反映的公司經(jīng)營狀況能夠指示公司未來業(yè)績,進(jìn)而指示其未來股票的價(jià)格變動(dòng)趨勢;而深度學(xué)習(xí)中的高層次抽象特征往往由深度神經(jīng)網(wǎng)絡(luò)經(jīng)過多層計(jì)算習(xí)得,原始數(shù)據(jù)和習(xí)得特征之間很難從邏輯上產(chǎn)生聯(lián)系。事實(shí)上,深度學(xué)習(xí)的可解釋性也一直是該領(lǐng)域本身的難點(diǎn)問題之一。對于資產(chǎn)價(jià)格預(yù)測與配置這一具體問題而言,機(jī)器學(xué)習(xí)的應(yīng)用雖然能提升預(yù)測的準(zhǔn)確性和資產(chǎn)配置策略的收益,但其黑箱性質(zhì)也限制了應(yīng)用機(jī)器學(xué)習(xí)的研究在相關(guān)金融理論上進(jìn)一步深入的可能。②機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)性質(zhì)是一把雙刃劍。雖然這一性質(zhì)使得具備豐富數(shù)據(jù)積累的研究領(lǐng)域能夠較好地引入這一算法,但這一性質(zhì)也決定了機(jī)器學(xué)習(xí)算法對訓(xùn)練數(shù)據(jù)的依賴性[47]。機(jī)器學(xué)習(xí)研究中有一個(gè)共識(shí),即數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個(gè)上限,因此,高質(zhì)量的數(shù)據(jù)對于充分發(fā)揮機(jī)器學(xué)習(xí)的性能至關(guān)重要。已有文獻(xiàn)中所采用的數(shù)據(jù)及其輸入形式都或多或少地存在一定的局限性。一方面,應(yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)算法的研究中,將用于傳統(tǒng)研究中的已有指標(biāo)作為輸入特征并非最優(yōu)解。以技術(shù)分析指標(biāo)為例,將其作為輸入特征的機(jī)器學(xué)習(xí)算法所能達(dá)到的預(yù)測性能,可能不及經(jīng)驗(yàn)豐富的金融從業(yè)人員基于技術(shù)指標(biāo)作出的判斷;也就是說,已有的指標(biāo)可能在傳統(tǒng)實(shí)證研究的框架中更能發(fā)揮其作用,而并不適合機(jī)器學(xué)習(xí)。PATEL等[14]的研究即證明了這一點(diǎn):將利用技術(shù)分析方法預(yù)測出的未來價(jià)格趨勢作為機(jī)器學(xué)習(xí)算法的輸入特征,其預(yù)測準(zhǔn)確度高于將技術(shù)分析指標(biāo)直接作為機(jī)器學(xué)習(xí)的輸入特征。事實(shí)上,特征的選取在機(jī)器學(xué)習(xí)領(lǐng)域本身就是一個(gè)關(guān)鍵的研究問題,也因此局限了其在跨學(xué)科領(lǐng)域的應(yīng)用。另一方面,深度學(xué)習(xí)優(yōu)越的特征提取能力不僅需要大量優(yōu)質(zhì)數(shù)據(jù),也需要數(shù)據(jù)形式與算法結(jié)構(gòu)相匹配。這也是為什么SEZER等[33]與DING等[34]需要將數(shù)據(jù)處理為特定形式后再應(yīng)用深度學(xué)習(xí)算法。如何組織金融數(shù)據(jù)以充分發(fā)揮深度學(xué)習(xí)的優(yōu)越性能,是將深度學(xué)習(xí)進(jìn)一步應(yīng)用于資產(chǎn)價(jià)格預(yù)測與配置研究時(shí)所要克服的難點(diǎn),這需要研究者對深度學(xué)習(xí)算法和金融市場數(shù)據(jù)特性有更充分的認(rèn)識(shí)。
在對文獻(xiàn)進(jìn)行綜述與討論的基礎(chǔ)上,針對現(xiàn)有研究存在的局限,本研究認(rèn)為這一交叉領(lǐng)域未來的研究可從以下幾個(gè)方面著手。
(1)參數(shù)選擇在早期基于機(jī)器學(xué)習(xí)的資產(chǎn)價(jià)格預(yù)測中,參數(shù)選擇是相關(guān)文獻(xiàn)中被提及最多的一個(gè)研究方向[10,11,17,19],也得到了充分的后續(xù)研究[20,23,26]。但現(xiàn)有文獻(xiàn)對于參數(shù)選擇問題的研究主要集中于啟發(fā)式算法[20,23],其有效性無法從理論角度得到解釋;僅有極個(gè)別文獻(xiàn)從理論角度出發(fā),探討如何利用參數(shù)的概率性質(zhì)來選取最優(yōu)參數(shù)[26]。由此,除應(yīng)用更多被證明有效的優(yōu)化算法之外,從理論角度出發(fā)的參數(shù)選擇是一個(gè)更需要被深入研究的問題,這有賴于機(jī)器學(xué)習(xí)這一領(lǐng)域本身相關(guān)研究的進(jìn)展。
(2)采用準(zhǔn)確度更高的機(jī)器學(xué)習(xí)算法(2)一般來說,準(zhǔn)確度更高的機(jī)器學(xué)習(xí)算法通常以更高的計(jì)算復(fù)雜度為代價(jià)。但對于資產(chǎn)價(jià)格預(yù)測與配置而言,除高頻交易以外,大部分機(jī)器學(xué)習(xí)算法的計(jì)算復(fù)雜度都不足以對其在這一場景中的應(yīng)用產(chǎn)生大的影響,因此,追求單一的準(zhǔn)確度提升是可行的。SERMPINIS等[27]認(rèn)為更復(fù)雜的算法可能提升預(yù)測準(zhǔn)確度,YU等[20]的研究也證明了改進(jìn)的算法在預(yù)測準(zhǔn)確度這一維度上優(yōu)于原始算法。事實(shí)上,隨著機(jī)器學(xué)習(xí)的發(fā)展,越來越多的算法將會(huì)被用于資產(chǎn)價(jià)格預(yù)測與配置這一領(lǐng)域,但應(yīng)當(dāng)注意到每種算法的準(zhǔn)確度可能受到輸入數(shù)據(jù)的某些特性的影響。在選擇算法時(shí),充分考慮其在資產(chǎn)價(jià)格預(yù)測問題中的適用性,仍然至關(guān)重要。
(3)多種算法的結(jié)合多篇文獻(xiàn)研究并探討了多種算法的結(jié)合方式及其對算法性能的提升[18,19,28,30],但最優(yōu)的結(jié)合方式及權(quán)重分配尚未達(dá)到統(tǒng)一結(jié)論,因此,對多種算法結(jié)合方式的比較研究,可能是提升資產(chǎn)價(jià)格預(yù)測與配置模型性能的關(guān)鍵。
(1)對于特征選擇的進(jìn)一步探討盡管多個(gè)研究證明了特征選擇算法的有效性[11,13,17,21],但對于各種特征選擇算法的全面比較仍較為缺乏。TSAI等[21]認(rèn)為,從實(shí)際角度來看,很難對所有現(xiàn)有的特征選擇方法進(jìn)行全面研究,但從中選出最具代表性的方法來進(jìn)行比較研究,可以被視為未來的研究方向之一。此外,雖然深度學(xué)習(xí)的特征表示能力能夠在一定程度上替代傳統(tǒng)的手工特征,但手工特征在幫助研究者理解影響市場變動(dòng)的因素和促進(jìn)相關(guān)理論發(fā)展中仍具有重要作用,特征選擇仍然是未來這一領(lǐng)域需要進(jìn)一步研究的問題,而與相關(guān)金融理論的結(jié)合無疑是一個(gè)很好的切入點(diǎn)。
(2)多時(shí)間間隔數(shù)據(jù)的應(yīng)用KRAUS等[36]與WANG等[30]均提到了多時(shí)間間隔數(shù)據(jù)在未來研究中的重要性,而PAN等[22]和HUANG等[40]也證明了多時(shí)間間隔的數(shù)據(jù)在提升預(yù)測性能中的有效性。然而,這些研究都僅停留在定性分析的層面,未能從根本上指出不同時(shí)間間隔的數(shù)據(jù)在多大程度上與未來資產(chǎn)價(jià)格的變動(dòng)相關(guān)。一個(gè)可能的研究方向是DENG等[35]指出的智能選擇方法,利用機(jī)器學(xué)算法學(xué)習(xí)到與未來資產(chǎn)價(jià)格變動(dòng)趨勢相關(guān)的數(shù)據(jù)采樣時(shí)間間隔。此外,從金融理論的角度出發(fā),探討不同時(shí)間間隔的數(shù)據(jù)如何影響未來資產(chǎn)價(jià)格變動(dòng),也是一個(gè)可能的研究方向;而這也與特征選擇問題相互聯(lián)系。
(1)考慮金融市場的現(xiàn)實(shí)因素多篇文獻(xiàn)指出,現(xiàn)有關(guān)于資產(chǎn)價(jià)格預(yù)測與配置的研究較少考慮金融市場的現(xiàn)實(shí)因素,如市場摩擦[39,44]、交易成本[16,44]及資產(chǎn)的流動(dòng)性[44]等問題;KRAUSS等[28]也表明,機(jī)器學(xué)習(xí)算法的普及程度可能影響基于機(jī)器學(xué)習(xí)的資產(chǎn)價(jià)格預(yù)測與配置模型的性能。部分文獻(xiàn)在實(shí)證分析中考慮了交易成本[31],但其他可能影響實(shí)際資產(chǎn)交易的因素尚未被充分研究。將這些現(xiàn)實(shí)因素納入這一領(lǐng)域未來的研究應(yīng)當(dāng)是一個(gè)重要的方向。
(2)基于金融理論的機(jī)器學(xué)習(xí)“黑箱”探究考慮到機(jī)器學(xué)習(xí)的“黑箱”性質(zhì),在基于機(jī)器學(xué)習(xí)的資產(chǎn)價(jià)格預(yù)測與配置中,模型的可解釋性一直是研究者比較關(guān)心的問題[48],但僅有部分文獻(xiàn)從機(jī)器學(xué)習(xí)算法的角度對此進(jìn)行探討,比如,通過觀察輸入特征的權(quán)重來探究“黑箱”的運(yùn)行機(jī)制[28],或觀察機(jī)器學(xué)習(xí)得到的結(jié)果與已有金融理論的聯(lián)系[31]。可以預(yù)見到,隨著這一交叉領(lǐng)域研究的深入,模型的可解釋性將會(huì)被賦予更重要的意義,除機(jī)器學(xué)習(xí)算法研究本身的發(fā)展之外,從金融理論角度出發(fā)對模型進(jìn)行解釋應(yīng)當(dāng)是一個(gè)較為可行的研究方向。
(1)應(yīng)用機(jī)器學(xué)習(xí)算法預(yù)測多個(gè)資產(chǎn)的價(jià)格現(xiàn)有關(guān)于資產(chǎn)價(jià)格預(yù)測的研究大都僅適用于單個(gè)資產(chǎn),對多個(gè)資產(chǎn)的價(jià)格預(yù)測與配置的適用性尚需進(jìn)一步的檢驗(yàn)[15,35]。FISCHER等[31]與MALANDRI等[39]從數(shù)據(jù)標(biāo)簽設(shè)計(jì)的角度提供了可行的思路,但可能的研究方向不止于此。例如,與預(yù)測單個(gè)資產(chǎn)不同,資產(chǎn)之間的相關(guān)性可能影響多個(gè)資產(chǎn)預(yù)測的準(zhǔn)確性,這是進(jìn)一步研究需要解決的問題。另外,如何利用機(jī)器學(xué)習(xí)算法直接從歷史數(shù)據(jù)中學(xué)習(xí)到最優(yōu)的資產(chǎn)配置策略,也是資產(chǎn)配置研究中一個(gè)重要的方向。DENG等[35]提出的深度強(qiáng)化學(xué)習(xí)框架可能是這一問題的一個(gè)切入點(diǎn)。
(2)機(jī)器學(xué)習(xí)算法與經(jīng)典投資組合模型的結(jié)合BAN等[42]和XING等[44,45]為機(jī)器學(xué)習(xí)算法在經(jīng)典投資組合模型中的應(yīng)用提供了兩個(gè)截然不同的成功范例。從以上文獻(xiàn)的角度出發(fā),未來機(jī)器學(xué)習(xí)算法可能從兩個(gè)角度應(yīng)用于資產(chǎn)配置問題:①將機(jī)器學(xué)習(xí)算法本身包含的優(yōu)化思想與經(jīng)典投資組合模型相結(jié)合,探索模型的改進(jìn)或是求解方法的優(yōu)化;②利用機(jī)器學(xué)習(xí)算法處理市場數(shù)據(jù),生成經(jīng)典投資組合模型中需要的統(tǒng)計(jì)數(shù)據(jù),為其實(shí)證研究提供幫助。對于后者而言,利用機(jī)器學(xué)習(xí)來度量資產(chǎn)的風(fēng)險(xiǎn)因素是一個(gè)可行的研究方向,這是經(jīng)典投資組合模型中關(guān)注而現(xiàn)有文獻(xiàn)中很少涉及到的。實(shí)際上,機(jī)器學(xué)習(xí)算法同樣已被用于風(fēng)險(xiǎn)預(yù)測研究[49]。
通過梳理將機(jī)器學(xué)習(xí)應(yīng)用于資產(chǎn)價(jià)格預(yù)測與配置問題的相關(guān)文獻(xiàn),本研究總結(jié)了機(jī)器學(xué)習(xí)在該領(lǐng)域的應(yīng)用現(xiàn)狀,包括常用的數(shù)據(jù)與算法、一般的應(yīng)用框架,以及機(jī)器學(xué)習(xí)在分析這一問題時(shí)的適用性與局限性。在此基礎(chǔ)上,從算法、數(shù)據(jù)及具體應(yīng)用問題3個(gè)角度出發(fā),進(jìn)一步探討和分析了應(yīng)用機(jī)器學(xué)習(xí)來進(jìn)行資產(chǎn)預(yù)測與配置研究的未來方向。
總體來講,機(jī)器學(xué)習(xí)在資產(chǎn)價(jià)格預(yù)測與配置研究中表現(xiàn)出良好的適用性,進(jìn)一步豐富和拓展了這一課題的實(shí)證研究。與傳統(tǒng)研究相比,基于機(jī)器學(xué)習(xí)算法的資產(chǎn)價(jià)格預(yù)測與配置至少具有如下特點(diǎn):①研究中所采用的數(shù)據(jù)體量更大、來源更加豐富、形式更加多樣。與經(jīng)典的計(jì)量方法相比,機(jī)器學(xué)習(xí)算法表現(xiàn)出更優(yōu)越的數(shù)據(jù)分析能力,并且能夠更好地從非結(jié)構(gòu)化數(shù)據(jù)中提取信息,如社交媒體、財(cái)經(jīng)新聞等傳統(tǒng)方法難以處理的金融文本數(shù)據(jù)。這使得資產(chǎn)價(jià)格預(yù)測與配置方面的研究能夠更加充分地利用相關(guān)的市場信息,從傳統(tǒng)研究未能涉及的數(shù)據(jù)中挖掘與市場變動(dòng)相關(guān)的變量,進(jìn)而獲得更準(zhǔn)確的資產(chǎn)價(jià)格預(yù)測和更優(yōu)的資產(chǎn)配置。同時(shí),數(shù)據(jù)的多樣性也對有效數(shù)據(jù)的篩選提出了更高的要求,為相關(guān)的實(shí)證研究帶來了新的挑戰(zhàn)。②相關(guān)研究的發(fā)展與計(jì)算機(jī)領(lǐng)域具有更加緊密的聯(lián)系。機(jī)器學(xué)習(xí)算法的應(yīng)用為資產(chǎn)將預(yù)測與配置這一課題的發(fā)展引入了來自計(jì)算機(jī)科學(xué)的思路和方法。一方面,性能更優(yōu)的機(jī)器學(xué)習(xí)算法不僅提高了資產(chǎn)價(jià)格預(yù)測的準(zhǔn)確性,也為資產(chǎn)配置研究提供了更多可能的優(yōu)化算法;但另一方面,機(jī)器學(xué)習(xí)算法的“黑箱”性質(zhì)使得其在具體問題中的應(yīng)用往往很難具有可解釋性,因而相關(guān)研究往往重實(shí)證而輕理論,更多地強(qiáng)調(diào)方法的有效性而非邏輯上的合理性。在機(jī)器學(xué)習(xí)算法本身的優(yōu)化研究到達(dá)瓶頸之后,這一問題的存在可能會(huì)限制相關(guān)研究的進(jìn)一步發(fā)展。由此可見,如何更加有效地將機(jī)器學(xué)習(xí)算法與相關(guān)的金融理論和實(shí)證研究結(jié)合起來,是這一領(lǐng)域需要進(jìn)一步解決的關(guān)鍵問題,也是推動(dòng)機(jī)器學(xué)習(xí)在其他金融領(lǐng)域進(jìn)一步應(yīng)用的重要步驟。