• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于隨機森林方法的投資者概念關(guān)注對概念指數(shù)收益預(yù)測及交易策略的研究

    2021-01-16 02:56:55扈文秀蘇振興楊櫟
    預(yù)測 2021年1期
    關(guān)鍵詞:隨機森林

    扈文秀 蘇振興 楊櫟

    摘 要:概念炒作一直是股票價格波動的重要驅(qū)動因素之一,本文基于投資者關(guān)注視角探究投資者概念關(guān)注對概念指數(shù)波動的預(yù)測作用。使用百度搜索指數(shù)的非結(jié)構(gòu)化數(shù)據(jù)測度投資者概念關(guān)注,利用隨機森林方法構(gòu)建預(yù)測模型,驗證市場交易指標和投資者概念關(guān)注對概念指數(shù)收益和超額收益漲跌的預(yù)測作用,并根據(jù)預(yù)測結(jié)果設(shè)計交易策略。結(jié)果發(fā)現(xiàn)市場交易指標對概念指數(shù)收益漲跌有較好的預(yù)測作用,投資者概念關(guān)注則對概念指數(shù)超額收益漲跌有較好的預(yù)測作用,根據(jù)預(yù)測結(jié)果設(shè)計的交易策略可以獲得正向的超額收益。本文彌補了前人關(guān)于投資者概念關(guān)注預(yù)測作用研究的空白,也為投資者制定交易策略提供一定的理論參考。

    關(guān)鍵詞:投資者概念關(guān)注;概念指數(shù)收益;隨機森林;交易策略

    中圖分類號:F832.5文獻標識碼:A文章編號:1003-5192(2021)01-0060-07doi:10.11847/fj.40.1.60

    Abstract:The concept speculation has always been one of the main reasons of stock price fluctuation. From the perspective of investor attention, this paper explores the prediction effect of investor attention to the concept index on the fluctuation of concept index. The unstructured data of BSI (Baidu Search Index) is used to measure the investor attention to the concept index, and the Random Forest Algorithm is used to build a prediction model, to verify the prediction effect of market trading indicators and the investor attention to the concept index on the return and abnormal return of concept index. Then, design investment strategies according to the prediction results. The results show that the market trading indicators have a good prediction effect on the return of concept index, and the investor attention to the concept index has a good prediction effect on the abnormal return of concept index, and the investment strategies can get positive abnormal returns. This paper fills in the gap of the existed research on the prediction effect of investor attention to the concept index and provides some academic reference for investors to making investment strategies.

    Key words:investor attention to the concept index; return of concept index; random forest algorithm; investment strategy

    1 引言

    在中國證券市場,“概念”板塊炒作已經(jīng)成為股票價格波動的重要推手之一。近年來“科創(chuàng)板”、“5G”、“一帶一路”、“互聯(lián)網(wǎng)+”等概念層出不窮,吸引了大量投資者關(guān)注,助推股票價格大幅上漲。投資者關(guān)注是投資者為降低投資不確定性從而主動獲取投資信息的認知行為,在一定程度上反應(yīng)了投資者的預(yù)期[1],所以利用投資者關(guān)注預(yù)測股票價格波動在理論上具有一定的可行性[2]。Da等[3]首次將股票簡稱在Google搜索引擎的搜索量作為投資者關(guān)注的代理變量,解決了投資者關(guān)注不可觀測性、不可獲得性和時效性等問題,使得利用投資關(guān)注預(yù)測證券市場成為可能,為投資者識別證券市場盈利機會、獲取超額收益提供新的思路。

    隨著大數(shù)據(jù)在金融領(lǐng)域的廣泛應(yīng)用,大量實證研究以搜索引擎的非結(jié)構(gòu)化數(shù)據(jù)作為投資者關(guān)注的代理變量,對證券市場進行了有效的預(yù)測。這些研究主要從兩個層面展開,其一是利用投資者對宏觀證券市場中特定關(guān)鍵詞的關(guān)注來構(gòu)建和測量市場領(lǐng)先指標[4]、投資者情緒[5,6]以及市場風(fēng)險[7]等變量,進而對證券市場指數(shù)以及市場風(fēng)險進行預(yù)測;其二是利用微觀層面的投資者個股關(guān)注對股票價格、收益率以及波動率等因素進行預(yù)測[3,8]。但是中觀層面的投資者概念關(guān)注卻鮮有人研究,王宇哲和趙靜[9]將PM2.5和霧霾的百度搜索量作為投資者對“霧霾”關(guān)注度的代理變量引入研究,研究發(fā)現(xiàn)投資者對PM2.5和霧霾的關(guān)注度越高,污染治理類股票收益越高,滯后一期的公眾霧霾關(guān)注度對霧霾治理概念股收益率有顯著的正向影響。楊濤和郭萌萌[10]也以PM2.5概念為例進行研究,發(fā)現(xiàn)投資者對PM2.5和霧霾的關(guān)注會正向影響PM2.5概念股的收益率。這些文獻為研究投資者概念關(guān)注提供了有益的探索,但是也存在一些局限性。一方面僅以PM2.5概念板塊的股票為樣本進行研究,存在樣本選取誤差,研究結(jié)果可能不具有普適性;另一方面也未有研究考慮投資者概念關(guān)注是否對概念指數(shù)收益以及超額收益漲跌具有預(yù)測作用。現(xiàn)有文獻在研究投資者關(guān)注對股票收益預(yù)測作用時,大多采用Granger因果關(guān)系檢驗[1]、VAR模型[9]、GARCH模型[11]以及線性回歸分析方法[1,3,6~10,12]等傳統(tǒng)計量模型進行實證研究,也有學(xué)者使用機器學(xué)習(xí)方法中的SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測股票市場收益[13]。由于投資者關(guān)注的劇烈變化會導(dǎo)致其分布呈現(xiàn)出尖峰厚尾、波動集群的統(tǒng)計特征,所以投資者關(guān)注與市場表現(xiàn)之間存在非線性復(fù)雜關(guān)系,使用傳統(tǒng)回歸分析難以構(gòu)建有效的金融預(yù)測模型[14]。而機器學(xué)習(xí)方法不需要嚴格假設(shè)和充足先驗條件為前提假定的,可以有效規(guī)避這一統(tǒng)計分布缺陷,刻畫變量間的非線性關(guān)系,所以本研究選擇機器學(xué)習(xí)方法中的隨機森林方法(Random Forests Algorithm,RFA)作為預(yù)測模型。該方法是一種包含多個決策樹的分類和預(yù)測模型,適用于存在大量未知特征的數(shù)據(jù),可以有效解決數(shù)據(jù)不符合正態(tài)分布的問題,當數(shù)據(jù)存在大量噪音時,也可以取得很好的預(yù)測性能,且不必擔心過度擬合問題[15,16]。

    基于此,本文將中觀層面的投資者概念關(guān)注引入預(yù)測模型,采用隨機森林方法對概念指數(shù)收益和超額收益漲跌進行預(yù)測,并根據(jù)預(yù)測結(jié)果構(gòu)建交易策略。與以往文獻相比,本文的貢獻在于:(1)補充了中觀層面的投資者概念關(guān)注對概念指數(shù)收益和超額收益預(yù)測研究的空白,豐富了投資者關(guān)注的理論研究和實證研究。(2)隨機森林方法作為非參數(shù)分類預(yù)測方法,可以有效克服投資者概念關(guān)注的統(tǒng)計分布缺陷,提高投資者概念關(guān)注極端變化以及股票收益極端變化情況下的預(yù)測準確性。(3)依據(jù)投資者概念關(guān)注的預(yù)測結(jié)果構(gòu)建交易策略,為投資者的投資決策提供理論參考。

    2 理論分析

    目前學(xué)術(shù)界尚未對股票市場中的“概念”進行統(tǒng)一的定義,本文引用股票市場板塊的定義對“概念”進行闡述?!案拍睢笔侵笇︱?qū)動某一類股票價格波動要素的概括,也是投資者基于該要素形成的一種更為積極、含義更為肯定、具有持續(xù)性的投資共識。投資者概念關(guān)注是指投資者對該要素及其相關(guān)信息的關(guān)注行為,本質(zhì)是投資者對信息的關(guān)注。本文以信息搜尋理論[17](search theory)、分類思考[18](ctegory-learning/thinking)以及投資者有限關(guān)注[19]為理論基礎(chǔ)論述投資者概念關(guān)注對概念指數(shù)波動的影響作用。

    信息搜尋理論認為,信息搜尋可以降低投資決策的不確定性,從而獲得超額收益,但是信息搜尋具有成本,其中投資者注意力的有限性是搜索成本的重要因素之一[17,20]。因此為了使注意力這一稀缺資源獲得最大收益,會促使投資者采用分類思考的方式處理信息,即較少關(guān)注股票的特質(zhì)信息,而是將更多注意力分配給市場信息、行業(yè)信息或者板塊信息,利用市場、行業(yè)或板塊的信息來指導(dǎo)其投資決策[18]。Huang[21]利用個人投資者的交易數(shù)據(jù)實證研究發(fā)現(xiàn),投資者在某一特定行業(yè)的成功投資經(jīng)歷會增加隨后購買同一行業(yè)股票的可能性,即投資者會采用分類思考的方式作出投資決策。Barberis和Shleifer[22]研究也發(fā)現(xiàn)投資者存在按行業(yè)等類別對股票進行分類從而簡化投資決策的行為特征。故說明投資者對分類要素信息的關(guān)注會影響投資決策,即投資者概念關(guān)注會影響該概念板塊股票價格的波動。

    投資者概念關(guān)注作為一種認知行為,必然會受到投資者注意力有限性的約束[23],只能有選擇地關(guān)注某些信息,而忽略其它事物的信息,即有限關(guān)注[19]。所以當投資者準備買入股票時,需要在數(shù)以千計股票中進行選擇,只能關(guān)注引起自己注意的部分股票,并將這些股票視作潛在的投資目標。但是當投資者準備賣出股票時,由于賣空限制,投資者僅可以賣出自己所持有的股票,所以注意力不受約束。這種注意力約束對買賣決策的非對稱影響勢必導(dǎo)致投資者成為其關(guān)注股票的凈買入者,從而在短期內(nèi)帶來凈買入資金,對股票價格形成上漲壓力,所以投資者的關(guān)注行為表達了一定程度的買入預(yù)期[24]。投資者信念的偏差性會導(dǎo)致投資者選擇關(guān)注與自己觀念相一致的信息,拒絕接受與自己觀念相沖突的信息,所以投資者概念關(guān)注也是其投資偏好和預(yù)期的體現(xiàn)[25]。“概念”是投資者形成的一種積極投資共識[10],所以當投資者概念關(guān)注增加,表示這種積極投資共識的擴大,從而導(dǎo)致買入資金的增加,推動股票價格上漲。因此本文認為投資者概念關(guān)注可以有效地預(yù)測概念指數(shù)的波動。

    3 變量設(shè)計與研究方法

    3.1 研究變量與數(shù)據(jù)來源

    本文選擇三個概念板塊的概念指數(shù)進行實證研究,分別是基于產(chǎn)業(yè)技術(shù)發(fā)展驅(qū)動的5G板塊,基于公眾關(guān)注驅(qū)動的PM2.5板塊以及基于國家政策驅(qū)動的一帶一路板塊,這三個板塊具有典型的中國證券市場概念板塊特征,且是目前證券市場投資者較為認可和追捧的熱點板塊。三個概念板塊的時間跨度分別以該概念板塊指數(shù)首次收入WIND數(shù)據(jù)庫為基準日期,故5G概念的基準日期為2016年1月4日,PM2.5概念的基準日期為2013年5月2日,一帶一路概念的基準日期為2014年10月9日,期末日期均為2018年11月29日。

    本研究假設(shè)以每個概念板塊中的所有股票建立投資組合,每只股票投資金額的權(quán)重為構(gòu)建概念指數(shù)的權(quán)重,以概念指數(shù)作為投資組合的價格。采用前置一期的概念指數(shù)收益和超額收益漲跌為被預(yù)測變量。借鑒王宇哲和趙靜[9]的量化方法測量投資者概念關(guān)注(ICA),將“5G”、“PM2.5+霧霾”和“一帶一路”為關(guān)鍵詞的百度搜索量分別作為投資者5G概念關(guān)注、PM2.5概念關(guān)注和一帶一路概念關(guān)注的代理變量。借鑒俞慶進和張兵[26]測度滬深300指數(shù)投資者關(guān)注度的方法,將個股證券簡稱作為關(guān)鍵詞的百度搜索量作為投資者個股關(guān)注,按照股票所屬的概念板塊進行等權(quán)求和,從而得到投資者概念板塊關(guān)注(ISA)。

    市場交易變量的設(shè)計參照戴德寶等[13]的研究,在構(gòu)建預(yù)測模型時,考慮到指數(shù)收益和超額收益均具有自相關(guān)性,所以將當期的概念指數(shù)收益和超額收益加入預(yù)測模型。將概念指數(shù)市場交易指標開盤點位、最高點位、最低點位、振幅、成交額和成交量也納入研究,還引入滬深300指數(shù)的收盤點位作為市場影響因素加入預(yù)測模型。投資者關(guān)注的數(shù)據(jù)來自于百度搜索指數(shù),利用Python 3.7構(gòu)建的網(wǎng)絡(luò)爬蟲代碼抓取這些數(shù)據(jù),股票市場的交易數(shù)據(jù)均來自于WIND數(shù)據(jù)庫。

    概念指數(shù)收益和超額收益的計算方法借鑒Burrowes和Jones[27]的方法。

    3.2 隨機森林方法

    隨機森林方法[15]是一種基于統(tǒng)計抽樣理論(Bootstrap)的數(shù)據(jù)挖掘分類算法,有隨機森林回歸和隨機森林分類兩種方法,本研究使用隨機森林分類。隨機森林分類建模的基本思想是利用Bootstrap方法從原始樣本中有放回地隨機抽取N個子樣本,對每一個子樣本進行決策樹建模,最后根據(jù)N個決策樹模型的預(yù)測結(jié)果,使用多數(shù)投票法決定隨機森林的分類結(jié)果,即

    其中H(x)表示最終分類結(jié)果,hi(x)表示每個子樣本i的決策樹分類結(jié)果,Y表示被預(yù)測變量,I(·)表示示性函數(shù),若hi(x)=Y,則I(·)=1,否則I(·)=0。(5)式表示隨機森林方法使用多數(shù)投票決策的方式來確定最終的分類[28]。

    隨機森林方法的核心是決策樹模型,該模型是一種非參數(shù)分類方法,也是一種有監(jiān)督的分類方法。決策樹模型會根據(jù)每個樣本確定的分類屬性訓(xùn)練出一個分類器,其中節(jié)點分裂是該模型的核心步驟,通過節(jié)點分裂才能產(chǎn)生一棵完整的決策樹。每棵樹分支的生成,都是按照某種分裂規(guī)則選擇屬性,這些規(guī)則主要包括信息增益最大、信息增益率最大和Gini系數(shù)最小等,不同的規(guī)則對應(yīng)不同的分裂算法。在節(jié)點分裂時,將每個屬性的所有劃分按照規(guī)則指標進行排序,然后按照規(guī)則選擇某個屬性作為分裂屬性,并按照其劃分實現(xiàn)決策樹的分支生長。通過理論和實證研究都證明了隨機森林具有很高的預(yù)測準確率,對異常值和噪聲具有很好的容忍度。

    4 實證研究

    本研究的實證分析主要由三部分構(gòu)成,首先是對數(shù)據(jù)進行預(yù)處理,由于變量概念指數(shù)收益率(RIT)、超額收益率(AIR)、開盤點位變動率(DOpen)、最高點位變動率(DHigh)、最低點位變動率(DLow)、振幅變動率(DTa)、成交額變動率(DVol)、成交量變動率(DVot)和滬深300指數(shù)收盤點位變動率(DMR)之間具有相關(guān)性,為了避免“維數(shù)災(zāi)難”,所以對變量進行主成分分析(Principal Component Analysis)。其次是將預(yù)測變量進行組合,構(gòu)建不同的預(yù)測模型,設(shè)置隨機森林預(yù)測模型的相關(guān)參數(shù)并訓(xùn)練預(yù)測模型,根據(jù)預(yù)測模型對預(yù)測集數(shù)據(jù)進行預(yù)測并計算準確率。最后根據(jù)預(yù)測結(jié)果構(gòu)建交易策略,驗證預(yù)測模型的實踐效果。

    利用SPSS 21對RIT、AIR、DOpen、DHigh、DLow、DTa、DVol、DVot和DMR 9個變量進行主成分分析。結(jié)果顯示5G概念、PM2.5概念和一帶一路概念的KMO值均大于0.6,Bartlett’s球狀檢驗在1%的顯著水平下顯著,說明適合做主成分分析。最終每個概念均提取了三個因子,提取的累計方差5G概念為85.57%、PM2.5概念為83.33%、一帶一路概念為85.72%,說明提取的三個因子可以保留9個初始變量大部分信息,最終根據(jù)每個因子的方差權(quán)重計算市場交易變量(MTV)。

    4.1 隨機森林模型參數(shù)設(shè)置與預(yù)測結(jié)果

    為了驗證三個預(yù)測變量市場交易變量(MTV)、投資者概念板塊關(guān)注變動率(DISA)和投資者概念關(guān)注變動率(DICA)及其組合對DRIT和DAIR預(yù)測的準確率,本研究共設(shè)計了7個預(yù)測模型,不同模型的預(yù)測變量如表2。使用Python 3.7中的隨機森林算法對模型進行預(yù)測,所以需要對預(yù)測模型的相關(guān)參數(shù)進行設(shè)置。根據(jù)一般預(yù)測模型的要求,將樣本劃分為訓(xùn)練數(shù)據(jù)集與預(yù)測數(shù)據(jù)集,比例為7∶3,訓(xùn)練數(shù)據(jù)集為概念指數(shù)交易周期內(nèi)的前70%的數(shù)據(jù),預(yù)測數(shù)據(jù)集為概念指數(shù)交易周期內(nèi)后30%的數(shù)據(jù)。隨機森林方法需要設(shè)置:兩個重要參數(shù)決策樹的數(shù)量ntree和內(nèi)部節(jié)點輸入變量mtry的個數(shù),根據(jù)前人研究和實驗經(jīng)驗,設(shè)置決策樹ntree為500,內(nèi)部節(jié)點輸入變量mtry為3[16,28],預(yù)測結(jié)果如表2。

    根據(jù)表2,模型1對三個概念指數(shù)的DRIT預(yù)測準確率分別為52.05%,53.12%,50.66%,均高于其他模型的準確率,說明MTV可以較好地預(yù)測DRIT。模型3對三個概念指數(shù)的DAIR預(yù)測準確率分別為53.88%,50.03%,52.67%,高于其他模型,說明DICA對DAIR有較好的預(yù)測能力。模型2對DAIR和DRIT的預(yù)測能力均較弱,說明DISA對概念指數(shù)的DAIR和DRIT預(yù)測作用不佳。為了進一步探究預(yù)測模型的預(yù)測作用,根據(jù)預(yù)測模型1和模型3的結(jié)果分別構(gòu)建交易策略。

    4.2 交易策略構(gòu)建

    交易策略設(shè)計的核心是根據(jù)預(yù)測的收益率漲跌設(shè)計交易機制,并計算累計收益和累計超額收益,從而驗證預(yù)測模型的有效性。根據(jù)隨機森林算法的預(yù)測結(jié)果,模型1的市場交易指標可以較好地預(yù)測概念指數(shù)收益,模型3的投資者概念關(guān)注可以更好地預(yù)測概念指數(shù)的超額收益,故根據(jù)前文的模型1和模型3預(yù)測結(jié)果設(shè)計買入和賣出信號。若預(yù)測結(jié)果DRITi,t+1=1,則買入投資組合;若DRITi,t+1=0,則賣出投資組合。同理,若預(yù)測結(jié)果DAIRi,t+1=1,則買入投資組合;若DAIRi,t+1=0,則賣出投資組合。

    為簡化起見,在計算該交易策略的累計收益和累計超額收益時,做出如下假設(shè)和約束:交易成本為ETF指數(shù)的交易費用,單邊費用為0.025%;假設(shè)交易存在賣空限制;設(shè)定交易價格為概念指數(shù)的收盤點位;設(shè)定每次每個概念板塊的投資金額均為100萬元。最終交易機制是:以基期開始計算,投資者在概念板塊i第一次出現(xiàn)買入信號之前一直空倉,當出現(xiàn)買入信號后買入概念板塊i構(gòu)建的投資組合,并持有至賣出信號出現(xiàn)的交易日,在該交易日清倉概念板塊i的投資組合,期間如果出現(xiàn)買入信號不追加倉位。同理,清倉概念板塊i的投資組合后,在第一個出現(xiàn)的買入信號時,買入概念板塊i的投資組合,期間如果出現(xiàn)賣出信號則不進行任何操作。如此循環(huán)往復(fù)進行投資,根據(jù)交易策略獲取每日收益,計算概念板塊i投資組合的累計收益和累計超額收益。為了比較交易策略的有效性,同時構(gòu)建長期持有交易策略,該策略的交易機制是:以期初的價格買入概念板塊i構(gòu)建的投資組合,持有至期末清倉概念板塊i構(gòu)建的投資組合,持有期不進行交易,故沒有交易費用。

    根據(jù)表3,在三個概念中,PM 2.5的交易周期最長,獲取的收益也最多,利用預(yù)測模型構(gòu)建的交易策略的期末累計RIT相較于長期持有交易策略會多獲取48.6萬元的收益,年化收益為25.61%,多獲取40.08萬元的AIR,年化收益為21.12%。使用5G概念樣本進行預(yù)測時,預(yù)測模型構(gòu)建的交易策略的期末累計RIT相較于長期持有交易策略會多獲取17.42萬元的收益,年化收益為19.82%,多獲取4.73萬元的AIR,年化收益為5.29%。使用一帶一路概念樣本進行預(yù)測時,預(yù)測模型構(gòu)建的交易策略會多獲取11.24萬元的RIT和4.79萬元的AIR,年化收益分別為9.11%和3.89%。說明預(yù)測模型交易策略的期末累計RIT和AIR均高于長期持有交易策略期末累計的RIT和AIR,所以根據(jù)預(yù)測模型構(gòu)建的交易策略可以獲取超額的收益,進一步說明了預(yù)測模型的有效性。且在三個概念樣本中均成立,說明預(yù)測模型具有較好的魯棒性。

    根據(jù)圖1,在交易周期內(nèi),5G概念和PM 2.5概念預(yù)測模型交易策略的累計RIT基本均在0軸之上,說明相較于長期持有策略,預(yù)測模型構(gòu)建的交易策略更有效。但是在一帶一路概念樣本中,預(yù)測模型交易策略的累計RIT卻在部分交易日期內(nèi)低于長期持有交易策略的累計RIT,說明交易指標對DRIT有一定的預(yù)測作用,但是在不同的概念板塊中卻存在差異。根據(jù)圖2,發(fā)現(xiàn)投資者概念關(guān)注變動率對DAIR具有預(yù)測作用,但是在不同的概念板塊中同樣存在差異。

    根據(jù)對概念板塊的分析發(fā)現(xiàn),一方面是由于5G概念和PM 2.5概念板塊的股票多以低市值、高市盈率的為主,這些股票價格的波動幅度較大,容易受到市場消息的驅(qū)動。但是一帶一路概念板塊的股票大多以高市值、低市盈率的股票居多,股票價格的波動幅度較低,股票價格主要受公司盈利能力的影響較多,因此通過市場交易指標或投資者概念關(guān)注來預(yù)測一帶一路概念指數(shù)波動的效果較差。另一方面PM 2.5概念是基于公眾關(guān)注驅(qū)動的板塊,空氣污染的變化會影響公眾對PM 2.5關(guān)注度的變化,而空氣污染具有一定的漸變性和周期性,投資者對PM 2.5概念的關(guān)注也具有一定的漸變性和周期性,所以概念指數(shù)的波動也具有一定的漸變性,導(dǎo)致投資者概念關(guān)注預(yù)測作用增強;而5G概念和一帶一路概念是基于信息沖擊驅(qū)動的板塊,具有一定的突發(fā)性,所以信息會迅速被股票價格吸收,導(dǎo)致預(yù)測作用下降。故相對于PM 2.5概念,投資概念關(guān)注對5G概念和一帶一路概念指數(shù)超額收益的預(yù)測作用較弱。

    5 結(jié)論與啟示

    5.1 研究結(jié)論

    本文以信息搜尋理論、分類思考以及投資者有限關(guān)注為理論基礎(chǔ),論述投資者概念關(guān)注對股票價格波動的影響作用。基于百度搜索指數(shù)的非結(jié)構(gòu)化數(shù)據(jù)測度投資者概念關(guān)注,并利用隨機森林算法驗證了7個預(yù)測模型對概念指數(shù)收益和超額收益漲跌的預(yù)測作用,根據(jù)預(yù)測結(jié)果設(shè)計交易策略。研究發(fā)現(xiàn):市場交易指標對概念指數(shù)收益的漲跌有較好的預(yù)測能力,投資者概念關(guān)注則對概念指數(shù)超額收益的漲跌有較好的預(yù)測能力,而基于投資者個股關(guān)注計算得到的投資者概念板塊關(guān)注對概念指數(shù)的收益和超額收益漲跌的預(yù)測結(jié)果均不理想。根據(jù)隨機森林方法預(yù)測結(jié)果設(shè)計的交易策略會獲得高于長期持有交易策略的超額收益,其中PM 2.5概念超額收益的年化回報率達到了21.12%,5G概念的年化超額收益為5.29%,一帶一路概念的年化超額收益為3.89%,可以看出概念板塊之間的年化超額收益有較大的差異性,本文根據(jù)概念板塊股票的構(gòu)成和概念指數(shù)的驅(qū)動因素探究了該差異的原因。

    5.2 理論貢獻與實踐啟示

    通過系統(tǒng)的文獻評述、理論分析和實證研究,本研究的主要理論貢獻有:(1)利用信息搜尋理論、分類思考以及投資者有限關(guān)注論述中觀層面的投資者概念關(guān)注對概念指數(shù)收益和超額收益的預(yù)測作用,彌補了前人研究的空白。(2)以百度搜索指數(shù)的非結(jié)構(gòu)化數(shù)據(jù)為數(shù)據(jù)源,采用大數(shù)據(jù)分析方法中的隨機森林方法展開實證研究,拓展了隨機森林方法在金融領(lǐng)域的應(yīng)用。(3)依據(jù)預(yù)測模型結(jié)果構(gòu)建的交易策略可以獲得正向的超額回報,為投資者制定交易策略提供新的路徑。

    本研究得到如下實踐啟示和建議。對于監(jiān)管部門而言:(1)應(yīng)深入挖掘、捕捉和監(jiān)測投資者網(wǎng)絡(luò)搜索數(shù)據(jù),改進股票市場監(jiān)管的技術(shù)手段,抑制股票市場的概念炒作現(xiàn)象,也可以利用大數(shù)據(jù)技術(shù)提高金融市場系統(tǒng)性風(fēng)險預(yù)警的先導(dǎo)性和準確性,促進金融市場健康發(fā)展。(2)成立大數(shù)據(jù)分析部門,積極收集投資者的聲音和挖掘投資者的需求,助力上市公司研判市場趨勢,實現(xiàn)精準投融資決策。(3)完善數(shù)據(jù)保護、監(jiān)管與共享機制,制定相關(guān)法律法規(guī),防止大數(shù)據(jù)平臺利用數(shù)據(jù)優(yōu)勢攫取超額收益,同時應(yīng)該鼓勵互聯(lián)網(wǎng)的共享思維,提高數(shù)據(jù)共享水平,促進金融領(lǐng)域的大數(shù)據(jù)技術(shù)快速發(fā)展。對于投資者而言:(1)可以利用投資者概念關(guān)注數(shù)據(jù)預(yù)測股票收益并制定相應(yīng)的投資策略。(2)應(yīng)該提升自身的投資知識水平,學(xué)習(xí)大數(shù)據(jù)技術(shù),通過大數(shù)據(jù)技術(shù)來汲取經(jīng)驗,預(yù)判未來,理性決策。(3)應(yīng)該樹立價值投資理念,擯棄概念炒作的思維。

    5.3 研究局限與展望

    首先,由于本研究側(cè)重于研究投資者概念關(guān)注對概念指數(shù)收益和超額收益的預(yù)測作用,所以缺乏對其作用機理的實證研究。其次,本研究選擇了三個具有代表性的概念板塊進行預(yù)測研究,但是股票市場存在較多的概念板塊,可能存在一定的樣本選取誤差,未來的研究可以對概念指數(shù)進行全樣本研究,提高預(yù)測模型的普適性。最后,在構(gòu)建概念指數(shù)收益和超額收益預(yù)測模型時,未將投資者情緒加入模型,未來研究可以將投資者情緒納入預(yù)測模型,提高預(yù)測模型的精準度。

    參 考 文 獻:

    [1]張誼浩,李元,蘇中鋒,等.網(wǎng)絡(luò)搜索能預(yù)測股票市場嗎[J].金融研究,2014,(2):193-206.

    [2]李倩,吳昊.大數(shù)據(jù)背景下投資者行為研究的趨勢分析:基于“內(nèi)涵-思路-方法”的三重視角[J].中央財經(jīng)大學(xué)學(xué)報,2017,(2):52-62.

    [3]Da Z, Engelberg J, Gao P. In search of attention[J]. Journal of Finance, 2011, 66(5): 1461-1499.

    [4]Vozlyublennaia Nadia. Investor attention, index performance, and return predictability[J]. Journal of Banking & Finance, 2014, 41: 17-35.

    [5]Takeda F, Wakao T. Google search intensity and its relationship with returns and trading volume of Japanese stocks[J]. Pacific-Basin Finance Journal, 2014, 27: 1-18.

    [6]胡昌生,陶鑄.個體投資者情緒、網(wǎng)絡(luò)自媒體效應(yīng)與股票收益[J].預(yù)測,2017,36(3):50-55.

    [7]曾建光.網(wǎng)絡(luò)安全風(fēng)險感知與互聯(lián)網(wǎng)金融的資產(chǎn)定價[J].經(jīng)濟研究,2015,(7):131-145.

    [8]趙龍凱,陸子昱,王致遠.眾里尋“股”千百度——股票收益率與百度搜索量關(guān)系的實證探究[J].金融研究,2013,(4):183-195.

    [9]王宇哲,趙靜.“用錢投票”:公眾環(huán)境關(guān)注度對不同產(chǎn)業(yè)資產(chǎn)價格的影響[J].管理世界,2018,(9):46-57.

    [10]楊濤,郭萌萌.投資者關(guān)注度與股票市場——以PM 2.5概念股為例[J].金融研究,2019,(5):190-206.

    [11]Afkhami M, Cormack L, Ghoddusi H. Google search keywords that best predict energy price volatility[J]. Energy Economics, 2017, 67: 17-27.

    [12]白麗娟,閆相斌,金家華.基于搜索關(guān)鍵詞關(guān)注度的商品房價格指數(shù)預(yù)測[J].預(yù)測,2015,34(5):65-70.

    [13]戴德寶,蘭玉森,范體軍,等.基于文本挖掘和機器學(xué)習(xí)的股指預(yù)測與決策研究[J].中國軟科學(xué),2019,(4):166-174.

    [14]Fan X, Yuan Y, Zhuang X. Long memory of abnormal investor attention and the cross-correlations between abnormal investor attention and trading volume, volatility respectively[J]. Physica A: Statistical Mechanics and Its Applications, 2017, 469: 323-333.

    [15]Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

    [16]李娜,李秀婷,魏云捷,等.財政支出的社會經(jīng)濟效應(yīng)——基于面板隨機森林的分析與優(yōu)化[J].管理評論,2018,30(10):258-269.

    [17]Stigler G J, Stigler S M, Friedland C. The economics of information[J]. Journal of Political Economy, 1961, 69(3): 213-225.

    [18]Peng L, Xiong W. Investor attention, overconfidence and category learning[J]. Journal of Financial Economics, 2006, 80(3): 563-602.

    [19]Hirshleifer D, Teoh S H. Limited attention, information disclosure, and financial reporting[J]. Journal of Accounting and Economics, 2003, 36(1-3): 337-386.

    [20]Smith G E. Diagnosing the search cost effect: waiting time and the moderating impact of prior category knowledge[J]. Journal of Economic Psychology, 1999, 20(3): 285-314.

    [21]Huang X. Mark Twain’s cat: investment experience, categorical thinking, and stock selection[J]. Journal of Financial Economics, 2019, 131(2): 404-432.

    [22]Barberis N, Shleifer A. Style investing[J]. Journal of Financial Economics, 2003, 68(2): 161-199.

    [23]Kahneman D. Attention and effort[M]. Prentice-Hall, 1973. 75-76.

    [24]Barber B M, Odean T. All that glitters: the effect of attention and news on the buying behavior of individual and institutional investors[J]. Review of Financial Studies, 2008, 21(2): 785-818.

    [25]Engelberg J, Sasseville C, Williams J. Market madness? The case of mad money[J]. Management Science, 2012, 58(2): 351-364.

    [26]俞慶進,張兵.投資者有限關(guān)注與股票收益——以百度指數(shù)作為關(guān)注度的一項實證研究[J].金融研究,2012,(8):152-165.

    [27]Burrowes A, Jones K. Initial public offerings: evidence from the UK[J]. Managerial Finance, 2004, 30(1): 46-62.

    [28]方匡南,吳見彬,朱建平,等.信貸信息不對稱下的信用卡信用風(fēng)險研究[J].經(jīng)濟研究,2010,(S1):97-107.

    猜你喜歡
    隨機森林
    隨機森林算法在中藥指紋圖譜中的應(yīng)用:以不同品牌夏桑菊顆粒指紋圖譜分析為例
    基于隨機森林的登革熱時空擴散影響因子等級體系挖掘
    基于隨機森林的HTTP異常檢測
    個人信用評分模型比較數(shù)據(jù)挖掘分析
    時代金融(2017年6期)2017-03-25 22:21:13
    隨機森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
    基于二次隨機森林的不平衡數(shù)據(jù)分類算法
    軟件(2016年7期)2017-02-07 15:54:01
    拱壩變形監(jiān)測預(yù)報的隨機森林模型及應(yīng)用
    基于隨機森林算法的飛機發(fā)動機故障診斷方法的研究
    基于奇異熵和隨機森林的人臉識別
    軟件(2016年2期)2016-04-08 02:06:21
    基于隨機森林算法的B2B客戶分級系統(tǒng)的設(shè)計
    阿拉善盟| 大田县| 滕州市| 江津市| 昌平区| 安溪县| 永兴县| 工布江达县| 金门县| 恩施市| 且末县| 稻城县| 合作市| 祁东县| 凤山市| 沙田区| 泾川县| 师宗县| 县级市| 枣强县| 温泉县| 普兰县| 绵竹市| 安仁县| 湘潭县| 洛阳市| 金堂县| 黔南| 东乡族自治县| 玉屏| 和龙市| 壶关县| 西林县| 寻乌县| 布尔津县| 翁源县| 台州市| 久治县| 汪清县| 昆山市| 灌云县|