張明武 張迪
【摘要】為降低對我國股市的影響,本次研究對中國股市數(shù)據(jù)的準備工作實行概述,并對互聯(lián)網(wǎng)財經(jīng)新聞對中國股市的影響進行研究,現(xiàn)進行具體闡述如下:
【關(guān)鍵詞】互聯(lián)網(wǎng);財經(jīng)新聞;中國股市;影響
當前,我國處于經(jīng)濟轉(zhuǎn)型階段。趨于信息化時代下,人們對于資訊的實效性、時間要求和需求越來越高。股票中的任何消息,均會對股市構(gòu)成直接的影響。為此,應合理使用文本挖掘藝術(shù)、向量回歸方法,做好財經(jīng)新聞量化工作,以便降低對股市構(gòu)成的波動影響。然后,采用多元回歸分析方式,對互聯(lián)網(wǎng)財經(jīng)新聞信息,對我國股市的影響情況加以深入分析,進而明確互聯(lián)網(wǎng)財經(jīng)新聞的信息,以及互聯(lián)網(wǎng)財經(jīng)新聞在股價中對股票市場的影響。
一、中國股市數(shù)據(jù)的準備工作
(一)公司新聞交易數(shù)據(jù)情況
一般情況下,股票交易數(shù)據(jù)均來源于銳思金融研究數(shù)據(jù)庫。研究的時間為2015年lO月~2015年12月,選取信息行業(yè),以每日為單位實行具體分析。通過SVR方式,對新聞、股票每日的收益情況,經(jīng)回歸模型方式表現(xiàn)。對完成訓練的回歸模型分析量化新聞,并對股票每日的收益狀況影響情況加以合理分析,以此通過影響因子評判多元回歸模型,明確新聞對股市的影響、影響程度、影響時間等。
(二)公司新聞數(shù)據(jù)情況
以滬深上市的信息行業(yè)互聯(lián)網(wǎng)財經(jīng)新聞,對于股市的影響進行分析,這一互聯(lián)網(wǎng)財經(jīng)新聞的影響力較大。所以,可實行專項研發(fā)網(wǎng)頁,合理的選擇訊網(wǎng)和新浪網(wǎng),將比較有影響力的互聯(lián)網(wǎng)作為新聞源,對信息行業(yè)上市公司新聞文本情況進行深入、準確的解析。然后,對不同新聞源進行去重處理,以便獲得相對完善、專業(yè)的互聯(lián)網(wǎng)財經(jīng)新聞數(shù)據(jù)庫,防止產(chǎn)生相同新聞源情況。本次研究,選取2015年10月~12月的新聞,共12250條,去除發(fā)布前、后2天的缺失股票交易數(shù)據(jù)新聞,剩余新聞數(shù)量為320條,而每日選取的新聞約為2800條。針對于此,本文對2800條新聞實行訓練集,實行模型預測這一階段每條新聞報道,觀察對于股票收益的影響。
二、互聯(lián)網(wǎng)財經(jīng)新聞對中國股市的影響研究
財經(jīng)新聞中,存在較多的股市信息,這些信息會對股市構(gòu)成直接的影響。為此,應將量化結(jié)果作為股市收益影響因子,有效融合股市相關(guān)技術(shù)指標,以此通過計量模型對新聞在股市中的作用實行客觀分析,明確時限問題、影響強度問題。經(jīng)文本挖掘技術(shù),量化財經(jīng)新聞對于股市的影響。經(jīng)計量模型多元化回歸分析中的,變量因素實行分析,進而獲得資本資產(chǎn)定價模型。然后,使用計量模型不同檢驗方式,對新聞對于股市的影響、影響力度、影響時間等情況,加以綜合分析。新聞的文本,屬于沒有結(jié)構(gòu)的數(shù)據(jù)文本,可通過量化對股市構(gòu)成直接的影響。經(jīng)文本——量化方式轉(zhuǎn)變,能夠促使沒有結(jié)構(gòu)的文本,向有結(jié)構(gòu)加以轉(zhuǎn)變。向量中的不同元素值,均通過TF-IDF方法計算,元素值的大小會直接影響到新聞文本情況。為此,在文本——量化的階段,新聞文本數(shù)據(jù)逐漸轉(zhuǎn)變?yōu)榇嬖诮Y(jié)構(gòu)的向量文本。
經(jīng)文本對滬深新聞實行分析,會直接危及到股市狀況。為此,-所涉及的新聞文本應為中文,需切實做好新聞文本中文分詞工作。經(jīng)JE分詞方式,對分詞詞匯進行搜索,以確保分詞的效果和準確性。因為特征詞會對股市運行情況構(gòu)成影響,所以在特征詞匯文本量化之上,通過文本量化加權(quán)方式處理,合理使用TF-IDF方法,計算出不同特征的詞匯,旨在明確不同詞匯在各文本中的比重,明確股市的變化規(guī)律。文本實行量化后,易于出現(xiàn)較多的同義詞,如:猛增和激增??赏ㄟ^同義詞降維的方式處理,在文本量化階段將相同詞匯視為一個詞,實行權(quán)值計算,以便降低相同緯度的向量維數(shù),保證結(jié)果更加真實、準確,以及回歸模型的準確性。
SVR,屬于機器學習的算法,主要經(jīng)最小化風險函數(shù)上限,控制網(wǎng)絡風險問題,從而達到SLT和加強統(tǒng)計學習的效率目的。經(jīng)SVR算法,構(gòu)建新聞和股票累計收益回歸模型。明確回歸模型輸入、輸出情況,輸入的內(nèi)容為新聞文本的量化情況,輸出的內(nèi)容為每日股票的收益狀況。以每日作為單位,將股市交易作為基準,每日股市交易關(guān)閉前O.5小時、閉市后發(fā)布新聞,累積當日股市交易的數(shù)據(jù),將此作為當日的新聞數(shù)據(jù)。SVR模型輸入,和股票收益向量存在緊密聯(lián)系,因此可將兩者作為SVR輸出。通過訓練SVR模型,做好SVR回歸模型的預測工作,從而降低對股票收益的不良影響。
CAMP,屬于資本市場理論、投資理論下所形成。證券市場中的資產(chǎn)預期收益計算,即為CAPM模型的應用范疇。CAPM模型中,主要涉及的內(nèi)容包括:日收益率、無風險利率、同期銀行間同業(yè)拆解利率、股市組合收益率。分別經(jīng)滬市上市公司所使用的上證指數(shù)、深市上市公司采用深成指表示。經(jīng)小二乘法,計算窗內(nèi)的已知變量情況。然后,經(jīng)出式中的系數(shù)β表示,明確新聞事件觀察時間為半年。再對事件窗內(nèi)無風險利率、股市利率,以及B值情況進行分析,明確預期股市收益情況、收益率。在定性新聞量化結(jié)果、股市定量指標基礎(chǔ)上,構(gòu)建多元回歸模型,經(jīng)經(jīng)濟學方法計算出新聞對股市的影響,準確掌握新聞指標、公司國模、公司總股數(shù)、股票換手率、股票價格比等信息。
三、結(jié)語
當前,各行業(yè)均獲得較好的發(fā)展,促使新聞媒體業(yè)也獲得良好發(fā)展,其對于股票市場的影響較大。為此,應將新聞文本和股票定量指標相結(jié)合,以確保股市信息的對稱。與此同時,需參照相關(guān)信息實行分析,充分考慮到股市公司的證券狀態(tài),以便明確股市的類型、信息來源,找到證券市場波動的規(guī)律,降低對我國股市構(gòu)成的不良影響。
參考文獻:
[1]劉海飛,許金濤.互聯(lián)網(wǎng)異質(zhì)性財經(jīng)新聞對股市的影響——來自中國互聯(lián)網(wǎng)數(shù)據(jù)與上市公司的證據(jù)[J].產(chǎn)業(yè)經(jīng)濟研究,2017(1):76—88
[2]石勇,唐靜,郭琨.社交媒體投資者關(guān)注、投資者情緒對中國股票市場的影響[J].中央財經(jīng)大學學報,2017(7):45-53
[3]曹霆.淺談互聯(lián)網(wǎng)對房地產(chǎn)經(jīng)濟的影響[J].中國國際財經(jīng)(中英文),2017(2):128—129