范國亮
(晉中職業(yè)技術學院,山西 晉中 030600)
由于大數(shù)據(jù)技術的普及,許多金融機構的投資者開始采取該項技術來幫助其開展證券投資活動,并處理其中可能出現(xiàn)的各種問題。大數(shù)據(jù)分析可以幫助投資者針對股市中存在的海量數(shù)據(jù)進行分析,同時依靠整理互聯(lián)網(wǎng)中的各種相關信息來評估當前市場中的投資情況,以此來掌握當前的市場動向,并以此為基礎開展投資決策。同時,大數(shù)據(jù)分析技術可以針對股票的結構化與非結構化數(shù)據(jù)開展精確分析,從而進行更科學、更精確的量化投資,實現(xiàn)收益率的有效提升。
目前,我國學術界并未針對大數(shù)據(jù)提出一個明確的界定,但其具有的以下特征受到廣泛認同,也就是容量大(Volume)、多樣性(Variety)、速度快(Velocity)及真假難辨(Veracity)。首先是容量龐大,這也是大數(shù)據(jù)最為重要的一個特點。容量過大導致傳統(tǒng)的數(shù)據(jù)存儲、管理及搜索方式無法滿足該技術實際運用過程中的需求,為此必須形成一套更靈活并易于擴展的數(shù)據(jù)存儲與管理方案。其次是多樣性。在當前時代,數(shù)據(jù)存在著許多不同的表現(xiàn)形式,其中包括圖像、文字及音頻等諸多類型。采取傳統(tǒng)的檢驗與分析方式來針對這些數(shù)據(jù)進行探討,可能會導致數(shù)據(jù)分析的效率低下,無法保持相對較高的數(shù)據(jù)利用率。再次是速度快。傳統(tǒng)的計算機設備不具備實時處理大量不同格式數(shù)據(jù)的能力,為此需采用更先進的技術來進行數(shù)據(jù)分析。大數(shù)據(jù)基礎設施的運用有助于人們更靈活便捷地開展數(shù)據(jù)管理工作,同時還能針對許多不同格式的數(shù)據(jù)進行實時探析。最后是真假難辨。尤其是一些來源于社交媒體中的數(shù)據(jù),其真實性往往無法得到充分的保障,這也給大數(shù)據(jù)分析技術的運用帶來更多困難。
大數(shù)據(jù)分析指的是對互聯(lián)網(wǎng)中產生的大量數(shù)據(jù)進行分析,以此來尋找出能為決策提供幫助的有用信息。大數(shù)據(jù)分析主要采取信息網(wǎng)絡技術對人們交易過程中形成的大量數(shù)據(jù)信息進行搜集與整合,之后再采取相應的大數(shù)據(jù)分析模型對這些數(shù)據(jù)進行探究,從而尋找出其中蘊含的規(guī)律。大數(shù)據(jù)分析技術的基礎在于從信息網(wǎng)絡等數(shù)據(jù)源中搜集的各種結構化和非結構化數(shù)據(jù),并把這些數(shù)據(jù)存儲到處理器中。利用信息技術來對其進行研究,依靠相應的算法模型來進行關聯(lián)分析,以此查找出其中存在的價值。使用大數(shù)據(jù)分析技術的主要目標在于找出數(shù)據(jù)中存在的價值。
股票分析主要涵蓋了以下兩個方面內容,分別為基本面分析與技術分析。
2.1.1 基本面分析
在廣義層面上,基本面分析主要指以供求關系理論為基礎,通過對各種經濟數(shù)據(jù)與政治環(huán)境進行分析來探究金融市場的發(fā)展態(tài)勢。而在狹義層面上,基本面分析需要把微觀經濟狀況作為研究的對象,其中涵蓋的要素主要有產品競爭力、行業(yè)發(fā)展狀況及管理者的專業(yè)素養(yǎng)等。在進行大數(shù)據(jù)分析的過程中,需要采取相關算法,依據(jù)投資者的實際需求來查找出能夠滿足其需求的股票,幫助其進行投資。
2.1.2 技術分析
技術分析主要指依靠分析市場行為的方式來評估市場運行的發(fā)展趨勢,并在充分理解了市場運行趨勢周期性變化的基礎之上進行證券投資相關的決策。技術分析理論認為市場行為具有一定的重復性,因此如果市場屬于有效市場,則在股票市場中發(fā)生的大部分事件都曾經在以往發(fā)生過。以人工神經網(wǎng)絡算法技術為基礎的股票技術分析,需要依靠輸入預測樣本和設定目標變量等方式來進行分析,并在此基礎上將預測取得的結果和實際值進行對照,最后依靠構建擬合方程的手段來了解預測值與實際之間的差異性和關聯(lián)性,以此來為投資決策提供有益的參考。
在廣義層面上,投資情緒的內容涵蓋各種可以使投資者對證券的估值與市場預期造成影響的因素。而在狹義層面上,投資情緒分析著重探討經濟變量和其他因素。對于券商和其他參與到證券投資活動的投資者而言,如何針對投資情緒進行準確的評估是極為困難的事情,而針對投資情緒開展準確的量化分析,對于證券市場研究的發(fā)展具有極為重要的積極作用。
在進行投資情緒分析的過程中,需要收集人們在各種社交網(wǎng)絡平臺中發(fā)表的信息,并在這些復雜的信息中篩選出具有良好價值的信息,從而將非結構化的文本信息向著結構化的方向進行轉化,以此來取得投資者情緒測評指標。此外,還需要運用情感分析引擎來取得投資情緒分析的結果,最終在海量的數(shù)據(jù)信息中提取出更多有價值的內容,這也是大數(shù)據(jù)分析在證券投資活動中的主要優(yōu)勢。
量化投資的內容主要是指針對金融市場和產品信息開展量化分析,并依據(jù)歷史交易數(shù)據(jù)的內容來進行模型的構建,以此來做出科學的證券投資決策,以便完成交易活動。大數(shù)據(jù)分析的過程需采用各種類型的分析工具,其中包括人工智能技術、數(shù)據(jù)挖掘等。這些分析工具的使用有助于讓金融投資活動向著智能化和高頻化的方向發(fā)展。依據(jù)數(shù)據(jù)結構的差異,筆者將大數(shù)據(jù)分析技術區(qū)分成結構化與非結構化數(shù)據(jù),其中前者的使用范圍相對較廣。
在進行量化投資時,結構化數(shù)據(jù)應用集中于人們無法利用的極為短暫的市場變化。舉例而言,證券在買入與賣出之間價格發(fā)生的變化便屬于結構化數(shù)據(jù)。高頻交易具有頻率較高且交易量較大等特性,因此計算機需要針對不同種類的結構化數(shù)據(jù)進行分析。雖然這類數(shù)據(jù)的收益率較少,但也具有穩(wěn)定性強的優(yōu)越性。在量化投資領域,非結構化數(shù)據(jù)并未得到廣泛的運用,許多學者與從業(yè)者都在對其開展深入研究。這類數(shù)據(jù)能夠幫助企業(yè)取得更多有用的信息,從而給其帶來高額的收益。為此,許多企業(yè)都為其提供高額的投資。
大數(shù)據(jù)技術在使用過程中必然會引發(fā)數(shù)據(jù)安全方面的問題。大數(shù)據(jù)具有較高的價值,所以受到了黑客的重視,他們往往會選擇冒著風險展開攻擊。歷史上曾經發(fā)生多次黑客攻擊引發(fā)的信息泄露事件。例如,雅虎公司曾經因為受到了黑客的攻擊,使得約有10 億用戶的個人信息泄露,其中涵蓋姓名、性別、聯(lián)系方式、居住地址及登錄密碼等內容。此外,我國也曾經出現(xiàn)過各種類型的隱私泄露事件,這些事件均在社會上引發(fā)了強烈的反響。除了黑客活動可能產生的用戶隱私風險,企業(yè)員工盜竊數(shù)據(jù)所產生的風險也需要得到充分的重視。2017 年,我國一些互聯(lián)網(wǎng)企業(yè)的員工便竊取了超過50 億條用戶信息進行販賣。這些問題的普遍存在使得大數(shù)據(jù)安全問題受到人們的關注。若個人的隱私受到泄露,必然會導致用戶受到騷擾,甚至可能導致用戶與其親友遭遇詐騙,最終給其帶來嚴重的損失。同時,人們在大數(shù)據(jù)發(fā)展的過程中面臨的威脅還包括大數(shù)據(jù)技術對人們的行為與狀態(tài)的預測。由于各種信息技術取得突破性發(fā)展,互聯(lián)網(wǎng)企業(yè)可以依靠對用戶行為進行建模與分析等方式來探究用戶的行為規(guī)律,甚至一些用戶不愿被他人察覺的隱藏屬性也可能被推測出來,這對用戶的個人隱私造成了一定的侵害。例如,通過對用戶在微博上發(fā)表的言論和網(wǎng)購記錄進行分析,便可以準確地推測出其政治傾向和消費習慣等。同時,還可以通過隱馬爾可夫模型來針對用戶出行的目的地進行推測,若這些信息被不法分子掌握,便可能對用戶的人身財產安全構成嚴重的威脅。
時至今日,我國依然沒有開發(fā)出能在所有場合實現(xiàn)針對性應用的大數(shù)據(jù)分析軟件,因為不同的投資者對信息的實際需求存在差異性,因此所使用的分析軟件也各不相同。有些投資者只需要采用電子表格便可以滿足其需求,有些投資者則必須使用許多不同的大型軟件與工具的組合方可解決問題。此外,大數(shù)據(jù)建模問題是數(shù)據(jù)分析的一項重要內容,依靠數(shù)據(jù)分析工具可以對各種數(shù)據(jù)進行整合,從而總結出其中蘊含的規(guī)律,采取適宜的數(shù)據(jù)模型進行分析,便可以得出準確的分析結果。大數(shù)據(jù)分析需要處理的數(shù)據(jù)規(guī)模極為龐大,分析當前的實際狀況可以發(fā)現(xiàn),過去使用的模型組合已經無法滿足當前證券投資者對大數(shù)據(jù)分析的實際需求。
與其他行業(yè)相比,大數(shù)據(jù)分析對專業(yè)人才的需求更為迫切,大數(shù)據(jù)分析行業(yè)需要的人才資源必然屬于復合型人才,他們不但需要熟練掌握各種計算機軟件的使用方法,還需要掌握數(shù)學和統(tǒng)計學的專業(yè)知識。然而,當前我國證券行業(yè)在培養(yǎng)與發(fā)掘復合型人才方面依然存在著顯著的問題,因此如何開展更加科學有效的人才培養(yǎng)工作,對于證券投資的發(fā)展極為重要。
因為我國在大數(shù)據(jù)領域的法律制度并不完善,許多企業(yè)在進行用戶數(shù)據(jù)的搜集、存儲及管理時并未得到有效的規(guī)范,而許多企業(yè)制定的內控制度也無法充分保障用戶的信息安全。在商業(yè)化場景中,用戶應當能自行決定個人信息怎樣被使用。當前,信息技術已經取得了突破性發(fā)展并且在全國各地得到了普及,有必要完善相關領域的法律法規(guī),從而保障人民群眾的合法權益不受侵害。
當前,大數(shù)據(jù)技術在各個行業(yè)的應用自成體系。在金融行業(yè)中,銀行、保險及證券所采用的數(shù)據(jù)標準規(guī)范存在著顯著的差異性,同時其使用的數(shù)據(jù)記錄方法和會計處理方式也各不相同。因此,在進行大數(shù)據(jù)分析的過程中,企業(yè)應當針對數(shù)據(jù)記錄方式進行科學的規(guī)范,并制定出完善的數(shù)據(jù)質量規(guī)范。同時,企業(yè)還應采取適宜的手段來推動不同金融機構之間的數(shù)據(jù)開放共享,從而構建出金融業(yè)綜合統(tǒng)計基礎數(shù)據(jù)共享平臺。
大數(shù)據(jù)分析技術是計算機技術發(fā)展過程中取得的一項重大突破,為了進一步提升其應用范疇,使其能夠在更加重要的領域發(fā)揮效用,企業(yè)應當在技術層面為信息安全提供更加充分的保障。大部分黑客都需要依靠企業(yè)存在的技術漏洞來實現(xiàn)竊取數(shù)據(jù)的目標,因此,企業(yè)必須依靠升級技術手段來解決這一問題,加大力度培養(yǎng)信息技術人才并進行信息安全技術的開發(fā)與使用,同時在后續(xù)發(fā)展的過程中將其作為企業(yè)的戰(zhàn)略規(guī)劃,為信息安全技術的開發(fā)投入更多的資金支持。易安信等企業(yè)作為世界數(shù)據(jù)存儲系統(tǒng)的寡頭,其提供的數(shù)據(jù)存儲技術為我國企業(yè)的信息安全奠定了完善的技術基礎,并且為金融業(yè)的發(fā)展提供了高質量的數(shù)據(jù)存儲服務。當前,我國和美國之間展開的博弈主要集中在科技方面,美國針對我國進行的技術封鎖也讓我國深刻體會到核心技術受制于人帶來的諸多問題,因此我國金融業(yè)的發(fā)展不能完全依賴外國公司的技術,而是應當通過發(fā)展我國的信息安全技術來為數(shù)據(jù)安全提供更加切實有效的保障。
當前,我國已經正式邁入大數(shù)據(jù)時代,而大數(shù)據(jù)分析在證券投資中的運用受到了金融領域從業(yè)者的廣泛重視。當前,我國投資者數(shù)量的增長和各種新型技術的出現(xiàn),使得許多金融投資產品涌現(xiàn)出來,為此,我國需要采取大數(shù)據(jù)來發(fā)掘出金融數(shù)據(jù)中存在的各種信息,從而幫助證券投資者做出更加科學的決策。