(中國工商銀行股份有限公司 溫州分行,浙江 溫州 325200)
數據挖掘在股票預測中的應用
張博凱
(中國工商銀行股份有限公司 溫州分行,浙江 溫州 325200)
伴隨著經濟的發(fā)展以及社會的進步,全民炒股已經成為風尚,人們開始關注股票的預測效果,與此同時,數據挖掘技術和分析機制在不斷升級,將數據挖掘技術應用在股票預測項目中,具有非常重要的實際意義,能在提高預測準確性的同時,進一步為行業(yè)管理效率的升級提供動力。本文從數據挖掘技術內涵分析入手,對數據挖掘技術和股票預測的關系進行了集中分析,并著重闡釋了數據挖掘技術在股票預測中的應用策略,旨在為相關人員提供有價值的參考建議。
數據挖掘;內涵;股票預測;應用策略
對于股民來說,能準確地預測股票走勢一直就是每一個投資者的愿望,多數投資者會利用不同形式對其走勢規(guī)律進行分析,但是效果并不好。而隨著科學技術的不斷升級,預測模型不斷增多,利用數據挖掘技術能在提高信息整合能力的基礎上,對預測過程進行全面優(yōu)化。
伴隨著信息化時代的到來,各個領域內的數據呈現出大量且無規(guī)律的形態(tài),無論是信用卡記錄、通訊記錄還是股票交易信息,都能借助數據挖掘技術進行深度處理和整合。因此,數據挖掘技術就是借助不同計算機理論,對知識和技術體系進行深度分析和研究,從而建立具有實效性價值的數據庫,對相關數據理論進行集中的研究和探討,從而保證數據處理效果的最優(yōu)化。
在數據挖掘技術運行過程中,首先要收集數據,對不同領域內的信息和數據進行集中的整理,從而借助處理系統建構數據庫。其次,要對數據進行整合分析,正是借助數據整理,能有效刪除一些無用的干擾數據。再次,在樹立數據挖掘目標后,對數據模型以及算法等進行集中處理和綜合分析,借助數學參數模型對相關信息結構展開研究和分析[1]。最后,要對挖掘結果進行有效評估和處理,確保數據價值的同時,對評估方法和實際數據進行集中檢驗,有效評估實際數據和預測數據之間的差距。只有對數據進行深度處理,才能滿足挖掘要求,從而確保數據管理維度和管理效果的最優(yōu)化。
1、數據挖掘技術在股票預測項目中的適用性
在數據挖掘技術應用過程中,要結合實際參數結構和管理框架,結合管理模型的同時,對相關數據進行深度處理。在對于股票行業(yè),每天的交易信息和數據基數很大,在進入到股票存儲倉庫后,對其隱藏的相關信息進行集中處理,是實施數據挖掘技術的重要決策過程,在數據挖掘技術運行過程中,也能對股票項目進行有效的投資管理。之所以將數據挖掘技術應用在股票預測項目中,主要是基于股票分析的多樣性以及隱藏性。其一,多樣性特征的適用性。不同群體對于股票的分析方法很多,對不同股票的走勢也有不同的見解,產生的分析方法也不盡相同。正是基于此,要利用數據挖掘技術,才能滿足多樣性的股票分析機制。其二,隱蔽性特征的適用性,在股票運行過程中,股價和企業(yè)原始數據間會存在關系模糊的情況,這就需要利用技術模型對其進行深度處理和細化分析,從而結合相關數據進行信息的集成和融合,一定程度上利用數據挖掘技術對其進行多角度多方位的分析,積極落實更加有效的系統化數據處理框架,確保能將一些隱蔽的信息進行綜合和處理。
2、數據挖掘技術在股票預測形目中的應用方法
在股票預測項目中,利用數據挖掘技術,能有效地升級整體理論管理模型,并且深度管控數據的處理效果。在理論研究機制中,基本分析學派以及技術分析學派兩者具有較為重要的意義。
第一,基本分析學派主要是利用數據挖掘技術能對股票價格的波動進行深度分析,由于其波動狀態(tài)主要是受企業(yè)基本信息、經營業(yè)績、政策、社會因素等因素的影響,因此,利用數據挖掘技術能對其中的規(guī)律進行有效分析和集中處理,針對工具模型以及股票運行走勢,建立系統化的管控結構,從而積極落實圖像分析機制,從數據分析中得出結論[2]。另外,技術分析學派在實際分析結果建立的過程中,主要是利用相關技術框架進行系統化管理和信息維護,利用數據挖掘既注重的統計分析,能對大盤中的成交量、開盤價、收盤價預計相關信息維度進行細化處理,利用相關指標對數據以及變化規(guī)律進行集中整合和數據分析,從趨勢中尋找有效的數據管理維度,切實維護技術模型和技術運行維度,也能在優(yōu)化整體技術模型和運行機制的同時,從股價的長期趨勢層次進行系統化分析和處理。
第二,在數據分析機制建立過程中,也要有效使用相應的方法,提高分析和預測效果。其中,較為常見的是證券投資分析法、實踐序列法、神經網絡法預測機制以及定量預測法等,能對數據進行系統化分析和集中處理,確保數據框架結構真實有效。
1、數據挖掘技術之決策樹應用在股票預測中
數據挖掘技術中,決策樹分類算法能對相關數據進行有效地歸納和處理,采用的主要是一種自上而下傳遞結構的信息管理方式,從無次序以及無規(guī)則的數據中對相關信息進行有效推導,從而保證分類規(guī)則項目的貼合度[3]。并且對決策樹頂點的信息層級開始,到決策樹的葉子節(jié)點結束,整個數據收集和整合過程就是決策樹運行過程,能保證數據離散和連續(xù)性不同數據的完整度,并且有效處理相關參數。在決策樹結構中,首先要對樣本集進行集中收集和整理,并且對不同屬性進行綜合取值,例如,成交量、活躍度、上漲類、下跌類等,對其進行交易數據的綜合處理,從而建構有效的數據分析機制。在對相關數據進行分析后,能得出換手率的條件熵越小,得到的信息增益值就會增大,將換手率作為第一條屬性測試項目,能得出相應的信息量,并對決策進行有效處理和系統化分析,確保不同訓練樣本能形成有效的子集結構,在形成兩個分支后,對其進行數據整合。
結合決策樹算法對股票進行系統預測,能在優(yōu)化劃分結構的同屬,確保測試出的類別和項目因素進行決定,一定程度上決定了技術挖掘出的信息,只有在保證技術應用規(guī)范前提下,才能對信息進行有效遞歸分類。在實際數據處理和信息技術應用的過程中,有效拓展決策樹算法,并建構更加貼合有效的訓練樣本分類處理模型,確保管理維度和管理框架體系的有效性。在數據最終選取的測試屬性判定方面,相關技術人員要結合實際需求,建構更加系統化的結果對比。但是,決策樹算法也并不都是優(yōu)勢,也存在一些亟待解決的問題,容易產生碎片問題、不穩(wěn)定性等,都需要技術人員在應用將決策樹進行股票預測建模時,要從屬性以及決策信息準確性出發(fā),落實不同的管理機制和控制措施,減小生成的決策樹冗余。
2、數據挖掘技術之神經網絡應用在股票預測中
數據挖掘技術中的神經網絡算應用范圍也較為廣泛,主要是利用計算單元組合對其進行深度數據分析和綜合處理,并且利用若干特征結合相關計算機計量數據對實際特征進行細化處理和綜合分析。神經網絡最大的特征就是自適應性強以及學習能力高。一般而言,將BP神經網絡和徑向基算法應用在股票預測項目中。
第一,利用BP神經網絡進行股票預測,要按照標準化工序有序開展,在算法開始后,要對網絡初始化進行處理,并且輸入訓練樣本,以保證對隱層單元輸出信息進行獨立求解,并對輸出單元量展開計算過程,從而判斷兩者之間的偏差,若是偏差符合標準,則信息處理技術結束。若是偏差不符合標準,就要對隱含層好輸出層之間的連接權值進行以及輸入層和隱含層連接權值的數據進行集中調整,確保數據維度和管理價值的最優(yōu)化。通過相關數據顯示,當隱含層數為15,且時,整體網絡體系中預測誤差數值最小,且精度也能保證最高,選取更加有效的神經網絡預測模型對其神經結構進行處理,利用BP網絡非線性映射力對隱含層進行非系統化分析,也能對連續(xù)函數等結構展開討論,確保輸出、輸入、最優(yōu)值等參數符合實際需求。
例如,初始化學習次數設定為,對以及等參數進行隨機數分布,設定為(-1,1),則學習樣本為,對輸出值以及單元層輸出值等進行計算,利用相應算法對誤差進行修正。
第二,利用徑向基網絡算法進行股票預測,相較于BP神經網絡算法,在徑向基運行訓練的過程中,要提高對分布密度的影響。在分布密度增大后,函數的擬合就會出現平滑趨勢。在實際處理過后,要借助改變學習速率實現相應的管理要求,比較適用的隱層神經元也是整個系統中的重點。只有保證全面獲取股票的預測值,才能一定程度上提高整體數據和信息處理的實效性,確保管理機制更加有效。在徑向基神經網絡訓練時,通過改變函數的分布密度得出不同的結果,確保數據維度和數據管控機制的最優(yōu)化。徑向基的平均預測誤差中,分布密度為0.1,則平均誤差為0.178*10-14,;當分布密度為0.5,則平均誤差為0.384*10-12;分布密度為1.0,則平均誤差為0.357*10-10。值得一提的是,徑向基神經網絡收斂速度要高于神經網絡,并且是整體數據處理后誤差更小更加精確,需要相關部門提高認知和重視度。在股票預測項目中,借助不同的網絡算法,對數據進行深度處理,從而保證數據框架結構貼合實際。
總而言之,在股票預測項目過程中利用數據挖掘技術,能在提高整體數據分析和運行維度管理的基礎上,對相關信息和數據進行綜合管控和集中處理,確保信息運行維度和實際管理模型之間的貼合度,也為冗余系統的優(yōu)化奠定堅實基礎,確保數據針對性以及股票綜合分析的有效性,為數據處理框架展開實際管理,保證預測值和實際值之間更加地接近,從而真正發(fā)揮其實際效果,保證熵值的有效優(yōu)化。只有建構系統化的數據管理機制,才能在提高數據分析能力的同時,滿足數據挖掘技術的可持續(xù)發(fā)展。
[1]南曉莉:新媒體時代網絡投資者意見分歧對IPO溢價影響——基于股票論壇數據挖掘方法[J].中國軟科學,2015.15(10):155-165.
[2]王曉曄、王正歐:正則化訓練的神經網絡與粗集理論相結合的股票時間序列數據挖掘技術[J].電子與信息學報,2014.26(04): 625-631.
[3]陳艷、褚光磊:關聯規(guī)則挖掘算法在股票預測中的應用研究——基于遺傳網絡規(guī)劃的方法[J].管理現代化,2014.34(03): 13-15.39.
(責任編輯:孫茜茜)