• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于DFS—BPSO—SVM的股票趨勢預(yù)測方法

      2018-01-09 13:37:07李輝趙玉涵
      軟件導(dǎo)刊 2017年12期
      關(guān)鍵詞:支持向量機

      李輝+趙玉涵

      摘要:技術(shù)指標(biāo)廣泛應(yīng)用于股票市場的預(yù)測分析,不同特征組合對預(yù)測效果產(chǎn)生不同影響。為了提高股票趨勢預(yù)測的準(zhǔn)確度,提出一種兩層特征選取及預(yù)測方法。第一層特征選取以特征子集區(qū)分度衡量準(zhǔn)則——DFS為評價標(biāo)準(zhǔn),第二層特征選取以分類器分類效果為評價準(zhǔn)則,兩層特征選取均采用二進制粒子群(BPSO)算法對特征空間進行搜索。通過第一層特征選取可以高效剔除部分非預(yù)測相關(guān)特征,在保留預(yù)測特征集信息的基礎(chǔ)上縮小特征集規(guī)模;第二層特征選取可以準(zhǔn)確選擇出具有較好預(yù)測效果的特征子集。實驗數(shù)據(jù)為2015~2016年上海證券綜合指數(shù),結(jié)果表明,DFS-BPSO-SVM預(yù)測模型相比于其它4種特征選取及預(yù)測模型,具有更好的預(yù)測效果。

      關(guān)鍵詞:二進制粒子群算法;支持向量機;兩層特征選??;特征子集區(qū)分度衡量準(zhǔn)則;股票趨勢預(yù)測

      DOIDOI:10.11907/rjdk.171931

      中圖分類號:TP319

      文獻標(biāo)識碼:A 文章編號:1672-7800(2017)012-0147-05

      Abstract:Technical indicator was widely used in stock predicting. Different combination of indicator have an effect on predicting performance. In order to improve stock price trend predicting performance, this study proposes a new predicting model that is Binary Particle Swarm Optimization combined with Support Vector Machine and DFS criterion (DFS-BPSO-SVM) predicting model. Its a two step feature selection predicting model. In first step, DFS criterion is used for feature selection and we got suboptimal feature subset. After this process, redundant features have been removed and the scale of the feature set becomes smaller. In second step, BPSO-SVM is used for feature selection on suboptimal feature subset and we got best feature subset which leads to best stock trend predicting performance. Based on best feature subset, sample set is constructed for stock trend predicting. In this study, the target is to predict 2015-2016 Shanghai securities composite index daily movement. The experiment results indicate that DFS-BPSO-SVM predicting model have a better performance on stock price and index daily movement than another 4 predicting model.

      Key Words:binary particle swarm optimization; support vector machine; two step feature selection; DFS; stock trend predicting

      0 引言

      自從股票誕生之日起,關(guān)于股票價格預(yù)測的嘗試與研究從未停歇。每一位股票交易者都希望自己能夠準(zhǔn)確預(yù)測未來股票的價格,從而獲得超額收益。然而,股票市場具有復(fù)雜非線性、非平穩(wěn)、高噪聲等特性[1],股票預(yù)測一直以來都充滿了困難和挑戰(zhàn)。

      隨著機器學(xué)習(xí)技術(shù)的誕生與發(fā)展,越來越多機器學(xué)習(xí)方法應(yīng)用于股票趨勢預(yù)測研究,基于人工神經(jīng)網(wǎng)絡(luò)(ANN)[1,3]、支持向量機(SVM)[4]的智能預(yù)測方法相比于傳統(tǒng)預(yù)測方法普遍具有較好的預(yù)測效果。不少改進算法也相繼應(yīng)用于股票趨勢預(yù)測,并取得了一定效果[2, 5]。雖然預(yù)測算法在不斷改進和發(fā)展,但是預(yù)測算法性能的提升只是在具有特定輸入特征的數(shù)據(jù)集上相應(yīng)地提升了預(yù)測效果,一旦輸入特征改變,將可能直接影響預(yù)測準(zhǔn)確度。由于股票市場具有復(fù)雜多變的特征,使得單一預(yù)測方法越來越難以滿足建模預(yù)測的要求。

      針對這一問題,不少研究著眼于構(gòu)建組合模型進行預(yù)測,即先通過特征選取方法選擇用于預(yù)測的最優(yōu)特征集,然后將選取的特征用于股票預(yù)測。張煒等[6]提出了一種將自適應(yīng)遺傳算法與粗糙集理論結(jié)合的特征選取方法,該方法考慮到特征之間和特征與預(yù)測結(jié)果之間的知識體系,選擇包含信息較多的特征組成特征子集,然而該方法在選取特征時沒有考慮到預(yù)測結(jié)果的實際貢獻;Zhang等[7]提出了一種CFS(Causal Feature Selection)方法,分別結(jié)合神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林、樸素貝葉斯、決策樹、線性回歸與PCA、CART、NoFS、Lasso方法進行對比實驗,結(jié)果驗證了CFS方法的有效性,但該特征選取方法也僅考慮到了特征與預(yù)測結(jié)果的因果聯(lián)系,同樣未考慮特征子集對于實際預(yù)測結(jié)果的貢獻;張偉等[8]提出了一種遺傳算法結(jié)合支持向量機(GA-SVM)的股票預(yù)測模型,該方法以預(yù)測效果作為特征選擇依據(jù),通過GA搜尋最優(yōu)特征子集。雖然該方法充分考慮到實際預(yù)測結(jié)果對于特征選取的影響,但此方法進行特征選取時效率較低,當(dāng)特征較多時比較費時。endprint

      針對上述研究存在的問題,本文提出了一種基于兩層特征選取方法構(gòu)建的股票趨勢預(yù)測模型。進行第一層特征選取時,充分考慮到特征和特征子集對于分類貢獻的大小,采用DFS(Discernibility of Feature Subset)準(zhǔn)則[9]作為特征子集衡量度標(biāo)準(zhǔn),選擇出分類貢獻大的特征子集作為次優(yōu)特征子集;進行第二層特征選取時,充分考慮模型實際預(yù)測結(jié)果對于特征選取過程的影響,以SVM模型的預(yù)測準(zhǔn)確度作為評價標(biāo)準(zhǔn),在第一層選擇出的次優(yōu)特征子集基礎(chǔ)上選出最優(yōu)特征子集。為了加快次優(yōu)、最優(yōu)特征子集的搜尋過程,同時盡可能得到全局最優(yōu)特征子集,本文采用了一種隨機搜索算法——BPSO算法進行優(yōu)化搜索。

      1 用于股票趨勢預(yù)測的特征子集評價準(zhǔn)則

      股票趨勢預(yù)測即是對股票未來的漲跌進行預(yù)測,實質(zhì)為二分類預(yù)測。分類預(yù)測效果與預(yù)測特征集的優(yōu)劣存在很大關(guān)聯(lián),因此需要對預(yù)測特征進行篩選。在特征選取時,需要考察已有特征之間的相互聯(lián)系和對分類的重要性,選擇出既能減少冗余或不相關(guān)信息,同時又能突出分類能力的特征子集。本文提出的是一種兩層特征選取方法,首先分析特征集內(nèi)部特征數(shù)據(jù)對于分類貢獻的大小,選擇分類貢獻大的特征子集作為次優(yōu)特征子集,然后根據(jù)分類器的實際預(yù)測效果,在次優(yōu)特征子集中選擇出最優(yōu)特征子集。兩層特征選取方法可以在保證以分類效果為最終評判標(biāo)準(zhǔn)的條件下,通過對特征進行預(yù)篩選,提高特征選取過程的效率和準(zhǔn)確性。

      特征子集評價準(zhǔn)則直接影響是否能夠找到用于預(yù)測的最優(yōu)特征子集??偨Y(jié)以往的研究發(fā)現(xiàn),衡量特征集內(nèi)部特征對于分類貢獻大小的常見評價標(biāo)準(zhǔn)有兩類,一類是將單個特征的分類能力大小進行排序,選擇分類能力強的特征組成特征子集,典型算法有Relief、 Fisher等;另一類是綜合考慮特征之間的相關(guān)性和分類能力大小,選擇特征之間相關(guān)性小并且分類能力強的特征作為特征子集[9],典型準(zhǔn)則有CFS、DFS等。第一類準(zhǔn)則僅考慮了單個特征分類能力的大小,忽視了特征間相關(guān)性對特征子集分類能力大小的影響;第二類準(zhǔn)則中CFS更多考慮的是特征之間的兩兩相關(guān)性,而對多個特征之間相關(guān)性考慮不足,同時僅能應(yīng)用于離散數(shù)據(jù),對于非離散數(shù)據(jù)需要進行離散化處理;DFS綜合考慮特征子集分類能力和多個特征之間的相關(guān)性,同時適用于非離散數(shù)據(jù)[9]。通過以上分析,本文采用DFS準(zhǔn)則作為第一層特征選取的評價準(zhǔn)則。

      1.1 DFS特征子集評價準(zhǔn)則

      3 基于DFS-BPSO-SVM的上證指數(shù)預(yù)測實驗

      3.1 實驗數(shù)據(jù)

      本文將股票預(yù)測分析中常用的49個技術(shù)指標(biāo)(AD,BIAS,CCI,CR,DIFF,EMA12/26,LWR,MACD,Momentum,RSI,SDMA,KDJ,VR,WDMA,BHR5/20/60,ARBR,AROON,ATR,BOLL,CMO,CV,DMA,DMI,PosDI,NegDI,ADX,AMA,MA,DPO,EMV,MAEM,F(xiàn)IV,MFI,MTM,NVI,PVI,OBV,PSY,ROC,RVI,TRIX,MATRIX,VHF,WAD,WMS,WVAD)作為預(yù)測特征(輸入變量),股票指數(shù)每日趨勢作為預(yù)測目標(biāo)(輸出變量)??紤]到股票交易中存在的各種稅費和傭金,當(dāng)股票價格相較前一日上漲0.3%時,標(biāo)記為“1”,反之標(biāo)記為“-1”。

      根據(jù)技術(shù)指標(biāo)構(gòu)造的49維特征量中每一維特征分量都具有不同的取值范圍,并且取值范圍差別很大。特征分量之間巨大的數(shù)量差異會導(dǎo)致學(xué)習(xí)算法的參數(shù)尋優(yōu)過程變得復(fù)雜,增加了時間成本,同時也會造成大值特征主導(dǎo)預(yù)測模型,降低模型預(yù)測性能的不利情況[10]。因此,本文采用公式(9)對特征量進行歸一化處理,將每一維特征分量都轉(zhuǎn)換到區(qū)間[-1,1]。

      實驗采用的數(shù)據(jù)為上證綜合指2015~2016年的相關(guān)交易數(shù)據(jù)和特征指標(biāo),總共263個樣本數(shù)據(jù)。將樣本集中80%的樣本作為特征選取樣本集Train,20%樣本作為測試集P。其中特征選取樣本集又分為訓(xùn)練集和測試集。

      3.2 實驗設(shè)計

      為了驗證本文提出的特征選取及預(yù)測方法的有效性,分別將主成份分析(PCA)、特征權(quán)重算法(Relief)、遺傳算法(GA)與SVM結(jié)合的特征選取預(yù)測模型與DFS-BPSO-SVM模型進行對比實驗,同時將未進行特征選取的SVM預(yù)測模型作為對比。

      實驗環(huán)境為Matlab2015a, 使用LIBSVM進行分類預(yù)測實驗,RBF函數(shù)作為SVM核函數(shù)。需要設(shè)置的SVM參數(shù)有C、γ,本實驗采用5-折交叉驗證方法確定預(yù)測模型參數(shù)。通過網(wǎng)格搜尋的方法確定最佳參數(shù)組合,搜尋范圍C∈[0.5,50],步長為0.5;γ∈[0.2,6],步長為0.2。在PCA-SVM模型中,本實驗將主成份累計貢獻率∑ni=1αi閾值設(shè)置為95%,即選取協(xié)方差矩陣特征值貢獻之和達到95%的前n個貢獻大的特征;在Relief特征選取過程中,需要確定特征分類權(quán)重閾值,圖2為特征選取過程中特征的權(quán)重分布和統(tǒng)計信息。為了在保留特征集主要信息的同時縮減特征子集規(guī)模,本實驗將特征權(quán)重閾值設(shè)置為2 000;使用GA-SVM模型進行特征選取時,將種群規(guī)模P設(shè)置為30,最大進化代數(shù)G設(shè)置為100,變異率M設(shè)置為0.1,交叉率C設(shè)置為0.8,圖3為GA-SVM特征選取時特征子集適應(yīng)度值變化曲線;使用DNS-BPSO-SVM選取次優(yōu)特征子集時,兩層特征選取過程中粒子群粒子數(shù)N均設(shè)置為30,最大迭代次數(shù)I均設(shè)置為50,粒子群速度更新公式參數(shù)c1=c2=2,圖4、圖5分別為DFS-BPSO-SVM模型進行兩層特征選取時,特征子集適應(yīng)度值變化曲線。

      3.3 實驗結(jié)果分析

      本文采用5種特征選取及預(yù)測模型,在相同的實驗環(huán)境下分別進行實驗。表2列出了每種方法所選特征數(shù)、特征選取耗時、所選特征子集在測試集上的平均預(yù)測精確度(Precision)和準(zhǔn)確度(Accuracy),以及訓(xùn)練集平均預(yù)測耗時。通過表2實驗結(jié)果可知,未進行特征選取的SVM預(yù)測模型精確度和準(zhǔn)確度在幾種方法中都是最差的,同時訓(xùn)練耗時最多;PCA-SVM模型的特征選取過程時間最短,endprint

      但預(yù)測精確度和準(zhǔn)確度均不如GA-SVM模型及DFS-BPSO-SVM模型;Relief模型訓(xùn)練耗時最短,但預(yù)測準(zhǔn)確度和精確度僅優(yōu)于未進行特征選取的SVM模型;DFS-SVM為兩層特征選取中次優(yōu)特征子集對測試集的預(yù)測,可以看出DFS-SVM模型預(yù)測表現(xiàn)優(yōu)于Relief模型,稍優(yōu)于PCA-SVM模型;GA-SVM和DFS-BPSO-SVM預(yù)測模型均具有較高的預(yù)測準(zhǔn)確度和精確度,DFS-BPSO-SVM預(yù)測精確度高于GA-SVM,而預(yù)測準(zhǔn)確度稍遜于GA-SVM。綜合考慮預(yù)測精確度和準(zhǔn)確度,DFS-BPSO-SVM模型優(yōu)于GA-SVM模型。無論是GA-SVM模型還是DFS-BPSO-SVM模型,特征選取都耗時很長,這也是以預(yù)測效果為特征選取準(zhǔn)則方法共有的問題。然而,在股票預(yù)測過程中更加重視預(yù)測效果,因而特征選取耗時為次要因素。對比DFS-BPSO-SVM和GA-SVM的特征選取耗時,DFS-BPSO-SVM明顯低于GA-SVM,這是因為DFS-BPSO-SVM在第一層特征選取過程中,剔除了一些非預(yù)測相關(guān)特征,縮減了特征子集規(guī)模,使分類器在訓(xùn)練過程中耗時減少。同時,BPSO具有較高精確度和較快的收斂速度,從而提高了特征子集優(yōu)化效率。本文提出的兩層特征選取方法在保證預(yù)測效果的同時,提高了以分類效果為評價準(zhǔn)則的特征選取效率。

      4 結(jié)語

      本文提出了一種基于DFS-BPSO-SVM的股票趨勢預(yù)測方法。首先通過DFS-BPSO進行第一層特征選取,得到次優(yōu)特征子集;然后通過BPSO-SVM進行第二層特征選取,得到最優(yōu)特征子集;最后以選取出的最優(yōu)特征構(gòu)建樣本集,使用SVM進行訓(xùn)練預(yù)測。對比常用的幾種特征選取及預(yù)測方法,實驗結(jié)果表明,本文提出的DFS-BPSO-SVM股票趨勢預(yù)測模型具有較好的預(yù)測效果。該方法通過第一層特征選取,高效剔除了一些非預(yù)測相關(guān)特征,減少了冗余信息對股票趨勢預(yù)測的影響,同時縮減了特征規(guī)模;通過第二層特征選取得到最優(yōu)特征組合,提高了預(yù)測準(zhǔn)確率。當(dāng)預(yù)測特征較多時,該方法具有較好的特征選取及預(yù)測效果,并兼具相對較高的運行效率。

      參考文獻:

      [1] REFENES A N, BURGESS A N,BENTZ Y. Neural networks in financial engineering: a study in methodology[J]. IEEE transactions on neural networks, 1997,8(6):1222-1267.

      [2] JIGAR PATEL,SAHIL SHAH,PRIYANK THAKKAR,et al. Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques [J]. Expert Systems with Applications, 2015,42(1):259-268.

      [3] XIAOTIAN ZHU, HONG WANG, LI XU, et al. Predicting stock index increments by neural networks: the role of trading volume under different horizons [J]. Expert Systems with Applications, 2008,34(4):3043-3054.

      [4] KYOUNG-JAE KIM. Financial time series forecasting using support vector machines [J]. Neurocomputing, 2003,55(1-2):307-319.

      [5] CHI-JIE LU. Hybridizing nonlinear independent component analysis and support vector regression with particle swarm optimization for stock index forecasting [J]. Neural Computing & Application, 2013,23(7-8):2417-2427.

      [6] 張煒,范年柏,汪文佳.基于自適應(yīng)遺傳算法的股票預(yù)測模型研究[J].計算機工程與應(yīng)用,2015,51(4):254-259.

      [7] XIANGZHOU ZHANG, YONG HU, KANG XIE, et al. A causal feature selection algorithm for stock prediction modeling[J].Neurocomputing, 2014,142:48-59.

      [8] 張偉,李泓儀,蘭書梅,等.GA-SVM對上證綜指走勢的預(yù)測研究[J].東北師大學(xué)報:自然科學(xué)版,2012,44(1):55-59.

      [9] 謝娟英,謝維信.基于特征子集區(qū)分度與支持向量機的特征選擇算法[J].計算機學(xué)報,2014,37(8):1704-1717.

      [10] YAKUP KARA,MELEK ACAR BOYACIOGLU, OMER KAAN BAYKAN. Predicting direction of stock price index movement using artificial neural networks and support vector machines: the sample of the istanbul stock exchange[J]. Expert Systems with Applications, 2011,38(5):5311-5319.

      [11] KENNEDY J, EBERHART R C. Particle swarm optimization [C]. Proceedings of International Conference on Neutral Networks IV, 1995:1942-1948.

      [12] 劉全金,趙志敏,李穎新,等.基于近鄰信息和PSO算法的集成特征選取[J].電子學(xué)報,2016,44(4):995-1002.

      [13] KENNEDY J, EBERHAR R. A discrete binary version of the particle swarm algorithm[C]. Proceeding of the World Multiconference on Systemics, Cybernetics and Informatics, Newjersy: Piscataway, 1997:4104-4109.

      (責(zé)任編輯:黃 ?。〆ndprint

      猜你喜歡
      支持向量機
      基于支持向量回歸機的電能質(zhì)量評估
      基于智能優(yōu)化算法選擇特征的網(wǎng)絡(luò)入侵檢測
      數(shù)據(jù)挖掘技術(shù)在電廠經(jīng)濟性分析系統(tǒng)中的應(yīng)用Q
      基于改進支持向量機的船舶縱搖預(yù)報模型
      中國水運(2016年11期)2017-01-04 12:26:47
      基于SVM的煙草銷售量預(yù)測
      動態(tài)場景中的視覺目標(biāo)識別方法分析
      論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
      價值工程(2016年32期)2016-12-20 20:36:43
      基于熵技術(shù)的公共事業(yè)費最優(yōu)組合預(yù)測
      價值工程(2016年29期)2016-11-14 00:13:35
      基于支持向量機的金融數(shù)據(jù)分析研究
      管理類研究生支持向量機預(yù)測決策實驗教學(xué)研究
      考試周刊(2016年53期)2016-07-15 09:08:21
      行唐县| 清水县| 西丰县| 满城县| 定州市| 湟源县| 拉萨市| 封丘县| 中卫市| 全椒县| 汨罗市| 台北县| 炉霍县| 民权县| 常德市| 年辖:市辖区| 固镇县| 和林格尔县| 乐平市| 田林县| 和田县| 特克斯县| 宣城市| 天祝| 武胜县| 泰兴市| 齐齐哈尔市| 阜新市| 陆丰市| 积石山| 会泽县| 临海市| 阆中市| 苍梧县| 顺昌县| 惠东县| 亚东县| 临猗县| 祁阳县| 杭锦后旗| 青田县|