• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于高斯混合隱馬爾可夫模型的螺紋鋼價格波動預(yù)測

    2022-05-31 10:55:48孫若瑩
    冶金經(jīng)濟與管理 2022年2期
    關(guān)鍵詞:螺紋鋼概率觀測

    □ 王 越 孫若瑩

    一、研究背景

    螺紋鋼是指鋼筋混凝土和預(yù)應(yīng)力鋼筋混凝土用鋼材,應(yīng)用于建筑領(lǐng)域,特別是各種大型、重型、輕型薄壁和高層建筑結(jié)構(gòu)[1]。當(dāng)前,鋼鐵貿(mào)易商通過鋼鐵B2B電子交易市場進行交易,該類電子市場提供信息服務(wù)、線上及遠(yuǎn)期交易撮合服務(wù),提供公開的螺紋鋼市場歷史報價、交易量[2]。螺紋鋼是22類鋼材中唯一完全應(yīng)用于建筑領(lǐng)域的鋼鐵材料,市場需求量巨大,且在電子交易市場中可觀察到其價格波動較為活躍,因此對其價格波動進行分析和預(yù)測具有一定意義。

    隱馬爾可夫模型(HMM)具有從數(shù)據(jù)中學(xué)習(xí)經(jīng)驗知識的能力,其對未來價格趨勢的預(yù)測主要基于從歷史數(shù)據(jù)中學(xué)習(xí)到的經(jīng)驗知識,并非完全依賴于人為給定的先驗知識,這就使得從數(shù)據(jù)中挖掘出更多與未來價格相關(guān)的信息成為可能[3]。HMM模型通過假設(shè)存在不可觀測的隱狀態(tài)序列及其對應(yīng)的可觀測序列,研究隱狀態(tài)之間、觀測狀態(tài)各自及二者之間的關(guān)系。將HMM模型的隱狀態(tài)理解為一只“看不見的大手”,其意味著相當(dāng)復(fù)雜而不易觀測的因素,比如政策變化、螺紋鋼需求變化、螺紋鋼原材料價格變化等,影響著螺紋鋼的最高價、最低價、成交量等可觀測狀態(tài)。

    Hassan等[4]首次將HMM模型應(yīng)用在金融數(shù)據(jù)上,其將股票的開盤價、收盤價、最高價和最低價作為HMM模型的觀測序列,經(jīng)訓(xùn)練得到HMM模型的參數(shù)后,計算當(dāng)日股票收盤價。Gupta等[5]改進使用股票每日最高價和最低價變化的百分比作為特征訓(xùn)練HMM。張旭東等[6]通過對股票收益率的統(tǒng)計分析,建立了離散型HMM模型,實現(xiàn)對股票價格的預(yù)測。余文利等[7]使用 CBIC(Clustering and BIC)算法生成 HMM 模型隱狀態(tài)的個數(shù),在預(yù)測誤差大于一定閾值時,模型進行自動更新,建立新模型,得到了較好的預(yù)測效果。陳海鵬等[8]提出了一種基于多元線性回歸分析的螺紋鋼價格分析及預(yù)測模型,從影響螺紋鋼價格的因素角度建立模型并實現(xiàn)螺紋鋼價格預(yù)測,該方法不足之處是各因素之間存在多重共線性,可能對預(yù)測結(jié)果產(chǎn)生干擾。張巧艷[9]引入分形理論,根據(jù)螺紋鋼價格數(shù)據(jù)的分型特征,以現(xiàn)貨收益率為預(yù)測因素,構(gòu)建了基于粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型,該方法的不足之處在于預(yù)測之前必須去噪和獲取分形特征,在實際應(yīng)用中缺乏靈活性。

    HMM模型的優(yōu)勢在于其充分挖掘歷史數(shù)據(jù)信息并將其應(yīng)用于預(yù)測,避免了在人為分析價格相關(guān)要素的過程中可能產(chǎn)生的遺漏和偏差。高斯混合隱馬爾可夫模型(Gaussian mixture hidden Markov model,GMHMM)是在HMM模型基礎(chǔ)上,使用高斯混合分布改寫觀測概率矩陣的改進模型。本文以2維觀測序列為輸入,使用Baum-Welch算法學(xué)習(xí)模型參數(shù),再根據(jù)Viterbi算法進行市場隱狀態(tài)解碼,構(gòu)建和訓(xùn)練了GMHMM模型,最后使用加權(quán)預(yù)測結(jié)合移動窗口進行不同時間段的預(yù)測。實驗結(jié)果分析表明,GMHMM模型在螺紋鋼現(xiàn)貨市場具有適用性,為后續(xù)螺紋鋼投資策略、庫存管理研究等奠定了基礎(chǔ)。

    二、模型介紹

    1.隱馬爾可夫模型

    HMM模型是基于時間序列的概率模型,其包含一個隱藏的馬爾科夫鏈,由這個馬爾科夫鏈隨機生成隱藏的狀態(tài)隨機序列,各個狀態(tài)根據(jù)某種概率函數(shù)生成一個觀測數(shù)據(jù),從而產(chǎn)生一列觀測數(shù)據(jù)[10]。HMM模型狀態(tài)轉(zhuǎn)移由隨機觀測與對應(yīng)的觀測隨機過程組成。一般可以直接觀測到觀測狀態(tài)序列,不能直接觀測到隱狀態(tài)序列,若要得到隱狀態(tài)序列,可以對觀測狀態(tài)序列進行研究,去推斷隱狀態(tài)序列及其轉(zhuǎn)移特征。

    HMM模型的狀態(tài)定義如下:Q={q1,q2,…qn},所有可能的隱狀態(tài)集合;V={v1,v2,…vm},所有可能的觀測狀態(tài)集合;I={i1,i2,…iT},隱狀態(tài)序列;O={o1,o2,…oT},觀測狀態(tài)序列。定義λ=(A,B,π)為HMM模型,模型由初始概率分布π、狀態(tài)轉(zhuǎn)移概率分布A及觀測概率分布B確定。其中初始狀態(tài)概率向量πi表示在t=1時處于狀態(tài)qi的概率,表達(dá)式為:

    A為狀態(tài)轉(zhuǎn)移概率矩陣, 描述的是系統(tǒng)在時刻t處于狀態(tài)qi的條件下,在時刻t+1轉(zhuǎn)移到狀態(tài)qj的概率,表達(dá)式為:B為觀測概率矩陣,描述的是時刻t處于狀態(tài)qj的條件下,生成觀測vk的概率,表達(dá)式為:

    π、A決定狀態(tài)序列,B決定觀測序列。π與A確定了隱藏的馬爾科夫鏈,生成不可觀測的狀態(tài)序列,B確定了如何從狀態(tài)生成觀測,與狀態(tài)序列綜合確定了觀測序列。

    HMM模型提出了3個基本問題[11]:

    (1)概率計算問題。在給定模型參數(shù)λ和觀測序列V的條件下,計算在該模型λ下出現(xiàn)觀測序列O的概率P(O|λ),通常使用前向-后向算法解決該問題。

    (2)學(xué)習(xí)問題。已知觀測序列O,估計模型λ,使得在該模型下觀測序列概率P(O|λ)最大。估計模型參數(shù)的核心思想是最大似然估計,通常使用Baum-Welch算法實現(xiàn)。

    (3)預(yù)測問題,也稱解碼問題。已知模型λ和觀測序列O,求對給定觀測序列條件概率P(I|O)最大的狀態(tài)序列I。即給定觀測序列,求最有可能對應(yīng)的狀態(tài)序列。

    2.高斯混合隱馬爾可夫模型

    原始HMM模型的觀測變量為離散隨機變量,在螺紋鋼行情數(shù)據(jù)中,觀測變量(即價格數(shù)據(jù))是連續(xù)隨機變量,需要利用高斯混合分布來刻畫隨機變量的分布。高斯混合分布是指多個高斯分布的線性疊加,能擬合非常復(fù)雜的密度函數(shù)。通過足夠多的高斯分布疊加,并調(diào)節(jié)其均值、協(xié)方差矩陣,以及線性組合的系數(shù),可以精確地逼近任意連續(xù)概率密度函數(shù)[12]。通過高斯混合分布重構(gòu)觀測概率矩陣B的參數(shù),重估公式為:

    式(4)中,N(O,μjm,Ujm)為多維高斯概率密度函數(shù),M為高斯函數(shù)數(shù)目,μjm和Ujm分別為均值向量和協(xié)方差矩陣,cjm為系數(shù)矩陣。通過計算不同維度數(shù)組之間的協(xié)方差,一定程度上可以反映輸入數(shù)據(jù)的內(nèi)在關(guān)聯(lián)性,并可在模型進行預(yù)測時使用學(xué)習(xí)到的關(guān)聯(lián)信息。

    改進模型被稱為高斯混合隱馬爾可夫模型(GMHMM),相應(yīng)的模型參數(shù)為:

    三、實驗與分析

    1.數(shù)據(jù)選取及處理

    選取上海大宗鋼鐵電子交易中心的螺紋鋼現(xiàn)貨價格數(shù)據(jù),基于時效性要求和模型本身特性選取和拆分?jǐn)?shù)據(jù)集,以其中2018年4月17日—2021年2月10日的690天數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù)集,2021年2月10日—2021年3月31日的30天數(shù)據(jù)作為模型的預(yù)測數(shù)據(jù)集。原始數(shù)據(jù)維度主要包括high(最高報價)、low(最低報價)、volume(成交量,單位“萬噸”)、money(成交額)。

    實驗數(shù)據(jù)形式如表1所示。

    表1 數(shù)據(jù)集形式

    考慮到市場隱狀態(tài)會影響螺紋鋼最高報價和最低報價,根據(jù)隱狀態(tài)與觀測狀態(tài)之間的生成關(guān)系,將high(最高報價)序列和low(最低報價)序列處理后作為觀測序列,處理方式為取對數(shù)價差值,以更地好體現(xiàn)價格的波動趨勢。以high序列數(shù)據(jù)為例,處理方式見公式(6)。對high序列數(shù)據(jù)和close序列數(shù)據(jù)進行處理后,得到2維的觀測序列O=(O1,O2),數(shù)據(jù)形式如表2所示。

    表2 觀測序列O=( O1, O2 )

    2.模型參數(shù)選擇

    高斯函數(shù)數(shù)目M的選擇:由于觀測序列為二維序列O=(O1,O2),在觀測序列中存在2個維度的特征,且2個維度之間存在關(guān)聯(lián),可使用2個高斯分布的線性組合來描述數(shù)據(jù),即M=2。

    隱狀態(tài)數(shù)目的選擇:GMHMM模型需要定義以對應(yīng)不同的市場隱狀態(tài),使用BIC準(zhǔn)則確定該參數(shù)值。BIC準(zhǔn)則可有效防止模型精度過高造成的模型復(fù)雜度過高,其定義見公式(7)。

    其中n代表樣本大小,k為模型參數(shù)數(shù)量,L為模型的似然函數(shù)。分別計算k在[1,6]范圍內(nèi)對應(yīng)的BIC數(shù)值,數(shù)值越小代表該參數(shù)下的模型越適合現(xiàn)有數(shù)據(jù)集,計算結(jié)果如表3所示。

    表3 不同隱狀態(tài)數(shù)目下的 BIC 值

    由表3可知當(dāng)設(shè)定模型的隱狀態(tài)數(shù)目為5時為最優(yōu),即所有可能的隱狀態(tài)集合Q={q1,q2,…q5},在模型參數(shù)λ=(A,μ,U,π)中,μ參數(shù)應(yīng)為5×2的矩陣,U參數(shù)則應(yīng)為5×2×2的張量。

    3.實驗流程及結(jié)果分析

    實驗共分為2個部分,第一部分是GMHMM模型的建立,第二部分是在GMHMM模型基礎(chǔ)上利用價格預(yù)測算法進行預(yù)測。

    (1)GMHMM模型建立

    首先,在已知觀測序列O=(O1,O2)的情況下,使用Baum-Welch算法得到模型參數(shù)λ=(A,μ,U,π),建立GMHMM模型,然后使用Viterbi算法得到歷史隱狀態(tài)序列S和該序列值對應(yīng)的隱狀態(tài)概率矩陣P。實驗流程見圖1。

    圖1 GMHMM模型建立及訓(xùn)練流程

    A參數(shù)為各隱狀態(tài)之間的轉(zhuǎn)移概率,經(jīng)過計算其值如表4所示。

    表4 A參數(shù)矩陣

    觀察矩陣A發(fā)現(xiàn)主對角線上的概率值較高,可推測若市場處于某狀態(tài),將傾向于繼續(xù)保持該狀態(tài)不變。

    模型的參數(shù)μ表示觀測狀態(tài)在各個隱狀態(tài)下的混合高斯概率密度函數(shù)均值,其值如表5所示。

    表5 參數(shù)μ

    參數(shù)U=[[[0.000 378 08 0.000 241 84],[0.000 241 84 0.000 431 8]],[[0.000 514 19 0.000 437 01],[0.000 437 01 0.000 485 08]],[[0.000 215 94 0.000 149 83],[0.000 149 83 0.000 341 85]],[[0.000 161 19 0.000 119 1],[0.000 119 1 0.000 189 68]],[[0.002 566 17 0.002 492 64],[0.002 492 64]]]。

    初始概率π如表6所示。

    表6 初始概率π

    Viterbi算法可在已知觀測序列O=(O1,O2)的條件下,通過計算最有利于觀測序列O=(O1,O2)出現(xiàn)的隱狀態(tài)概率,得到隱狀態(tài)概率矩陣P=[p1,p2,…pT],并求出最優(yōu)隱狀態(tài)序列S。截取部分隱狀態(tài)概率矩陣P如表7所示。

    表7 隱狀態(tài)概率矩陣

    在表7中,第一天、第二天、第三天市場隱狀態(tài)概率矩陣中,隱狀態(tài)4的概率值最大,因此最優(yōu)隱狀態(tài)序列S=[4,4,4,…]。實驗得到隱狀態(tài)序列,可對訓(xùn)練數(shù)據(jù)集的每天市場隱狀態(tài)值進行觀察分析。為便于觀察,截取數(shù)據(jù)集前180天的數(shù)據(jù),將每天的觀測狀態(tài)對應(yīng)的隱狀態(tài)使用不同標(biāo)記進行區(qū)分,得到的隱狀態(tài)-觀測狀態(tài)匹配圖見圖2。

    圖2 隱狀態(tài)-觀測狀態(tài)匹配情況

    由圖2可知,隱狀態(tài)1對應(yīng)的標(biāo)記“×”出現(xiàn)在觀測狀態(tài)值連續(xù)上升的區(qū)域,推測若市場在隱狀態(tài)1下,螺紋鋼價格上漲可能性大;隱狀態(tài)3對應(yīng)的標(biāo)記“·”出現(xiàn)在觀測狀態(tài)值連續(xù)下跌的區(qū)域,推測若市場在隱狀態(tài)3下,螺紋鋼價格下跌可能性大;隱狀態(tài)4對應(yīng)的“▼”出現(xiàn)在觀測值上下震蕩的區(qū)域,推測若市場在隱狀態(tài)4下,螺紋鋼價格易出現(xiàn)連續(xù)上下波動;隱狀態(tài)2和隱狀態(tài)5和在圖中極少出現(xiàn),結(jié)合隱狀態(tài)轉(zhuǎn)移概率矩陣P分析原因可知,由其余隱狀態(tài)轉(zhuǎn)移到隱狀態(tài)2和隱狀態(tài)5的概率值極小,因此在實驗中所取時段很少出現(xiàn)該隱狀態(tài)。根據(jù)分析結(jié)果可知,該數(shù)據(jù)對應(yīng)的市場隱狀態(tài)分為上漲、下跌、震蕩和其余2種情況存在,基本符合大眾對市場的常識性認(rèn)知。

    (2)價格預(yù)測算法

    在得到GMHMM模型參數(shù)價格后,進行下一步的價格波動預(yù)測。預(yù)測方法基于2個前提:一是“道氏理論”第三條——歷史會重演,因為人類心理具有特殊性且對市場價格波動產(chǎn)生重要影響,當(dāng)市場參與者心理表現(xiàn)出的規(guī)律性反映在價格走勢上,市場價格便會出現(xiàn)“重復(fù)式”走勢,歷史便會重演[13];二是HMM模型的“模式識別”特性,即HMM可以尋找歷史上與今天的隱狀態(tài)最為相似的時刻。

    通過GMHMM模型建立得到隱狀態(tài)概率矩陣P和歷史隱狀態(tài)序列S,在歷史序列中取與最后一日的隱狀態(tài)概率值最接近的單日或多日,將這單日或多日的下一日的觀測值的變化作為最后一日的下一日的變化值。對單日匹配預(yù)測法和多日加權(quán)預(yù)測作對比,分別觀察其在預(yù)測長度為30天時的性能。

    ——單日匹配預(yù)測法的步驟為:

    第一,通過隱狀態(tài)概率矩陣,確定訓(xùn)練集最后一天的隱狀態(tài)qT,以及這個狀態(tài)在隱狀態(tài)概率矩陣中對應(yīng)的概率值pqT;

    第二,選取狀態(tài)序列概率矩陣P中隱狀態(tài)為qT的列,在歷史概率值中尋找與概率值pqT最相近的1天,記為t0,與該天對應(yīng)的隱狀態(tài)概率值記為pt0;

    第三,在訓(xùn)練集中取出t0對應(yīng)的觀測狀態(tài)值Ot0=(Ot01,Ot02),以及這天的下一天的觀測狀態(tài)值Ot0+1=O(t0+11O,t0+12);

    第四,預(yù)測訓(xùn)練集最后一天的下一天的觀測值為公式(8):

    第五,將預(yù)測值OT+1加入訓(xùn)練集以生成新的訓(xùn)練集,重新輸入模型,使用Viterbi算法重新計算新的狀態(tài)序列概率矩陣,回到算法的第一步開始重復(fù)運行算法,直到預(yù)測值序列到達(dá)測試集長度。

    ——多日加權(quán)預(yù)測法的步驟為:

    第一,通過隱狀態(tài)概率矩陣,確定訓(xùn)練集最后一天的隱狀態(tài)qT,以及該狀態(tài)在隱狀態(tài)概率矩陣中對應(yīng)的概率值pqT;

    第二,選取狀態(tài)序列概率矩陣P中隱狀態(tài)為qT的列,在歷史概率值中尋找與概率值pqT最相近的5天,分別為t1、t2、t3、t4、t5,與這5天對應(yīng)的隱狀態(tài)概率值記為pt1、pt2、pt3、pt4、pt5;

    第三,令i=5,根據(jù)pti與pqT的相近程度計算權(quán)重值,使權(quán)重值的大小與pti和pqT的相近程度成正比,按公式(9)進行計算:

    第四,在訓(xùn)練集中取出t1、t2、t3、t4、t5對應(yīng)的觀測狀態(tài)值Oti=(Oti1,Oti2),以及這5天的每一天的下一天的觀測狀態(tài)值Oti+1=(Oti+11,Oti+12),i=1,2,…5;

    第五,預(yù)測訓(xùn)練集最后一天的下一天的觀測值

    第六,將預(yù)測值OT+1加入訓(xùn)練集以生成新的訓(xùn)練集,重新輸入模型,使用Viterbi算法重新計算新的狀態(tài)序列概率矩陣,回到算法的第一步開始重復(fù)運行算法,直到預(yù)測值序列到達(dá)測試集長度。

    分別使用單日和多日加權(quán)預(yù)測法,將二者得到的預(yù)測值與測試集進行對比,得到單日匹配預(yù)測法預(yù)測擬合圖和多日加權(quán)預(yù)測法預(yù)測擬合圖,分別如圖3和圖4所示。

    圖3 單日匹配預(yù)測法預(yù)擬合

    圖4 多日加權(quán)預(yù)測法預(yù)擬合

    由圖3和圖4可知:單日匹配預(yù)測能在大體上預(yù)測行情的走勢,但精準(zhǔn)度欠缺;多日加權(quán)預(yù)測在長期的預(yù)測中有更好的表現(xiàn),一般情況下能對觀測值的上升和下降有較好的預(yù)測,但在預(yù)測時段后期的擬合程度下降。

    使用常見的預(yù)測評估指標(biāo)平均絕對誤差(Mean Absolute Error,MAE)和相對誤差絕對值平均(Mean Absolute Percentage Error,MAPE)來評估2種預(yù)測方法,2種指標(biāo)的定義如公式(11)和公式(12)。

    分別計算單日匹配預(yù)測法和多日加權(quán)預(yù)測法的MAE、MAPE值,結(jié)果如表8所示。

    表8 模型預(yù)測精度對比

    由表8可知,多日加權(quán)預(yù)測的MAE值和MAPE值均小于單日匹配預(yù)測,說明在預(yù)測長度為30天時,多日加權(quán)預(yù)測的性能優(yōu)于單日匹配預(yù)測。多日加權(quán)預(yù)測法預(yù)測天數(shù)比單日匹配預(yù)測法要長,MAPE值小于1意味著模型具有可行性。

    四、結(jié)束語

    1.研究結(jié)論與不足

    本文通過GMHMM模型對螺紋鋼行情的走向進行預(yù)測,證明該模型可通過混合高斯概率密度函數(shù)較好地刻畫市場行情序列,并且可結(jié)合市場的“歷史重演”模式和隱馬爾可夫的“模式識別”特性進行短期預(yù)測。同時,研究具有一些不足:在指標(biāo)選取上,模型輸入只包含螺紋鋼的行情數(shù)據(jù),但螺紋鋼的行情與螺紋鋼上游產(chǎn)品如鐵礦石和熱卷存在一定的關(guān)聯(lián)關(guān)系,未來可考慮將其加入模型輸入指標(biāo);在模型可行性上,隱馬爾可夫模型假設(shè)每一天的狀態(tài)僅與前一天的狀態(tài)相關(guān),在實際狀況中可能還受其他時刻狀態(tài)的影響,因此可將觀測狀態(tài)與自回歸模型結(jié)合,認(rèn)為隱狀態(tài)會產(chǎn)生一系列相互轉(zhuǎn)化的觀測狀態(tài)。

    2.與已發(fā)表的研究結(jié)果的異同

    先前研究主要在期貨市場應(yīng)用HMM模型,近年來B2B鋼鐵交易市場的發(fā)展使得螺紋鋼行情預(yù)測成為新需要,本文根據(jù)數(shù)據(jù)指標(biāo)選取改進的GMHMM模型進行預(yù)測。

    3.實用價值及意義

    本文對大宗商品螺紋鋼行情市場的數(shù)據(jù)進行分析和預(yù)測,證明GMHMM模型可用于螺紋鋼行情的走勢預(yù)測,幫助使用者在B2B螺紋鋼電子貿(mào)易市場中進行貿(mào)易決策,具有一定的實用價值。下一步的工作可站在鋼貿(mào)商的角度,探究和利用預(yù)測結(jié)果和動態(tài)規(guī)劃思想進行庫存策略優(yōu)化,以期獲得最大的貿(mào)易利潤。

    猜你喜歡
    螺紋鋼概率觀測
    觀測到恒星死亡瞬間
    軍事文摘(2023年18期)2023-11-03 09:45:42
    第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
    第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
    技術(shù)創(chuàng)新促進昆鋼螺紋鋼產(chǎn)品升級
    昆鋼科技(2021年4期)2021-11-06 05:30:56
    概率與統(tǒng)計(一)
    概率與統(tǒng)計(二)
    精軋螺紋鋼
    天測與測地VLBI 測地站周圍地形觀測遮掩的討論
    可觀測宇宙
    太空探索(2016年7期)2016-07-10 12:10:15
    Ф32、Ф36 規(guī)格螺紋鋼生產(chǎn)能效提升
    遂昌县| 延边| 阿拉善左旗| 汾阳市| 满城县| 开原市| 定襄县| 周宁县| 绥化市| 嫩江县| 棋牌| 淮滨县| 莱州市| 衡山县| 读书| 旬阳县| 阿拉善左旗| 精河县| 萝北县| 衡阳市| 巴中市| 松滋市| 黄浦区| 安义县| 禹城市| 临汾市| 通州区| 土默特右旗| 萍乡市| 建德市| 闵行区| 枝江市| 武清区| 兴国县| 榆树市| 南澳县| 大方县| 英超| 马山县| 栾城县| 常德市|