朱 玲,金 浩,喬寶明
(1.西安科技大學a理學院;b計算機科學與技術(shù)學院,西安 710054;2.重慶移通學院 公共大數(shù)據(jù)安全技術(shù)重慶市重點實驗室,重慶 401420)
自20 世紀20 年代以來,變點問題一直是國內(nèi)外學者研究的熱點,變點檢測在經(jīng)濟、金融、工業(yè)等領(lǐng)域均有著重要的應(yīng)用,尤其是對位置參數(shù)的統(tǒng)計推斷研究引起了國內(nèi)外學者的廣泛關(guān)注。目前,對位置參數(shù)的統(tǒng)計推斷研究主要從數(shù)據(jù)殘差序列、變點數(shù)量、統(tǒng)計量、估計方法、抽樣方法等方面展開。在殘差序列方面,對于獨立正態(tài)分布序列,Sen 和Srivastava(1975)[1]、Worsley(2012)[2]較早使用極大似然估計方法對相似的獨立正態(tài)序列位置參數(shù)變點進行遞歸檢驗,但此類檢驗方法的功效不足。隨后,Hawkins(2012)[3]分別利用貝葉斯和最大似然比兩種方法研究了結(jié)構(gòu)變點,得到了原假設(shè)下的漸近分布。
上述變點研究只考慮了時間序列獨立或?qū)儆诟咚狗植嫉那闆r,然而,對于具有尖峰重尾特點的經(jīng)濟和金融數(shù)據(jù),傳統(tǒng)的研究方法可能不再適用。如高奎(2020)[4]結(jié)合金融數(shù)據(jù)的特點,對尖峰重尾序列的位置參數(shù)變點進行統(tǒng)計推斷,發(fā)現(xiàn)當尾部分布顯著偏離正態(tài)分布時,基于最小二乘估計的累積和檢驗的經(jīng)驗水平會出現(xiàn)嚴重扭曲。金浩等(2022)[5]研究了動態(tài)序列下的時變方差相依序列位置結(jié)構(gòu)變點的比值型檢驗。針對具有尖峰重尾特點的序列,Robert等(2006)[6]提出了一種基于LAD的穩(wěn)健KPSS檢驗,證明了在重尾情況下LAD 顯著優(yōu)于基于最小二乘估計的KPSS檢驗。隨后,MacKinnon等(2021)[7]討論了無限方差高階自回歸在M估計下的檢驗,并證明了在原假設(shè)下漸近分布是一個布朗橋,進一步拓展了M估計的研究。然而,累積和檢驗方法仍然需要對長期方差進行估計,而長期方差形式復(fù)雜,極大地增加了估計的難度。為了解決這個難題,Horvath 等(2008)[8]提出了比值型檢驗統(tǒng)計量,并探討了采用其他比值型檢驗統(tǒng)計量進行研究的可行性。大量研究表明,比值型檢驗統(tǒng)計量對于需要估計長期方差的變點檢驗較為適用。
為獲得更精確的臨界值,針對序列的強混合性,常用的方法是通過重抽樣方法逼近統(tǒng)計量的漸近分布。Bertail(1994)[9]研究了殘差為獨立同分布序列的重抽樣性質(zhì)。針對序列的特點,MacKinnon 等(2021)[7]介紹了Wild Bootstrap抽樣方法,并根據(jù)不同核函數(shù)研究其逼近的有效性。Paparoditis 和Dimitris(2003)[10]指出,對于強混合序列,簡單的重抽樣方法存在較大的不足,而Block Bootstrap抽樣方法可最大程度地保留原始序列的相依性,從而使得檢驗統(tǒng)計量不會因序列強相依性而出現(xiàn)經(jīng)驗勢值偏低的現(xiàn)象。因此,本文從序列的強混合性特點、統(tǒng)計量及其魯棒性檢驗三個方面考慮,選擇Block Bootstrap抽樣方法,基于M估計構(gòu)建強混合重尾序列下的比值型檢驗統(tǒng)計量,以達到有效檢測位置參數(shù)結(jié)構(gòu)變點的目的。
假定序列y1,y2,…,yn最多存在一個變點,其基本模型為:
其中,μ1、μ2是固定但未知的水平位置結(jié)構(gòu)參數(shù),s*是變點位置,εt是隨機誤差項,I{?}是示性函數(shù),[·]表示向上取整。
若時間序列y1,y2,…,yn滿足式(1),則考慮位置參數(shù)變點的檢驗問題。設(shè)原假設(shè)下不存在位置參數(shù)變點,即:
H0:μ1=μ2=μ
而備擇假設(shè)下最多存在一個變點,變點時刻s*?(0,1),即:
為保證檢驗的漸近有效性,對新息過程{εt} 和M估計函數(shù)ψM(?)提出如下假設(shè):
假設(shè)1:{εt} 是嚴平穩(wěn)α-混合序列,對于某些有限的χ>0,χ'>0,存在常數(shù)C(χ,χ')>0 滿足:
其中,α(h)(h=0,1,…)是α-混合系數(shù)。
假設(shè)2:{εt} 的分布F位于穩(wěn)定吸收域中,其尾部指數(shù)κ?(0,2],當κ>1 時,有E(εt)=0;當κ≤1 時,{εt} 是一個對稱分布。
假設(shè)3:隨機變量ψM(εt)滿足如下假設(shè):
(1)E(ψM(εt))=0;
(3)0<|E(ψ'M(εt))|<+∞,且對某些β>1有E|ψ'M(εt)|β<+∞;
M估計是穩(wěn)健統(tǒng)計中最基本的方法,由Huber在1954年對極大似然估計加以推廣而來。在考慮比值型檢驗統(tǒng)計量前,先給出參數(shù)M估計的定義。選定一個在R上的非負凸函數(shù)ρ,令:
其中,ρ是損失函數(shù),有ρ'=ψM。為了方便統(tǒng)計量的構(gòu)建,以ψM函數(shù)的形式重新表示式(3):
其中,θ?為θ的M估計。
M 估計是一個大框架,包括經(jīng)典的最小二乘估計、標準的Huber 函數(shù)、最小絕對偏差估計、截尾函數(shù)估計等。由于累積和統(tǒng)計量需要對長期方差進行估計,而該估計較為困難,因此,為了避免該缺陷,本文在Horvath 等(2008)[11]、Pestova 和Pesta(2018)[12]檢驗思想的啟發(fā)下,提出基于M估計的比值型檢驗。統(tǒng)計量定義如下:
其中,μ?(ψM)是對據(jù)數(shù)據(jù)y1,y2,…,yn進行M 估計得到的位置參數(shù)估計值;類似地,μ?1(ψM)和μ?2(ψM)分別是對y1,y2,…,y[ns]和y[ns]+1,y[ns]+2,…,yn進行M 估計得到的位置參數(shù)估計值。
為得到檢驗統(tǒng)計量在原假設(shè)下的漸近分布,先給出M估計相合性的引理。
引理1:如果假設(shè)1 至假設(shè)3 成立,那么在原假設(shè)H0下,有:
其中,B(?)表示一般的布朗運動。
證明:首先定義凸函數(shù)ρ,其表示為:
其中,u=n12(μ-μ?(ψM))。對Zn(u)在u=0 附近進行一階泰勒展開,有:
結(jié)合式(6)和式(7),本文重寫式(5),得到:
利用導(dǎo)數(shù)的性質(zhì)計算式(8)的最小值。令:
本文得到原假設(shè)下參數(shù)基于M估計的一致性,其可表示為:
引理1得證。(μ-μ?1(ψM))和(μ-μ?2(ψM))的證明過程與之類似,本文不再贅述。
定理1:假設(shè)yt由式(1)生成,若原假設(shè)H0和假設(shè)1至假設(shè)3成立,則當n→+∞時,有:
證明:假設(shè)μ=0,有:
其中,B(s)(0
在滿足假設(shè)1 至假設(shè)3 的條件下,結(jié)合Huskova 和Marusiakova(2012)[13]的研究中的引理4.3 和引理4.4,本文定義Ξn的分子為Λ1:
其中,ψM(ε?t)=ψM(εt+μ-μ?(ψM)) 。重新構(gòu)造基于M估計的殘差形式為:
利用微分中值定理、引理1關(guān)于參數(shù)u的全覆蓋定理和ψ'M(εt)的中心極限定理,有:
因此,本文得到分子的漸近分布形式是一個布朗運動,即:
類似地,定義Ξn的分母為Λ2:
進一步區(qū)分分母的兩個部分,分別用Λ21和Λ22表示:
與分子的證明類似,在滿足中心極限定理的條件下,對應(yīng)分母第一部分的漸近分布形式為:
同理,得到分母第二部分的漸近分布形式為:
結(jié)合式(10)至式(12),得到原假設(shè)下檢驗統(tǒng)計量的漸近分布,即當n→∞時,有:
定理1得證。
引理2:如果假設(shè)1 至假設(shè)3 成立,那么在原假設(shè)H1下,有:
(1)當i=1,2 時,μ?(ψM)-μi=Op(1);
(2)當s*≠s時或者(1)成立;
(3)當s*=s時,n12(μ?1(ψM)-μ1) 和n12(μ?1(ψM)-μ2)有與引理1相同的漸近分布。
證明:以引理2 中的第(1)條為例,與引理1 的證明思想類似,先定義備擇假設(shè)下的凸函數(shù)ρ,零變點時刻為s*,則有:
利用反證法,先假設(shè)u=(μ-μ?(ψM))=op(1)。為了證明的方便,定義Zn(u)=Z1n(u)+Z2n(u),具體可表示為:
固定Z2n(u) ,使得Z1n(u) 達到最小,且對Z1n(u)(式(14))在u=0 處進行一階泰勒展開,有:
當滿足u=(μ-μ?(ψM))=op(1)時,Z1n(u)達到最小。而在備擇假設(shè)下,參數(shù)估計的一致性還要求Z2n(u)同時達到最小。因此,利用相同的思想,對Z2n(u)(式(15))在u=0處進行泰勒展開,有:
并且滿足:
此時,備擇假設(shè)下參數(shù)估計的一致性與式(16)和式(17)矛盾,所以u=(μ-μ?(ψM))=op(1) 只能使Z1n(u) 或者Z2n(u)其中一個達到最小,不能使Zn(u)的兩個部分同時達到最小,與反證法中的原假設(shè)矛盾。因此,在備擇假設(shè)下,參數(shù)估計是不一致的。同理,μ?1(ψM)和μ?2(ψM)各自的有偏估計證明與之類似,本文不再贅述,且最終對參數(shù)估計的分類如引理2中的第(2)條和第(3)條所示。引理2得證。
定理2:假設(shè)yt由式(1)生成,若備擇假設(shè)H1和假設(shè)1至假設(shè)4成立,則有Ξn=Ξn(s*)。當n→∞時,有:
證明:受變點的影響,備擇假設(shè)下檢驗統(tǒng)計量的發(fā)散性證明需要考慮三種情況:(1)s>s*;(2)s
當s>s*時,用μ1表示基于觀察數(shù)據(jù)y1,y2,…,y[ns*]的位置參數(shù),用μ2表示基于觀察數(shù)據(jù)y[ns*]+1,y[ns*]+2,…,yn的位置參數(shù)。在備擇假設(shè)下,結(jié)合引理2,具體考慮μ?(ψM)-μ1=Op(1),μ?(ψM)-μ2=op(1)的情況,其中,μ?(ψM)是參數(shù)μ的M估計值。令Ξn的分子為Γ1:
式(18)中的第二項起決定性作用。
當s>s*時,變點在前半部分,分母的第一項受變點影響,而分母的第二項與原假設(shè)相同,且對應(yīng)分母的第二項的發(fā)散速度為n12,只需將分母的第一部分重寫為:
進一步考慮μ?1(ψM)-μ1=Op(1) ,μ?1(ψM)-μ2=Op(1) ,μ?2(ψM)-μ2=op(1)的情況:
因此,結(jié)合式(19)和式(20)可知,分母的第一部分的發(fā)散速度為n。最后,結(jié)合式(18)至式(20)可得:
綜上,統(tǒng)計量Ξn=Op(1) 。當s
定理2得證。
從理論角度分析,檢驗統(tǒng)計量在原假設(shè)下的漸近分布的顯式形式是布朗運動的泛函,但其十分復(fù)雜,不能有效確定臨界值。因此,選擇一個科學的方法確定臨界值意義重大。不失一般性,本文考慮重抽樣方法中較為合適的Block Bootstrap抽樣方法。后文將分別用經(jīng)驗水平和經(jīng)驗勢體現(xiàn)原假設(shè)和備擇假設(shè)下的檢驗功效。具體步驟如下:
步驟1:基于觀測值y1,y2,…,yn計算M估計μ?(ψM)。
步驟2:計算殘差ε?t=yt-μ?(ψM),t=1,2,…,n。
步驟4:選擇正整數(shù)m(m 定理3:如果定理1成立,且m→∞,m/n→0,那么當n→∞時,有: 證明:定理3的證明與定理1的證明類似,只需要補充證明Block Bootstrap 樣本下參數(shù)估計的一致性即可。首先,有與式(9)相同的定義: 其次,需要證明Block Bootstrap 樣本中殘差部分和的收斂性。定義[hs]=[[Ls]/m],得到: 最后,當?shù)玫脚c引理1 相同的前提后,構(gòu)造類似的凸函數(shù)ρ。同理,可得到與引理1相似的結(jié)論,有: 樣本前半段和后半段子樣本對應(yīng)參數(shù)估計的一致性證明過程與之類似,本文不再贅述。 定理3證畢。 本文通過蒙特卡洛數(shù)值仿真來闡明基于Block Bootstrap抽樣的比值型檢驗在結(jié)構(gòu)變點研究中的有效性。大量文獻認為m=Cn13是較為合適的,本文沿用該思想,定義C=5,在數(shù)值模擬中進行具體研究。設(shè)定基于M 估計的比值型檢驗統(tǒng)計量Ξn(s)包含的損失函數(shù)為ψM(x)=x,x?R,表示經(jīng)典的最小二乘估計(LS);ψM(x)=xΙ{|x|≤K}+Ksgn(x)Ι{|x|>K},x?R ,表示標準的Huber 函數(shù),K=1.345。進一步,設(shè)定數(shù)據(jù)yt的生成過程為: 其中,{εt} 是一個強混合序列。為了分析不同相依程度下檢驗統(tǒng)計量的檢測效果,本文主要考慮兩種情況:(1){εt}是一個AR(1)過程,εt=βεt-1+ηt,其中,{ηt} 是獨立同分布的重尾序列;(2){εt} 是一個AR(1)-AR(1)過程,εt=βεt-1+ηt且ηt=θηt+ξt,其中,{ξt} 是獨立同分布重尾序列。尾指數(shù)κ?{0.2,0.4,0.6,0.8,1.2,1.4,1.6,1.8,2.0}。不失一般性,設(shè)定β=-0.6,θ=0.6,跳躍幅度??{0.5,1,1.5},變點位置s*?{0.3,0.5,0.7} ,顯 著 性 水 平α=0.05 ,樣 本 量N?{300,500,1000},循環(huán)3000次。 圖1表示在弱相依情況下最小二乘估計和Huber函數(shù)估計對應(yīng)的經(jīng)驗水平,橫軸表示尾指數(shù),縱軸表示檢驗統(tǒng)計量在原假設(shè)下的經(jīng)驗水平,其中實線代表基于最小二乘估計(LS)的拒絕概率,虛線代表基于Huber函數(shù)估計(Huber)的拒絕概率。根據(jù)觀察,圖1展示的最小二乘估計和Huber 函數(shù)估計對應(yīng)的經(jīng)驗水平都在5%的水平附近波動,在弱相依情況下,能夠較好地支持原假設(shè)。 圖1 比值型檢驗在H0 下的經(jīng)驗水平,εt ~AR(1) 圖2表示在強相依情況下,最小二乘估計出現(xiàn)輕微扭曲,但該扭曲在可接受范圍內(nèi),且隨著尾指數(shù)和樣本容量的增加,扭曲程度逐漸減小。而Huber函數(shù)估計的經(jīng)驗水平仍然在5%的水平附近波動,說明Huber 函數(shù)估計較最小二乘估計能更好地支持原假設(shè)。同樣,隨著樣本量N的增大,經(jīng)驗水平波動程度減小。因此,在原假設(shè)下,基于Block Bootstrap 抽樣的Huber 函數(shù)估計統(tǒng)計量能有效控制強混合重尾序列的經(jīng)驗水平。 圖2 比值型檢驗在H0 下的經(jīng)驗水平,εt ~AR(1)-AR(1) 圖3表示在弱相依情況下最小二乘估計和Huber函數(shù)估計對應(yīng)的經(jīng)驗水平,橫軸表示尾指數(shù),縱軸表示檢驗統(tǒng)計量在備擇假設(shè)下的經(jīng)驗水平,其中低灰度的實線、虛線、點線分別代表變點位置在0.3、0.5 和0.7 處基于最小二乘估計(LS)的拒絕概率,高灰度的代表基于Huber函數(shù)估計(Huber)的拒絕概率?;贛估計的比值型檢驗統(tǒng)計量在備擇假設(shè)下的經(jīng)驗水平受樣本量、跳躍幅度、變點時刻、尾指數(shù)等因素的影響。 圖3 比值型檢驗在H1 下的經(jīng)驗勢,εt ~AR(1),s*=0.3,0.5,0.7 不難發(fā)現(xiàn),經(jīng)驗勢具備以下特點:(1)經(jīng)驗勢隨著樣本容量N的增加而增加,且逐漸趨于1。(2)跳躍幅度?的增加使得經(jīng)驗勢也相應(yīng)增加。(3)當變點位置s*=0.5 時,LS的經(jīng)驗勢略大于變點位置為s*=0.3,0.7 時對應(yīng)的經(jīng)驗勢。這說明,變點時刻越接近樣本中心,LS 的經(jīng)驗勢越大,也越易檢測;而當變點位置在前端和后端時,經(jīng)驗勢有所下降,雖兩者相差不大,但檢測效果均有一定的降低,該結(jié)果與已有結(jié)果相似。(4)Huber 函數(shù)估計下統(tǒng)計量的經(jīng)驗勢隨著變點時刻的靠后而變大,尤其當變點時刻s*=0.7時,經(jīng)驗勢達到最大,這是因為變點時刻越靠后,統(tǒng)計量發(fā)散得越快。本文發(fā)現(xiàn)上述特征與定理2 的結(jié)論一致。(5)經(jīng)驗勢隨著尾指數(shù)增加而增加。 圖4 表示在強相依情況下,最小二乘估計和Huber 函數(shù)估計對應(yīng)的經(jīng)驗勢。 圖4 比值型檢驗在H1 下的經(jīng)驗勢,εt ~AR(1)-AR(1), s*=0.3,0.5,0.7 圖4中展現(xiàn)的規(guī)律與圖3基本類似,但需要注意的是,在強相依情況下,LS 的經(jīng)驗勢明顯低于弱相依情況下的經(jīng)驗勢,這是因為序列的強關(guān)聯(lián)性導(dǎo)致統(tǒng)計量過于保守,無法有效拒絕原假設(shè)。并且,在強相依情況下,當跳躍幅度?=0.5 時,統(tǒng)計量在Huber函數(shù)估計和最小二乘估計下的經(jīng)驗勢均較小,但Huber 經(jīng)驗勢略高;而當跳躍幅度?=1,1.5 時,Huber 經(jīng)驗勢隨之顯著增加,且在尾部較重的情況下拒絕概率仍比LS經(jīng)驗勢高。說明當跳躍幅度較小時,經(jīng)驗勢主要由跳躍幅度控制;但當跳躍幅度較大時,統(tǒng)計量對應(yīng)的尾部異常值在Huber 函數(shù)估計下的經(jīng)驗勢中起主導(dǎo)作用。而受強相依情況的影響,經(jīng)驗勢隨著尾指數(shù)增加的程度與弱相依情況下的程度不同。當κ≤0.8時,LS的經(jīng)驗勢不超過0.1,這說明基于最小二乘估計的比值型檢驗對重尾序列的位置參數(shù)變點檢測幾乎是失效的;當κ>0.8 時,隨著尾指數(shù)的增加,LS 的經(jīng)驗勢隨之增加;尤其是當κ>1.6 時,LS 的經(jīng)驗勢增加幅度較為顯著。當0.6<κ≤1.4 時,Huber的經(jīng)驗勢明顯高于LS的經(jīng)驗勢;而當1.4<κ≤1.8 時,Huber的經(jīng)驗勢和LS的經(jīng)驗勢相差不大。 結(jié)合圖3 和圖4 不難發(fā)現(xiàn),雖然在近高斯過程下,LS的經(jīng)驗勢略高于Huber的經(jīng)驗勢,但這種情況會隨著樣本量和跳躍幅度的增加而消失。即使在不同尾指數(shù)和相依程度下,估計方法也各有優(yōu)勢,但對于強混合重尾序列,尤其是在異常值較多的情況下,最小二乘估計不再適用,而以Huber函數(shù)估計為例的M估計將更有效。 本文通過一組財經(jīng)數(shù)據(jù)對所提方法在實際應(yīng)用中的可行性進行說明。采用2020年10月15日至2022年8月3日共370 個交易日的港幣對人民幣匯率數(shù)據(jù)進行實證分析,數(shù)據(jù)來源于https://www.chinamoney.com.cn/chinese/bkccpr/。港幣對人民幣匯率標準化后的數(shù)據(jù)為yt,如圖5所示。 圖5 港幣對人民幣匯率標準化后的數(shù)據(jù)(2020年10月15日至2022年8月3日) 從圖5中可以發(fā)現(xiàn),數(shù)據(jù)yt在水平方向存在明顯的結(jié)構(gòu)變化,將數(shù)據(jù)yt代入檢驗統(tǒng)計量,得到Ξn=1.0083。由數(shù)值模擬可知,利用Block Bootstrap 抽樣方法確定的臨界值Ξ0.05=0.8466。因此,在顯著性水平α=0.05 的條件下,Ξn>Ξα,應(yīng)當拒絕不存在變點的原假設(shè)。利用Pestova 和Pesta(2018)[11]的研究中的變點估計思想,選擇Huber 函數(shù)估計對變點時刻進行估計,得到s*=0.8297。根據(jù)變點位置,匯率在2022年1月13日發(fā)生突變,整個樣本序列被分為[1,306]和[307,370]兩段,并計算得到前半段樣本的水平位置參數(shù)估為-0.3588,后半段樣本的水平位置參數(shù)為1.7154,其跳躍幅度大約為2。究其原因,2022年國家根據(jù)國內(nèi)實體經(jīng)濟運行情況選擇降準和降息,即中美貨幣政策脫鉤,人民幣承壓貶值,因此相應(yīng)港幣對人民幣匯率上升。 本文提出基于M 估計的比值型統(tǒng)計量來檢驗強混合重尾序列位置參數(shù)結(jié)構(gòu)變點。首先,在基于最小二乘估計的累積和統(tǒng)計量對強混合重尾序列位置參數(shù)變點進行檢驗的基礎(chǔ)上,將尾指數(shù)拓展到(0,2],并構(gòu)造基于M 估計的比值型統(tǒng)計量,從而避免了長期方差估計的問題;其次,不同于傳統(tǒng)最小二乘估計下統(tǒng)計量的漸近分布是列維分布泛函,基于M估計的比值型統(tǒng)計量在原假設(shè)下的漸近分布是布朗運動的泛函,并證明了備擇假設(shè)下統(tǒng)計量的一致性;最后,考慮到序列的強混合性,利用Block Bootstrap 抽樣方法來逼近極限分布以獲得更為精確的臨界值,從而實現(xiàn)對重尾序列位置參數(shù)變點的檢驗。數(shù)值模擬和實證分析結(jié)果表明,在重尾情況下,本文給出的基于M估計的檢驗方法是檢測強混合序列位置參數(shù)變點的有效工具。3 數(shù)值模擬
4 實證分析
5 結(jié)束語