朱 旭,龐天曉
(浙江大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,浙江杭州 310058)
許多經(jīng)濟(jì)和金融時間序列的數(shù)據(jù)都具有單變點(diǎn)或者多變點(diǎn)的特征,參見Bai和Perron[1],Hansen[2],Lee等[3],以及Perron和Zhu[4].此外眾所周知,經(jīng)濟(jì)和金融數(shù)據(jù)往往還具有長相依的特征.例如日元兌美元的匯率數(shù)據(jù)被廣泛認(rèn)為存在長相依,參見Horv′ath和Kokoszka[5].因此在處理實(shí)際數(shù)據(jù)時,往往面臨結(jié)構(gòu)變點(diǎn)和長相依同時存在的情形.例如Jaruˇskov′a[6]在非平穩(wěn)的長周期的水文數(shù)據(jù)中發(fā)現(xiàn)了長相依的證據(jù),同時認(rèn)為數(shù)據(jù)中存在結(jié)構(gòu)變點(diǎn).大量的研究表明,長相依的存在會使傳統(tǒng)的變點(diǎn)理論失效.因此對長相依數(shù)據(jù)進(jìn)行變點(diǎn)分析既具有理論意義,也具有實(shí)際意義.
有相當(dāng)多的文章研究了長相依時間序列中的結(jié)構(gòu)變點(diǎn).例如Kuan和Hsu[7]研究了均值變點(diǎn)并給出了估計(jì)量的收斂速度.Chang和Perron[8]研究了參數(shù)為d的分整(fractionally integrated)過程中的斜率和均值變點(diǎn),并給出了估計(jì)量的收斂速度和極限分布.Perron和Qu[9]提出用周期圖來研究股票指數(shù)回報(bào)的波動率,發(fā)現(xiàn)存在長相依和均值漂移.Shao[10]提出一種檢驗(yàn)流程來檢驗(yàn)長相依時間序列中的均值變點(diǎn).Iacone等作者[11]提出一種檢驗(yàn)流程來檢驗(yàn)參數(shù)為d的分整時間序列中的斜率變點(diǎn).
面板數(shù)據(jù)中存在公共變點(diǎn)的現(xiàn)象在實(shí)際生活中非常普遍.例如稅收政策的變化可能會影響每個人的收入.另一個著名的例子是2008年發(fā)生的全球金融危機(jī)幾乎影響了所有國家的GDP(Gross Domestic Product)數(shù)據(jù)和資本市場表現(xiàn),并帶來一定時間內(nèi)持續(xù)的影響.類似地,新的科學(xué)技術(shù)的誕生,新藥的研發(fā)生產(chǎn),以及政府層面新的政策措施都會對經(jīng)濟(jì)社會造成或多或少的影響.
結(jié)構(gòu)變點(diǎn)從時間序列的研究延申到面板數(shù)據(jù)的研究可以追溯到1990年.Joseph和Wolfson是最早的一批研究面板數(shù)據(jù)中的結(jié)構(gòu)變點(diǎn)的學(xué)者[12-13],他們提出了N個面板上存在獨(dú)立同分布的N個變點(diǎn)的隨機(jī)變點(diǎn)模型,并給出了變點(diǎn)分布的相合估計(jì)量.不久后隨機(jī)變點(diǎn)模型被Joseph等[14]推廣到了自回歸模型.Bai[15]利用最小二乘的方法估計(jì)了面板數(shù)據(jù)中的公共均值變點(diǎn),同時證實(shí)了變點(diǎn)估計(jì)量是相合的,這與平穩(wěn)時間序列中變點(diǎn)估計(jì)量是不相合的結(jié)論截然相反.值得一提的是,以上文章中的面板數(shù)據(jù)都是假設(shè)橫截面獨(dú)立的.此后,面板數(shù)據(jù)中的公共變點(diǎn)研究得到了計(jì)量經(jīng)濟(jì)學(xué)界和統(tǒng)計(jì)學(xué)界的大量關(guān)注,橫截面獨(dú)立的面板數(shù)據(jù)模型也在一些文章中被推廣到了橫截面相依情形.例如,Horv′ath和Huˇskov′a[16]研究了存在橫截面相依的面板數(shù)據(jù)中公共均值變點(diǎn)的檢驗(yàn)問題,Kim[17-18]研究了橫截面相依的面板數(shù)據(jù)中存在斜率變點(diǎn)以及斜率與截距變點(diǎn)同時存在時的變點(diǎn)估計(jì)問題,Li等作者[19]利用自適應(yīng)group fused LASSO懲罰的主成分方法估計(jì)橫截面相依的面板數(shù)據(jù)中的變點(diǎn),Qian和Su[20]提出了橫截面相依面板數(shù)據(jù)中的公共變點(diǎn)的收縮估計(jì)量,Baltagi等作者[21-22]提出了CCE(common correlated effects)估計(jì)量并把它應(yīng)用于橫截面相依面板數(shù)據(jù)中變點(diǎn)的研究,Westerlund[23]采用了基于CCE的方法對時間長度固定的橫截面相依面板數(shù)據(jù)中的變點(diǎn)進(jìn)行研究.值得注意的是,大部分現(xiàn)有的文獻(xiàn)都假設(shè)面板數(shù)據(jù)在時間維度上是弱相依的,研究長相依面板數(shù)據(jù)中的結(jié)構(gòu)變點(diǎn)的文章相對較少.
本文假設(shè)面板數(shù)據(jù)具有橫截面的相依性,同時每個時間序列都是長相依的(記憶參數(shù)d ∈(0,0.5))且?guī)в行甭首凕c(diǎn).這種模型在宏觀經(jīng)濟(jì)和金融中具有廣泛的應(yīng)用.用最小二乘的方法估計(jì)斜率變點(diǎn)發(fā)生的時刻以及發(fā)生時刻的分?jǐn)?shù),并研究了當(dāng)(T,N)(T表示時間長度,N表示個體數(shù))聯(lián)合趨于無窮時估計(jì)量的漸近性質(zhì): 估計(jì)量的相合性,收斂速度以及極限分布.得到了一些有趣的結(jié)論: 大部分情況下斜率變點(diǎn)估計(jì)量的收斂速度隨著記憶參數(shù)d的增大而減緩,但當(dāng)T和N滿足T2d=o(N),且公因子與變點(diǎn)的變化幅度存在交互效應(yīng)時,變點(diǎn)時刻估計(jì)量的收斂速度僅與T有關(guān).
本文結(jié)構(gòu)如下:§2給出模型的具體形式以及一些假設(shè),§3介紹變點(diǎn)估計(jì)量的漸近性質(zhì),§4給出Monte Carlo模擬結(jié)果,用于評估變點(diǎn)估計(jì)量在有限樣本情形下的表現(xiàn),§5對論文進(jìn)行了總結(jié),文章中的理論證明放在§6.
首先介紹本文接下來需要用到的一些記號.“?”表示概率測度弱收斂(參見Billingsley[24]),“”表示依概率收斂,“”表示依分布收斂,“iid”表示獨(dú)立同分布,aTbT表示存在兩個正常數(shù)c1和c2使得對于所有足夠大的T,c1≤aT/bT ≤c2成立,其中aT和bT是兩個關(guān)于T的取值恒為正的函數(shù).設(shè)D[0,1]是[0,1]上的函數(shù)空間,且是存在左極限和右連續(xù)的Skorohod拓?fù)?對于矩陣A,記‖A‖=[tr(A′A)]1/2,其中tr[·]表示矩陣的跡.此外用M表示正常數(shù),它的取值與T和N無關(guān),但在不同的地方可取不同的值.除非另有說明,本文中的極限均理解為(T,N)→∞,即T和N聯(lián)合趨于無窮.
本文研究的面板數(shù)據(jù)模型為
注假設(shè)1是為了保證變點(diǎn)的可識別性,是變點(diǎn)研究領(lǐng)域中的常見假設(shè).假設(shè)2(1)假設(shè)公因子是一個線性過程并可以應(yīng)用泛函中心極限定理(參見Phillips和Solo[26]).假設(shè)2(2)假設(shè)誤差ei,t在時間維度上是長相依的,但其方差在橫截面維度上可以不同.假設(shè)2(3)是一個技術(shù)性假設(shè),是為了應(yīng)用面板數(shù)據(jù)的聯(lián)合中心極限定理(參見Phillips和Moon[27]).假設(shè)2(4)假設(shè)公因子和模型誤差是相互獨(dú)立的.假設(shè)3和4描述了模型的總體變點(diǎn)強(qiáng)度,公因子的強(qiáng)度,以及變點(diǎn)的變化幅度與公因子之間的相互影響程度.
本節(jié)介紹估計(jì)量?T1的極限性質(zhì).后文中,所有的Op(·)將按照其嚴(yán)格的定義理解,即隨機(jī)變量不會是op(·).
定理3.1若假設(shè)1-4成立,當(dāng)(T,N)→∞,d ∈(0,0.5)時,有下面的結(jié)論.
注以上結(jié)論都表明變點(diǎn)估計(jì)量是相合的.結(jié)論(1)說明在不存在橫截面相依時,收斂速度與記憶參數(shù)d,T和N有關(guān),且d越大收斂速度越慢,這與直覺吻合,因?yàn)閐 ≥0.5時時間序列將變成非平穩(wěn).結(jié)論(2)說明當(dāng)AHγ/0時,即公因子與變點(diǎn)的變化幅度存在交互效應(yīng),如果個體數(shù)N相對于時間長度T并沒有足夠大時,收斂速度依然由d,T和N共同決定,且隨著d的增大而變慢.結(jié)論(3)說明當(dāng)T2d=o(N),即個體數(shù)N相對于時間長度T足夠大時,的收斂速度僅與T有關(guān).
有了收斂速度,接下來推導(dǎo)估計(jì)量的極限分布.有下面的定理.
定理3.2若假設(shè)1-4成立,當(dāng)(T,N)→∞,d ∈(0,0.5)時,有下面的結(jié)論.
注以上的三個結(jié)論表明: 當(dāng)變點(diǎn)分?jǐn)?shù)的真值λ0越接近中間值1/2,或者斜率變點(diǎn)的信號強(qiáng)度越大(即Aγγ越大),則漸近分布的方差越小.
在這一節(jié),將通過Monte Carlo模擬來評估估計(jì)量在有限樣本情形下的表現(xiàn).對所有實(shí)驗(yàn),重復(fù)次數(shù)都為2000次.數(shù)據(jù)由以下過程產(chǎn)生.設(shè)公因子Ft是一維的且滿足Ft=0.2Ft?1+wt,F0=0,wt獨(dú)立同分布于N(0,1);一維因子載荷hi有兩種情況: 若不存在橫截面相依,則對所有的i取hi=0,若公因子與變點(diǎn)的變化幅度存在交互效應(yīng),即AHγ/0,設(shè)hi由U(0,1)隨機(jī)生成;參考McLeod和Hipel[28]以及Hosking[29]的方法,隨機(jī)生成N個長相依時間序列{ei,t,t=1···,T},i=1,···,N,使得(1?L)dei,t=εi,t,εi,t=σiηi,t,其中σi由U(1,1.5) 隨機(jī)生成,{ηi,t,t ≥1,i ≥1}獨(dú)立同分布于N(0,1),記憶參數(shù)根據(jù)具體情況從d ∈{0.05,0.1,0.25,0.4,0.45}中選取.為方便起見,設(shè)定==0,因?yàn)檫@些參數(shù)的大小并不會影響Monte Carlo模擬的結(jié)果,影響模擬結(jié)果的是斜率的變化幅度.設(shè)由U(0,0.3)隨機(jī)生成.此外,設(shè)定變點(diǎn)時刻的真值=0.5T,以及π=0.05.接下來,用直方圖的形式來評估在定理3.1中的表現(xiàn).
圖1展示了(T,N)∈ {(100,10),(100,40),(200,10),(200,20)},d ∈ {0.1,0.25,0.4},所有的hi=0時,的直方圖.橫向比較第一行可以看出估計(jì)量的估計(jì)誤差隨記憶參數(shù)d的增大而增加;依次縱向比較可以看出固定d時估計(jì)誤差隨T和N的增大而減小,這與定理3.1(1)的結(jié)論相符.圖2展示了(T,N)∈{(200,10),(200,20),(400,10),(400,20)},d ∈{0.25,0.4,0.45},公因子與變點(diǎn)的變化幅度存在交互效應(yīng)時,的直方圖,這些T,N,d的設(shè)定是為了保證N=o(T2d)或T2d N能夠被滿足.同樣通過橫向和縱向的比較,可以看出這與定理3.1(2)中的結(jié)論相符.圖3則展示了(T,N)∈{(40,100),(40,200),(100,100),(100,200)},d ∈{0.05,0.1,0.25},公因子與變點(diǎn)的變化幅度存在交互效應(yīng)時,的直方圖,這些T,N,d的設(shè)定是為了保證T2d=o(N)能夠被滿足.橫向比較第一行可以看出變點(diǎn)估計(jì)量的估計(jì)誤差與d無關(guān),縱向比較第一列可以看出估計(jì)誤差與N亦無關(guān),縱向比較第二和三列則可看出變點(diǎn)估計(jì)量的估計(jì)誤差與T有關(guān),T越大估計(jì)誤差越小.以上模擬結(jié)果與定理3.1(3)中的結(jié)論相符.
圖1 當(dāng)所有的hi=0,且N=o(T3?2d)時,的直方圖
圖2 當(dāng)AHγ0,且N=o(T2d)或T2d N時,的直方圖
圖3 當(dāng)AHγ/0,且T2d=o(N)時,的直方圖
最后比較估計(jì)量的有限樣本分布與定理3.2的極限分布.圖4和圖5展示T1/2?dN1/2()在不存在橫截面相依和公因子與變點(diǎn)的變化幅度存在交互效應(yīng)這兩種情況下,估計(jì)量的有限樣本分布與極限分布.可以看出d越小,有限樣本分布與極限分布的逼近效果越好.其次,對于相同的N和d,不存在橫截面相依的情況下有限樣本分布更接近極限分布(即使T更小),這說明公因子的存在會影響估計(jì)量的有限樣本分布.圖6展示了當(dāng)公因子與變點(diǎn)的變化幅度存在交互效應(yīng),且N/T2d收斂到不為零的常數(shù)時,T1/2?dN1/2(?)的有限樣本分布與極限分布.可以看出,兩者的吻合程度較高.最后,圖7展示了當(dāng)公因子與變點(diǎn)的變化幅度存在交互效應(yīng)且T2d=o(N) 時,T1/2()的有限樣本分布與極限分布.可以看出,有限樣本分布與極限分布的吻合度與N和d的關(guān)聯(lián)較小,但當(dāng)T變大時,有限樣本分布更接近極限分布.這些模擬結(jié)果與定理3.2(3)中的結(jié)論相符.
圖4 當(dāng)所有的hi=0,且N=o(T3?2d)時, T1/2?dN1/2( ?)的有限樣本分布和極限分布
圖5 當(dāng)AHγ 0,且N=o(T2d)時, T1/2?dN1/2( ?)的有限樣本分布和極限分布
圖6 當(dāng)AHγ 0,且N/T2d收斂到不為零的常數(shù)時, T1/2?dN1/2( ?)的有限樣本分布和極限分布
圖7 當(dāng)AHγ0,且T2d=o(N)時, T1/2?dN1/2( ?)的有限樣本分布和極限分布
本文研究了面板數(shù)據(jù)同時存在結(jié)構(gòu)變點(diǎn),時間序列長相依以及橫截面相依的變點(diǎn)估計(jì)問題.用最小二乘的方法估計(jì)了變點(diǎn)發(fā)生的時刻,并討論了估計(jì)量的相合性,收斂速度以及極限分布.本文的結(jié)論表明在不存在橫截面相依時,變點(diǎn)時刻的估計(jì)量的收斂速度與記憶參數(shù)d,時間序列長度T以及個體數(shù)N有關(guān),且d越大收斂速度越慢;當(dāng)公因子與變點(diǎn)的變化幅度存在交互效應(yīng),且N相對于T并沒有足夠大時,收斂速度依然由d,T和N共同決定,并隨著d的增大而變慢;然而當(dāng)T2d=o(N),即N相對于T足夠大時,變點(diǎn)時刻估計(jì)量的收斂速度將僅與T有關(guān).最后通過Monte Carlo模擬比較了變點(diǎn)估計(jì)量的有限樣本分布和極限分布,并印證了本文的理論成果.
由式(9)可知,若對所有i都有hi=0,則SXU僅剩其中的第二項(xiàng);若不然,還需要比較式(11)和式(14)階的大小,即比較T2d和N的相對大小.若N=o(T2d),則SXU的階將由式(9)中的第二項(xiàng)決定;若T2d=o(N),則SXU的階將由式(9)中的第一項(xiàng)決定;若T2d和N同階,則SXU的階將由式(9)整體決定.因此在λ ∈(0,1)上一致地有