易瑩瑩
(南京郵電大學經濟與管理學院,南京 210046)
近年來,我國經濟在快速增長的同時,居民的收入差距也在呈不斷擴大的趨勢。收入差距問題成為了國內外學者廣泛關注的熱門話題。家庭收入差距包括兩方面的內容,一方面是指同一代人不同家庭之間的收入差距;另一方面是指同一家庭不同代人之間的收入不平等,即收入的代際流動性。近年來,國內外學者對收入不平等代際轉移程度及相關問題的研究不斷增加。由于家庭背景對于子女的成長及其未來的生活經濟狀況存在一定的影響,代際收入流動衡量的就是子輩的收入在多大程度上是由其父輩收入決定的,從而反映一個社會的機會平等問題,為不平等問題的研究提供了新的視角。機會的不平等意味著一個人除了自身的努力之外的外部因素所帶來收入狀況和社會地位的提升。機會平等與否在一定程度上決定著人們的結果是否平等。
在國外較早就有學者對收入代際流動進行研究,如,Blau&Duncan(1967)、Sewell&Hauser(1975)、Becker&Tomes(1986)等等,他們得出的代際收入流動性較小,不高于0.2,并且得出結論,樣本成員來自一個高度流動的社會。Solon在1992年《美國經濟評論》中對以前的研究提出了尖銳的批評。他認為以前研究中樣本不具有代表性,從而導致代際收入流動程度較低的偏差。他利用美國PSD數據(Production,Supply and Distribution database),建立了三個計量模型,其結果都表明代際收入彈性比較大,代際間收入的繼承性大,而流動性小。他認為,使用有代表性的樣本比用父親收入5年均值或是單一年份收入會對結果產生更重要的影響。自此以后,許多學者通過使用更具代表性的樣本和改進的計量方法研究該問題,發(fā)現美國的跨代收入彈性系數范圍在0.3至0.5之間,瑞典和芬蘭的收入彈性系數范圍在0.3以下,英國約為0.5,德國約為0.43(Solon,1992;Zimmerman,1992;Bjorklund&Jantti,1997;Dearden&Machin,1997;Wiegand,2006)。
與國外研究相比,國內的相關實證研究非常少。最早對代際流動收入做定量研究的當屬王海港(2005)。他利用1988年和1995年中國社會科學院“城鄉(xiāng)居民收入分配課題組”的調查資料,得到1988年和1995年代際收入彈性分別為0.384和0.424。何曉琦和鄧曉嵐(2006)利用對福建省壽寧縣貧困戶的入戶抽樣調查數據進行了實證分析,在模型中,使用父輩2002~2004年的平均收入和子輩2004的收入作為協(xié)變量和響應變量進行回歸,發(fā)現父輩與子輩的跨代收入彈性為0.151。郭叢敏、閔維方(2007)運用Logit模型探討教育促進收入代際流動的功能,他們發(fā)現中國城鎮(zhèn)居民收入代際存在較為明顯的傳遞效應,多數子女依然滯留在與父親相同的收入組群,并且教育有助于促進弱勢群體的子女實現經濟社會地位的躍升,是一種重要的代際流動機制。韓軍輝(2009a;2009b)為了控制地域差別,利用多水平統(tǒng)計模型研究代際收入流動。即第一水平模型主要是控制子輩個體屬性的影響,將父輩收入引入方程來考察代際收入流動性。在此基礎上引入隨機效應作為第二水平模型,說明子輩收入還可能受到地區(qū)變量的影響,最后發(fā)現父輩收入對子輩收入的效應為0.3615,而如果在農村地區(qū)兩者的效應僅為0.2072。汪燕敏、錢珍(2009)綜述了使用代際收入彈性衡量收入代際流動性導致的計量偏誤產生的原因及解決辦法。
縱觀上述研究,代際收入流動問題的研究難點可以歸結為以下三點:第一,樣本數據選擇的同質性問題,同質性往往會導致比較大的估計偏差;第二,如果選擇了具有異質性的樣本,那么周圍家庭環(huán)境、社區(qū)以及地區(qū)經濟也會對子輩收入產生影響;第三,估計方法的選擇問題。以往研究主要是通過最小二乘法。但是Solon指出,由于收入的臨時波動,代際收入彈性是存在偏誤的,因此,他主張使用父親的收入均值計算。Zimmerman則提出使用工具變量法來糾正向下偏誤問題,但在實際應用中,要找到經濟意義明確又與父輩收入高度相關而與隨機擾動項不相關的工具變量是很困難的。
我國收入差距存在城鄉(xiāng)差異,且這個差異有在擴大的趨勢,那么,代際收入流動在城鄉(xiāng)的狀況又是如何的呢?我國處于城鄉(xiāng)二元經濟結構的狀況,因此,研究城鄉(xiāng)居民的代際收入流動狀況具有十分重要的現實意義。綜合前面學者的已有研究,本文的研究目的是分析代際收入流動在城鎮(zhèn)和農村的差異性。針對代際收入流動問題研究的難點,我們根據CHNS微觀數據,引入城鄉(xiāng)和城鄉(xiāng)與父親收入的交互效應作為隨機效應以反映城鎮(zhèn)和農村地區(qū)的經濟差異,建立一線性混合模型,并對隨機效應假設非參分布以放松其分布假設,從而尋求其穩(wěn)健估計。
代際收入流動的研究依據是人力資本理論,以往研究中大多都采用一回歸模型來度量父輩和子輩收入的跨際彈性。
這里,y1i代表子輩的收入,y0i代表父輩的收入,下標1表示子輩,0表示父輩,i代表第i個家庭;x指協(xié)變量向量,代表收入的影響因素;εi為殘差項。在式(1)中如果估計的參數α0=0,表示子輩的收入與父輩沒有聯系,代際收入完全流動;α0=1則表示子輩的收入完全由父輩決定,代際收入完全沒有流動。
但是對于群集數據而言,不同單元的觀測對象存在異質性,而處于同一單元的觀測對象又存在相關性。此時,數據的變異來源于兩方面:群間方差和群內方差。因此,我們既要考慮相同觀察對象的不同觀察值之間的相關性,又要考慮不同觀察對象之間的異質性。一般的線性回歸模型很難描繪它們的這種結構特征。線性混合模型具有復雜的多水平層次結構,通過引進隨機效應反映了不同觀測對象之間的異質性以及同一觀測對象不同觀測值之間的相關性。
式(2)中,β是固定效應參數,反映了總體的平均趨勢,所以它又被稱為總體特定參數(population-specific parameter);x是對應于固定效應的協(xié)變量向量;bi是隨機效應參數,描述了觀測與總體平均趨勢的偏離,所以它又被稱為觀測特定參數(subject-specific parameter);z是對應于隨機效應的協(xié)變量向量。可以看出,該模型的似然函數中包含有高維積分,所以關于它的參數估計往往變得比較復雜。
Verbeke&Molenberghs(2004)對擬合連續(xù)群集數據的線性混合模型進行了詳細介紹。他們認為對固定效應參數、隨機效應參數以及其協(xié)方差矩陣的估計不能通過簡單的極大似然估計法獲得。事實上,早在1948年,Neyman&Scott就指出在一定的觀測個數n下,隨著參數個數的增加,傳統(tǒng)的極大似然估計并不是一致估計量。與傳統(tǒng)學派不同,貝葉斯學派允許隨機效應可以取非正態(tài)分布,從而能夠更好地描述我們對先驗分布的不確定性,并且貝葉斯方法即使是在小樣本條件下,也能獲得精確的后驗分布推斷。但是,Verbeke&Lesaffre(1997)研究了幾種不同的先驗分布對后驗分布推斷的影響,并證明當隨機效應的真實分布是混合正態(tài)分布,但如果只是假設其為簡單的正態(tài)分布,會導致對隨機效應的不一致估計。很自然地,我們考慮將先驗分布從參數分布擴展為非參數分布。
非參數貝葉斯方法由Ferguson在1973年發(fā)表的一篇論文《A Bayesian Analysis of Some Nonparametric Problems》正式提出。基于Ferguson的觀點,對于非參數問題,對先驗分布有兩方面的要求:(1)樣本空間中,先驗分布必須有足夠大的支撐,甚至是包括空間中所有的分布。這就保證了先驗選擇的靈活性與廣泛性,以便于找到最適合模型的分布函數。(2)在真概率分布中,給定樣本觀測值的后驗分布必須易于分析。這就要求后驗分布或者是共軛分布,或者是容易分析,從而保證在實際中的應用價值。然而這兩個要求常常是相悖的。Ferguson證明Dirichlet過程滿足這兩個要求,且具有許多理想的性質。因此,在本文分析中,我們選擇隨機效應參數b服從Dirichlet過程DP(α,G0),其中,G0為基礎測度,定義了Dirichlet過程的位置;α是精度參數,它決定分布G集中于G0的程度,因此度量了我們對G0的信任程度。令固定效應參數β服從正態(tài)分布。由于Dirichlet過程是以概率1為離散的,根據Antoniak在1974年提出的混合Dirichlet過程,我們將整個模型描述為:
事實上,子輩的收入情況不僅受微觀水平的個體特征(如年齡、教育程度的)影響,而且同時還會受到家庭環(huán)境以及居住地是在城鎮(zhèn)還是在農村的影響。也就是說,被研究的對象除了自身的“個體效應”之外,還存在著“組效應”。因此,我們引入城鄉(xiāng)和城鄉(xiāng)與父親收入的交互效應作為隨機效應。因此,整個模型設定如下:
其中,變量AGE、EDUC、URBAN分別代表年齡、最高受教育程度、城鄉(xiāng);變量lny0×URBAN代表城鄉(xiāng)與父親收入的交互效應。
本研究采用的是由美國北卡羅萊納大學與中國預防醫(yī)學會和食品醫(yī)療研究所聯合調查的關于中國居民健康與營養(yǎng)調查(CHNS)2006年的數據。CHNS數據樣本來自位于遼寧、黑龍江、江蘇、山東、河南、湖北、湖南、廣西、貴州等九個省市在1989、1991、1993、1997、2000、2004、2006年大約4400個家庭的數據,其中包括性別、教育水平、婚姻、工資收入等變量。這套調查數據采取的是多階段、隨機聚類法,從覆蓋了中國東、中、西部地區(qū)的9個省中抽取樣本,每個省抽取4個縣,每個縣抽取4個村,每個村抽取20個家庭,所以代表性較好。在我們的研究中,由于我們著重考慮的是代際收入流動在城鎮(zhèn)與農村之間的差異性,再加上數據的可得性原因,因此我們沒有選取幾年的平均收入作為考量,而是對子輩選取2006年的收入,對父輩選取1989年的收入。我們將子輩和父輩配好對后,再刪除一些缺失數據,最后整理,共有123個樣本。
由于調查問卷上所調查的收入是前一年的數據,所以每個樣本的工資收入都用前一年對應的指數進行了平滑。其中每個平滑指數是以1989年《中國統(tǒng)計年鑒》中1988年遼寧省城市職工生活費用價格分類指數=100為基礎計算的。表1描述了1989年父輩和2006年配對子輩的收入情況,配對樣本分為城鎮(zhèn)和農村居民兩個子樣本。
表1 配對樣本描述 (單位:元)
從表1中我們可以發(fā)現,無論是對于父輩還是對于子輩而言,處于城鎮(zhèn)地區(qū)的居民都要比在農村地區(qū)的居民收入高。
在非參數貝葉斯方法下,我們感興趣的是隨機效應參數b和固定效應參數β的后驗推斷值。在對本模型進行估計時,我們首先平行運行2條馬爾可夫鏈,每條鏈退火(burnin)10000次,另外,為了克服因為連續(xù)抽取而導致的自相關性,我們設置thin=10,即所得的隨機數每隔10次抽取用于后驗量的計算。最終得到各參數的軌跡圖和G-R統(tǒng)計量分別如圖1(左)和表2所示。圖1的右邊描繪了模型中各參數的后驗密度,其中陰影部分是其95%的置信區(qū)間部分。
表2 各參數的G-R統(tǒng)計量和后驗估計值
從各參數的軌跡圖可以看出,各個參數的抽取值達到了穩(wěn)定狀態(tài)。并且從G-R統(tǒng)計量也可以看出,各個參數的G-R統(tǒng)計量接近于1。因此,可以認為各個參數在迭代過程中已經達到收斂。
于是我們再迭代5000次,然后根據最后的5000個后驗抽取進行分析,得到的后驗估計值如表2所示。由估計結果可以看出,最高受教育程度和年齡的參數系數分別為0.0754和0.0148,這說明子輩本身的最高受教育程度和年齡都對他的收入有一定的影響作用,且這種作用是正向的。對于城鄉(xiāng)隨機變量,它的估計值為4.8110,很明顯可以看出,城鎮(zhèn)地區(qū)居民要比農村地區(qū)居民收入高,城鄉(xiāng)間收入差距很大。
在控制了城鄉(xiāng)變量后,我們的模型中計算的父輩和子輩之間的代際收入彈性系數為0.0402,這個結果比我國學者的研究都要低①這有可能是由于我們選取的數據、模型和估計方法造成的。。由于交互效應的估計值為0.0290,可以看出代際流動存在城鄉(xiāng)差異,城鎮(zhèn)地區(qū)的代際收入彈性要高于農村地區(qū),即我們的研究中父輩收入對子輩收入的影響在城鎮(zhèn)地區(qū)要高于在農村地區(qū)。換句話說,對于城鎮(zhèn)地區(qū)居民而言,父親的高收入能為子女收入的提高更多的保護和促進作用。
圖1 各參數的MCMC軌跡圖(左)和最大后驗密度圖(右)
由于線性混合模型中的隨機效應可以反映不同觀測對象之間的異質性以及同一觀測對象不同觀測值之間的相關性,本文利用線性混合模型研究代際收入問題,并針對隨機效應較難估計的問題,我們應用Dirichlet過程放松隨機效應的分布假設。結果發(fā)現,受教育程度、年齡和城鄉(xiāng)地理位置都會影響個人的收入,并且城鎮(zhèn)地區(qū)的代際收入彈性要高于農村地區(qū)。
由于收入較高的父輩對子女的教育投資一般也更高,這使得其子輩的教育年限和教育質量會更高。此外,根據Case et al.(2002)的研究表明,部分社會經濟地位的代際傳遞是通過父母收入對子女健康的影響傳遞的,并且低收入家庭子女的健康狀況往往比高收入家庭的子女更差。這些都能很好地說明城鎮(zhèn)地區(qū)的代際收入彈性高于農村地區(qū)的原因。再加上我國正處于轉型期,勞動力市場還很不完善。二元經濟結構在很大程度上造成了城市勞動力的就業(yè)保護,限制了農村勞動力向城市的流動,嚴重的影響著人們獲取工作的均等機會。因此,目前,影響人們找工作的主要因素似乎有時候并不是個體本身的能力,而是個體之外的關系背景。高收入的父母往往會通過社會關系的傳遞來影響子女的收入。一般而言,處于城鎮(zhèn)地區(qū)的居民收入較高,其社會交際關系網也一般更廣和更有作用,子女也更容易獲取高收入的工作。
因此,完善勞動力市場,提高社會整體狀態(tài)及社會發(fā)展態(tài)勢趨勢的平等性是我們亟需解決的問題。對于農村地區(qū),提供公平的受教育機會、加大農村地區(qū)的教育投資、提供更多的職業(yè)培訓、增進醫(yī)療健康的公平性、增加更多的公共資源供給可以提高農村子女在勞動力市場中的競爭力,增進農村地區(qū)的代際流動性,這對于促進社會的公平和和諧具有重要的作用。
[1]Blau,P.,Duncan,O.D.The American Occupational Structure[M].New York:John Wiley&Sons,1967.
[2]Sewell,W.,Hauser,R.Education,Occupation and Achievement in the Early Career[M].New York:Academic Press,1975.
[3]Becker,G.S.,Tomes,N.An Equilibrium Theory of Distribution of In?come and Intergenerational Mobility[J].Journal of Political Economy,1979,87(6).
[4]Solon,G.Intergenerational Income Mobility in the United States[J].American Economic Review,1992,(3).
[5]Zimmerman,D.Regression toward Mediocrity in Economics Stature[J].American Economic Review,1992,(3).
[6]Bjorklund,A.,Jantti,M.Intergenerational Income Mobility in Sweden Compared to the United States[J].American Economic Review,1997,87(5).
[7]Dearden,L.,Machin,S.,Reed,H.Intergenerational Mobility in Britain[J].The Economic Journal,1997,107(440).
[8]Wiegand,J.Intergeneraional Earnings Mobility in Germany[C].Work?ing Paper,2006.
[9]王海港.中國居民收入分配的代際流動[J].經濟科學,2005,(2).
[10]何曉琦,鄧曉嵐.跨代收入流動及其評估[J].統(tǒng)計研究,2006,(6).
[11]郭叢敏、閔維方.中國城鎮(zhèn)居民教育與收入代際流動的關系研究[J].教育研究,2007,(5).
[12]韓軍輝.中國農村地區(qū)代際收入流動的多水平統(tǒng)計模型分析[J].統(tǒng)計與信息論壇,2009,24(8).
[13]韓軍輝.自助多水平統(tǒng)計模型在代際收入流動研究中的應用[J].蘭州學刊,2009,192(9).
[14]汪燕敏,錢珍.收入代際流動計量偏誤的文獻綜述[J].生產力研究,2009,(21).
[15]Escobar,M.,West,M.Bayesian Density Estimation and Inference Us?ing Mixture[J].Journal of the American Statistical Association,1995,90(7).
[16]Case,A.Lubotsky,D.,Paxson,C.Economic Status and Health in Childhood:the Origins of the Gradient[J].The American Economic Review,2002,92(5).