高 勇
默頓①Robert K.Merton,“Three Fragments from a Sociologist’s Notebooks:Establishing the Phenomenon,Specified Ignorance,and Strategic Research Materials,”Annual Review of Sociology,vol.13,1987,pp.1-28.曾經(jīng)觀察到,雖然在核實(shí)現(xiàn)象存在之后再去進(jìn)行解釋是看似不言自明的道理,但是在科學(xué)研究中,與這個(gè)道理相反的事情并不少見。究其原因,或者是因?yàn)檫@樣一種核對(duì)事實(shí)的工作很容易被貶斥為“純粹經(jīng)驗(yàn)性的事實(shí)收集”,或者是因?yàn)檠芯空咴谝庾R(shí)形態(tài)或理論期待的指引下會(huì)直接跳過(guò)這樣一個(gè)“簡(jiǎn)單環(huán)節(jié)”。然而,“現(xiàn)象核實(shí)”(Establishing the Phenomenon)往往并不是一件輕而易舉的事情,尤其研究對(duì)象是紛繁復(fù)雜的社會(huì)現(xiàn)象時(shí)。
本文就是對(duì)于地區(qū)基尼系數(shù)與幸福感之間關(guān)系的現(xiàn)象核實(shí)。研究地區(qū)基尼系數(shù)與幸福感的關(guān)系,其理論意義在于探討行動(dòng)者的主觀觀念或主觀感受與所處社會(huì)情境的客觀特征之間的關(guān)聯(lián)機(jī)制。基于不同的調(diào)查數(shù)據(jù),以往的研究對(duì)此得出了彼此沖突的結(jié)論。這種情況與研究者單純以系數(shù)的統(tǒng)計(jì)顯著性為指標(biāo)的研究方式有關(guān),它往往導(dǎo)致對(duì)數(shù)據(jù)生成過(guò)程的思考不足。本文試圖一方面通過(guò)對(duì)數(shù)據(jù)生成過(guò)程的認(rèn)真考察,揭示出地區(qū)基尼系數(shù)與幸福感之間的關(guān)聯(lián)并沒有足夠堅(jiān)實(shí)的統(tǒng)計(jì)證據(jù),以完成這一基本的“現(xiàn)象核實(shí)”工作;另一方面,借此例證表明單純以系數(shù)的統(tǒng)計(jì)顯著性為指引和目標(biāo)的工作方式是存在缺陷的,定量研究并不一定是線性的假設(shè)驗(yàn)證過(guò)程,而完全可以也應(yīng)當(dāng)是在經(jīng)驗(yàn)數(shù)據(jù)與解釋邏輯之間循環(huán)往復(fù)從而不斷逼近事實(shí)真相的過(guò)程。
我們首先回顧和梳理有關(guān)地區(qū)基尼系數(shù)與幸福感之間關(guān)系的相關(guān)研究文獻(xiàn),明確這個(gè)經(jīng)驗(yàn)問(wèn)題的理論意義;然后進(jìn)行常規(guī)的統(tǒng)計(jì)模型操作,看單純依據(jù)系數(shù)的統(tǒng)計(jì)顯著性為指標(biāo)會(huì)得出何種結(jié)論;在此基礎(chǔ)上再考察數(shù)據(jù)生成過(guò)程,以便挖掘出重要的控制變量來(lái)澄清背后隱藏的真正邏輯,說(shuō)明兩者之間的關(guān)系至少不像表面那樣穩(wěn)健,甚至可能只是一種統(tǒng)計(jì)假象;最后,我們?cè)倩氐綄?duì)經(jīng)驗(yàn)問(wèn)題的理論討論中來(lái),對(duì)社會(huì)感受的形成機(jī)制進(jìn)行一些探索性的思考,并對(duì)其中涉及的研究方法取向進(jìn)行一些反思。
行動(dòng)者所處社會(huì)環(huán)境中的收入不平等程度與行動(dòng)者的主觀觀念或感受之間有何關(guān)聯(lián),這是一個(gè)重要的研究問(wèn)題。利用全國(guó)綜合抽樣調(diào)查數(shù)據(jù)(如CGSS)計(jì)算得出區(qū)縣(甚至更小單位的)基尼系數(shù)(或泰爾指數(shù)等相似指標(biāo)),然后引入回歸模型進(jìn)行分析,這是一種討論收入不平等效應(yīng)的常見做法。利用這種方法,研究者們考察了地區(qū)基尼系數(shù)對(duì)個(gè)體幸福感或生活滿意度的效應(yīng)、對(duì)于居民信任和政府信任的效應(yīng)、對(duì)于收入差距容忍度的效應(yīng)等等。
對(duì)相關(guān)研究的結(jié)論進(jìn)行梳理后,就會(huì)發(fā)現(xiàn)一種令人不解的現(xiàn)象:在這些研究當(dāng)中,區(qū)縣基尼系數(shù)的效應(yīng)多數(shù)都是顯著的,但是在因變量相同的情況下,效應(yīng)方向卻時(shí)而為正,時(shí)而為負(fù),并不確定。另外,有研究者發(fā)現(xiàn)了“倒U型曲線關(guān)系”,也有研究者發(fā)現(xiàn)這種曲線關(guān)系并不存在?;诓煌慕?jīng)驗(yàn)發(fā)現(xiàn),研究者又各自提出了不同的解釋邏輯。以地區(qū)基尼系數(shù)與幸福感的關(guān)系研究為例,在現(xiàn)在文獻(xiàn)中大致有如下兩類截然不同的結(jié)論:
許多研究的結(jié)果顯示,地區(qū)基尼系數(shù)與幸福感的效應(yīng)估計(jì)值為負(fù)且統(tǒng)計(jì)顯著,收入不平等程度顯著地?fù)p害了各個(gè)階層的幸福感。①王鵬:《收入差距對(duì)中國(guó)居民主觀幸福感的影響分析——基于中國(guó)綜合社會(huì)調(diào)查數(shù)據(jù)的實(shí)證研究》,《中國(guó)人口科學(xué)》2011年第3期;何立新、潘春陽(yáng):《破解中國(guó)的“Easterlin悖論”:收入差距、機(jī)會(huì)不均與居民幸福感》,《管理世界》2011年第8期;巫錫煒、肖珊珊:《地區(qū)差異與我國(guó)居民主觀幸福感》,《青年研究》2013年第1期;黃嘉文:《收入不平等對(duì)中國(guó)居民幸福感的影響及其機(jī)制研究》,《社會(huì)》2016年第2期;王健、張煥明、李超:《收入差距對(duì)居民幸福指數(shù)的影響研究——基于2013年CGSS數(shù)據(jù)的實(shí)證分析》,《寧夏大學(xué)學(xué)報(bào)》(人文社會(huì)科學(xué)版)2017年第6期;Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China,”Research in Social Stratification and Mobility,vol.52,2017,pp.49-58.這些研究多數(shù)都是利用CGSS2005和CGSS2006年數(shù)據(jù)進(jìn)行的。某些早期研究采用一般線性回歸模型進(jìn)行估計(jì),這種研究方式忽略了數(shù)據(jù)本身存在的層級(jí)結(jié)構(gòu),可能高估參數(shù)的效應(yīng)。區(qū)縣基尼系數(shù)本身是一個(gè)宏觀背景變量,因此數(shù)據(jù)本身具有層級(jí)結(jié)構(gòu),只有利用層級(jí)模型才有可能對(duì)此進(jìn)行精準(zhǔn)估計(jì)。后來(lái)的研究采用多水平模型(也被稱為層級(jí)線性模型),使得估計(jì)值更為精準(zhǔn)。對(duì)于地區(qū)基尼系數(shù)的估計(jì)方式有兩類:一種是直接利用CGSS調(diào)查數(shù)據(jù)進(jìn)行估算,另一種是利用樣本量更大的2005年1%人口抽樣調(diào)查數(shù)據(jù)進(jìn)行估算②巫錫煒、肖珊珊:《地區(qū)差異與我國(guó)居民主觀幸福感》;Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”,后一種估算方式應(yīng)當(dāng)更為精準(zhǔn)。還有研究者在利用多水平模型進(jìn)行系數(shù)估計(jì)后,還構(gòu)建了面板數(shù)據(jù)來(lái)看地區(qū)基尼系數(shù)的變動(dòng)引發(fā)的幸福感變動(dòng)。③Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”對(duì)這些結(jié)果的解釋主要是從“相對(duì)比較”的角度進(jìn)行的:個(gè)體非常關(guān)注自身與他人相比的相對(duì)位置,這種比較和評(píng)估是在一個(gè)局部背景中相對(duì)于某一個(gè)參照群體進(jìn)行的。擁有同樣收入的個(gè)體,如果處在不平等程度更大的局部環(huán)境中,他就更有可能產(chǎn)生挫敗感,進(jìn)而降低其幸福感。
另有一部分研究的結(jié)果顯示,區(qū)縣基尼系數(shù)與幸福感之間呈現(xiàn)出顯著的正向關(guān)聯(lián):收入不平等程度越高,幸福感反而越高。④Knight J.,Song L,and Gunatilaka R.,“Subjective Well-being and Its Determinants in Rural China,”China Economic Review,vol.20,no.4,2009,pp.635-649;馬萬(wàn)超、王湘紅、李輝:《收入差距對(duì)幸福感的影響機(jī)制研究》,《經(jīng)濟(jì)學(xué)動(dòng)態(tài)》2018年第11期;劉自敏、楊丹、張巍?。骸妒杖氩黄降取⑸鐣?huì)公正與認(rèn)知幸福感》,《山西財(cái)經(jīng)大學(xué)學(xué)報(bào)》2018年第5期。這部分研究利用的數(shù)據(jù)包括2002年中國(guó)家庭收入調(diào)查(CHIP)數(shù)據(jù)、2010—2015年的CGSS五期面板數(shù)據(jù)、2014年社會(huì)發(fā)展與社會(huì)態(tài)度調(diào)查(NISD)數(shù)據(jù)等。研究者使用的統(tǒng)計(jì)模型既有一般線性回歸,也包括層級(jí)線性模型。對(duì)于地區(qū)基尼系數(shù)與幸福感之間的正向關(guān)聯(lián),多數(shù)研究者是從所謂“隧道效應(yīng)”的角度進(jìn)行解釋的。赫希曼等人提出,人們對(duì)于不平等的容忍程度是隨著發(fā)展的不同階段而變化的。①Hirschman A.O.and Rothschild M.,“The Changing Tolerance for Income Inequality in the Course of Economic Development,”Quarterly Journal of Economics,vol.87,no.4,1973,pp.544-566.在發(fā)展的早期階段,盡管收入差距逐漸拉開,但是人們對(duì)于不平等具有相當(dāng)?shù)娜萑坛潭?,這是因?yàn)楦呤杖胝邽樗麄兲峁┝松罡纳频南Mc前景,如同處在交通堵塞的隧道中的司機(jī)在看到旁邊車道開始移動(dòng)時(shí),即使自己還沒有移動(dòng)也會(huì)充滿希望一樣。這樣一種看到他人狀況提升而帶來(lái)的希望就是“隧道效應(yīng)”。赫希曼提出的隧道效應(yīng)假說(shuō),針對(duì)的是隨時(shí)間發(fā)展的動(dòng)態(tài)過(guò)程中呈現(xiàn)的模式。但是上述研究將隧道效應(yīng)的邏輯引來(lái)解釋同一個(gè)時(shí)點(diǎn)對(duì)不同地區(qū)進(jìn)行比較呈現(xiàn)出來(lái)的模式。②此外,赫希曼的“隧道效應(yīng)”針對(duì)的主要研究單位是國(guó)別而非同一國(guó)家內(nèi)部的不同地區(qū)。因此利用赫希曼的“隧道效應(yīng)”對(duì)地區(qū)基尼系數(shù)的效應(yīng)進(jìn)行解釋時(shí),研究單位其實(shí)也發(fā)生了變動(dòng)。由此看來(lái),區(qū)域內(nèi)收入不平等的適度增大,增強(qiáng)了人們對(duì)于未來(lái)生活福祉提升的預(yù)期,從而提升其幸福感。
也有研究發(fā)現(xiàn)區(qū)縣基尼系數(shù)與幸福感存在著倒U型關(guān)系:隨著收入不平等程度的擴(kuò)大,個(gè)體的幸福感呈現(xiàn)出先增加后減少的態(tài)勢(shì)。③王鵬:《收入差距對(duì)中國(guó)居民主觀幸福感的影響分析——基于中國(guó)綜合社會(huì)調(diào)查數(shù)據(jù)的實(shí)證研究》;郝身永:《究竟是患寡、患不均還是患不公?——基于CGSS(2006)對(duì)居民幸福感決定的經(jīng)驗(yàn)研究》,《云南財(cái)經(jīng)大學(xué)學(xué)報(bào)》2015年第5期;孫計(jì)領(lǐng):《收入不平等、分配公平感與幸?!?,《經(jīng)濟(jì)學(xué)家》2016年第1期。這一發(fā)現(xiàn)的證據(jù),是基尼系數(shù)的平方項(xiàng)在回歸方程中的系數(shù)是顯著的(且符號(hào)為負(fù))。還有研究者甚至發(fā)現(xiàn),這種倒U型關(guān)系在各個(gè)層面都普遍存在:不僅區(qū)縣基尼系數(shù)有這種關(guān)系,甚至鄉(xiāng)鎮(zhèn)/街道和社區(qū)基尼系數(shù)與幸福感均存在顯著的倒U型關(guān)系。對(duì)上述曲線關(guān)系同樣可以從“隧道效應(yīng)”的角度來(lái)進(jìn)行解釋。赫希曼指出,如果過(guò)了發(fā)展的早期階段,收入不平等仍然持續(xù)擴(kuò)大,那么人們對(duì)不平等就不再容忍了,就如同旁邊車道一直移動(dòng)而自己的車道卻遲遲不動(dòng)的司機(jī),他必然會(huì)沮喪而且憤怒。由此推論,地區(qū)基尼系數(shù)與幸福感之間的關(guān)系是存在某個(gè)臨界值或門檻的:在此之前收入差距拉大使人們對(duì)未來(lái)經(jīng)濟(jì)福利有更高的信心,因此促進(jìn)幸福感;在此之后收入差距拉大引發(fā)更多負(fù)面影響。不過(guò)需要存疑的一點(diǎn)是,這種曲線關(guān)系大多是在一般線性回歸模型中發(fā)現(xiàn)的,而利用層級(jí)線性模型進(jìn)行的研究很少發(fā)現(xiàn)有“倒U型關(guān)系”存在。
如何看待上述彼此沖突的研究結(jié)論呢?本文試圖回到數(shù)據(jù)中,探測(cè)地區(qū)基尼系數(shù)與幸福感之間發(fā)生統(tǒng)計(jì)關(guān)聯(lián)的機(jī)制,完成這一基本的“現(xiàn)象核實(shí)”工作。
在本節(jié),我們用CGSS2013數(shù)據(jù)來(lái)對(duì)地區(qū)基尼系數(shù)與幸福感之間關(guān)系進(jìn)行常規(guī)的統(tǒng)計(jì)模型操作,以了解兩者之間是否存在經(jīng)驗(yàn)關(guān)聯(lián)以及關(guān)聯(lián)的方向與強(qiáng)度。
CGSS2013年數(shù)據(jù)中包括來(lái)自126個(gè)區(qū)縣的被訪者,多數(shù)區(qū)縣都有100名左右的被訪者。我們可以用這些被訪者的家庭收入數(shù)據(jù)來(lái)估算他們所在區(qū)縣的基尼系數(shù)。④這種估算當(dāng)然并不精確,包括了一定程度的測(cè)量誤差。我們?cè)诤竺鏁?huì)討論測(cè)量誤差對(duì)分析可能帶來(lái)的影響。數(shù)據(jù)中對(duì)于幸福感的測(cè)量是定序尺度的:“總的來(lái)說(shuō),您覺得您的生活是否幸福?”選項(xiàng)是從“非常不幸?!钡健胺浅P腋!钡奈宥葏^(qū)分。初步的計(jì)算表明,區(qū)縣基尼系數(shù)與區(qū)縣被訪者的幸福感均值的相關(guān)系數(shù)為0.20(P<0.05)。區(qū)縣基尼系數(shù)與幸福感確實(shí)是相關(guān)的,而且在統(tǒng)計(jì)上非常顯著。兩者是正相關(guān)關(guān)系:區(qū)縣基尼系數(shù)越大,幸福感的評(píng)價(jià)值越高。
我們繼續(xù)進(jìn)行多元回歸分析,這樣就可以在控制其他相關(guān)因素的條件下,更為準(zhǔn)確地了解它們之間的關(guān)系。我們納入如下控制變量,包括性別、年齡、受教育年限、家庭總收入的對(duì)數(shù)、居住地類型(城市/農(nóng)村)、身體健康狀況、當(dāng)前是否有配偶,然后運(yùn)行多元回歸(模型1)。模型1的結(jié)果顯示在表1中第一欄中。我們看到區(qū)縣基尼系數(shù)的回歸系數(shù)為0.61,仍然是正的;這一系數(shù)值的t值為6.21,在統(tǒng)計(jì)上極其顯著??磥?lái),“隧道效應(yīng)”的解釋是更有道理的。
當(dāng)然,如果“隧道效應(yīng)”的解釋是正確的,那么區(qū)縣基尼系數(shù)與幸福感之間的關(guān)系就應(yīng)該有一個(gè)先升后降的過(guò)程。我們?cè)诨貧w方程中加入基尼系數(shù)的平方項(xiàng),以此檢驗(yàn)這種曲線關(guān)系是否存在(模型2)。模型2的結(jié)果非常理想,平方項(xiàng)的系數(shù)為負(fù)且非常顯著,這表明基尼系數(shù)與幸福感的關(guān)系確實(shí)存在這樣一種先升后降的過(guò)程。倒U型曲線意味著某個(gè)臨界值或門檻的存在:在此之前收入差距拉大使人們對(duì)未來(lái)經(jīng)濟(jì)福利有更高的信心,因此促進(jìn)幸福感;在此之后收入差距拉大引發(fā)更多負(fù)面影響。根據(jù)系數(shù)估計(jì)值,這一U型關(guān)系的拐點(diǎn)大約發(fā)生在基尼系數(shù)為0.5左右,而多數(shù)樣本區(qū)縣的基尼系數(shù)在0.5以下,因此我們用線性關(guān)系來(lái)估計(jì)時(shí)它就表現(xiàn)為正向關(guān)系。
一般線性回歸的諸多前提在此并不能夠完全滿足,因此我們應(yīng)該在統(tǒng)計(jì)模型上進(jìn)一步精細(xì)化,采用更“高級(jí)”的統(tǒng)計(jì)方式來(lái)提升統(tǒng)計(jì)估計(jì)的精度。
首先,因變量“幸福感”并不是一個(gè)定距變量,而是一個(gè)五類別的定序變量。因此,線性回歸的模型設(shè)定并不完全正確,我們應(yīng)當(dāng)采用定序logistic的統(tǒng)計(jì)模型來(lái)進(jìn)行估計(jì)才是更準(zhǔn)確的選擇。我們由此估計(jì)了模型3(見表1):多數(shù)變量的統(tǒng)計(jì)顯著性幾乎沒有任何變化,而我們最關(guān)心的變量“基尼系數(shù)”的統(tǒng)計(jì)顯著性甚至有了大幅度增加。統(tǒng)計(jì)模型的精細(xì)化并沒有否決我們的前述結(jié)論,反而讓我們對(duì)結(jié)論更有信心。
此外,CGSS數(shù)據(jù)是嵌入于某種層級(jí)結(jié)構(gòu)(個(gè)體-居委會(huì)-區(qū)縣)當(dāng)中的,我們?cè)炔]有在模型設(shè)定中注意這一點(diǎn)。樣本中的案例并不是統(tǒng)計(jì)獨(dú)立的,同一區(qū)縣中的個(gè)案擁有相同的基尼系數(shù)值?;诖朔N考慮,我們可以采用層級(jí)線性模型(HLM模型),在模型設(shè)置中加入隨機(jī)截距項(xiàng)。估計(jì)結(jié)果如表1中的模型4所示:區(qū)縣基尼系數(shù)的效應(yīng)仍然在統(tǒng)計(jì)上非常顯著,雖然標(biāo)準(zhǔn)差有所增大,t值有所減小??磥?lái),我們的結(jié)果是非常穩(wěn)健的。
表1 對(duì)區(qū)縣基尼系數(shù)與幸福感關(guān)系的初始模型擬合
在上面的層級(jí)線性模型中,我們是把因變量“幸福感”作為定距變量處理的。如果既考慮數(shù)據(jù)的層級(jí)結(jié)構(gòu),同時(shí)又考慮到因變量的定序特性,我們就應(yīng)當(dāng)采用廣義層級(jí)線性模型(HGLM模型)。對(duì)于定序因變量來(lái)說(shuō),這種模型也被稱為累積性連接混合模型(Cumulative Link Mixed Models),采用這樣的模型才能得到最為精確的系數(shù)估計(jì)和標(biāo)準(zhǔn)誤估計(jì)。在計(jì)算機(jī)軟件的幫助下,我們?cè)俅芜\(yùn)行了HGLM模型(模型5)。區(qū)縣基尼系數(shù)的系數(shù)估計(jì)仍然非常顯著。看來(lái),更為復(fù)雜前沿的統(tǒng)計(jì)技術(shù)對(duì)于系數(shù)數(shù)值及其統(tǒng)計(jì)顯著性有所改變,但是并不能推翻我們的前述基本看法。
最后,還有一個(gè)麻煩需要認(rèn)真考慮,即測(cè)量誤差問(wèn)題。我們使用的核心自變量“區(qū)縣基尼系數(shù)”是僅僅基于每個(gè)區(qū)縣100個(gè)左右的樣本而得出的,這里面應(yīng)該包括了比較大的測(cè)量誤差。我們還要考慮到,在CGSS數(shù)據(jù)中,抽樣方式并非簡(jiǎn)單隨機(jī)抽樣,而是多階段分層抽樣。樣本并不是隨機(jī)分散于區(qū)縣中的,而是匯集在區(qū)縣中的少數(shù)村居委會(huì)。如果不同階級(jí)在居住空間上有較大的集中性,那么這樣一種抽樣方式得到的樣本的代表性就可能比較差,從而導(dǎo)致測(cè)量誤差比簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì)下要大很多。更何況,作為一種結(jié)構(gòu)性測(cè)量指標(biāo)的基尼系數(shù)比通常的矩統(tǒng)計(jì)量更容易產(chǎn)生較大的抽樣誤差。因此,這一核心自變量的測(cè)量精度是值得懷疑的。自變量存在測(cè)量誤差確實(shí)會(huì)引發(fā)估計(jì)量不再是無(wú)偏和一致的,但是這種影響會(huì)使得估計(jì)值比真實(shí)估計(jì)值更接近于0,從而降低其統(tǒng)計(jì)顯著性程度。①杰弗里·M.伍德里奇:《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論:現(xiàn)代觀點(diǎn)》,張成思譯,北京:中國(guó)人民大學(xué)出版社,2018年,第249—252頁(yè)。因此,即便區(qū)縣基尼系數(shù)的測(cè)量確實(shí)存在較大的隨機(jī)性測(cè)量誤差,這也只能說(shuō)明真實(shí)的效應(yīng)值應(yīng)該比我們估計(jì)出來(lái)的效應(yīng)值更大,在統(tǒng)計(jì)上更為顯著。測(cè)量誤差的存在只能說(shuō)明我們的估計(jì)值可能更偏向于保守,而不可能動(dòng)搖我們的核心結(jié)論。
如果單純以系數(shù)的統(tǒng)計(jì)顯著性為評(píng)判指標(biāo),那么區(qū)縣基尼系數(shù)與幸福感的正向關(guān)聯(lián)是非常穩(wěn)健的,得到了各種復(fù)雜統(tǒng)計(jì)模型的背書。疑問(wèn)似乎已經(jīng)得到解答,探索似乎已經(jīng)可以結(jié)束。②以往的多數(shù)研究是到此為止的。但是,也有部分研究者(如Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”)意識(shí)到“可能存在著未觀察到的地區(qū)特征會(huì)同時(shí)影響收入不平等與人們的主觀福祉”,因此構(gòu)建了省級(jí)層面的面板數(shù)據(jù)來(lái)解決這種遺漏變量偏差。然而這種策略能夠有效的前提是面板數(shù)據(jù)分析中引入的時(shí)變變量沒有遺漏;遺漏變量問(wèn)題并沒有因此消失,而只是轉(zhuǎn)化了存在的形式。如下文所述,如果不對(duì)數(shù)據(jù)生成過(guò)程進(jìn)行深入考察,面板數(shù)據(jù)分析這一統(tǒng)計(jì)技術(shù)也不能確保結(jié)論的可靠性。
統(tǒng)計(jì)結(jié)果是對(duì)于變量關(guān)系的表述,這些變量本身又是對(duì)處于一定情境的社會(huì)主體特征的描述。因此,我們面對(duì)變量關(guān)系的上述表述時(shí),也會(huì)希望再回到對(duì)社會(huì)情境與社會(huì)主體的理解上來(lái):這種統(tǒng)計(jì)結(jié)果背后描述的是誰(shuí)?是誰(shuí)推動(dòng)了這樣一種統(tǒng)計(jì)結(jié)果得以呈現(xiàn)?這是因?yàn)橛幸恍┏鞘惺杖氩黄降瘸潭忍貏e高,同時(shí)人們的幸福感也特別高嗎?這是哪些類型的城市?是不是通常所設(shè)想的那些大都市地區(qū)?或者,這是因?yàn)橛幸恍┏鞘惺杖氩黄降瘸潭忍貏e低,同時(shí)人們的幸福感也特別低?這又是哪些類型的城市?是那些經(jīng)濟(jì)發(fā)展更為滯后的地區(qū)嗎?上述諸多信息并不包括在模型系數(shù)的顯著性水平中,而必須再回到對(duì)數(shù)據(jù)的深入描述中才能掌握。
CGSS2013數(shù)據(jù)不提供調(diào)查案例所在區(qū)縣的具體名稱,但是提供了這些區(qū)縣所在的省份信息。我們繪制出了每個(gè)區(qū)縣基尼系數(shù)與幸福感均值的散點(diǎn)圖,并加入了擬合曲線(如圖1所示)。然后,我們對(duì)散點(diǎn)圖中那些區(qū)縣基尼系數(shù)小于0.3或者大于0.55的區(qū)縣標(biāo)注出所在省份。從這一散點(diǎn)圖中,我們看出了重要的信息。
圖1 區(qū)縣基尼系數(shù)與幸福感均值的散點(diǎn)圖
第一,那些基尼系數(shù)估算值低于0.3的區(qū)縣大多處于北京、天津、廣東省等大都市地區(qū),基尼系數(shù)估算值高于0.55的區(qū)縣則大多處于云南、湖南、安徽等相對(duì)而言并不太發(fā)達(dá)的地區(qū)。然而,如果我們要用“隧道效應(yīng)”來(lái)進(jìn)行解釋,那么基尼系數(shù)應(yīng)該是隨著經(jīng)濟(jì)發(fā)展?fàn)顩r而提升的,那些相對(duì)不太發(fā)達(dá)的地區(qū)應(yīng)是基尼系數(shù)較低的,發(fā)達(dá)的地區(qū)應(yīng)是基尼系數(shù)較高的。經(jīng)驗(yàn)數(shù)據(jù)的細(xì)節(jié)與理論解釋并不相符。
第二,在基尼系數(shù)估算值的大部分取值范圍中(大于0.3的部分),它與幸福感均值幾乎不存在線性關(guān)系,擬合線近似于一條水平線。只有在散點(diǎn)圖的左端,即當(dāng)基尼系數(shù)小于0.3時(shí),擬合線向上傾斜。左下方的一系列散點(diǎn)是形成這樣一種擬合曲線的原因。由此看來(lái),變量之間存在統(tǒng)計(jì)關(guān)聯(lián),是因?yàn)橛幸徊糠只嵯禂?shù)估算值較低同時(shí)幸福感也較低的城市,而不是因?yàn)橛幸徊糠只嵯禂?shù)估算值較高同時(shí)幸福感也較高的城市。
第三,大都市樣本與非大都市樣本在散點(diǎn)圖中似乎分布在非常不同的區(qū)域,有著較為明顯的模式差異。這種模式差異有可能會(huì)影響我們對(duì)于基尼系數(shù)估算值與幸福感之間統(tǒng)計(jì)關(guān)聯(lián)的考察。
因此,盡管“隧道效應(yīng)”可以通過(guò)對(duì)于模型系數(shù)的統(tǒng)計(jì)顯著性檢驗(yàn),但是它與數(shù)據(jù)描述的上述細(xì)節(jié)無(wú)法吻合。這些探究源自對(duì)社會(huì)情境與社會(huì)主體的理解,它引導(dǎo)我們看到了更多的問(wèn)題:為什么大都市樣本中測(cè)算出來(lái)的區(qū)縣基尼系數(shù)會(huì)比較低?為什么大都市樣本與非大都市樣本有不同的模式?這些模式會(huì)對(duì)我們?cè)鹊慕Y(jié)果有何影響?為了回答這些問(wèn)題,我們就需要認(rèn)真查看數(shù)據(jù)的生成過(guò)程。
在CGSS的抽樣方案中,存在著必選層與抽選層的設(shè)計(jì)①更多細(xì)節(jié)請(qǐng)參閱《中國(guó)綜合社會(huì)調(diào)查(CGSS)第二期(2010—2019)抽樣方案》,http://cgss.ruc.edu.cn/xmwd/cysj.htm。:
1.必選層是指那些發(fā)展處于國(guó)內(nèi)領(lǐng)先水平的大城市。CGSS第二期調(diào)查是從直轄市、省會(huì)城市和副省級(jí)城市共36座城市中,最終選取了經(jīng)濟(jì)水平、教育水平及城市開放性程度綜合指標(biāo)最高的五個(gè)城市進(jìn)行調(diào)查,分別是北京、上海、天津、廣州、深圳。對(duì)于必選層中,總樣本量為2000戶,樣本均為城市家庭戶。在必選層中,街道是初級(jí)抽樣單元,首先抽取40個(gè)街道,每個(gè)街道中抽取2個(gè)居委會(huì),每個(gè)居委會(huì)抽取25個(gè)家庭戶。
2.抽選層是指除去必選層市轄區(qū)以外全國(guó)所有家庭戶。在抽選層中,總樣本量為10000戶,樣本既包括城市家庭戶也包括農(nóng)村家庭戶;區(qū)縣作為初級(jí)抽樣單位,首先抽取100個(gè)區(qū)縣,每個(gè)區(qū)縣中抽取4個(gè)居委會(huì)或村委會(huì),每個(gè)居委會(huì)或村委會(huì)抽取25個(gè)家庭戶。
3.抽選層中的區(qū)縣需要進(jìn)行居委會(huì)與村委會(huì)的配比。配比是根據(jù)區(qū)縣城市化水平(非農(nóng)人口比重)來(lái)決定的:非農(nóng)人口比例在95%以上的區(qū)縣,4個(gè)二級(jí)抽樣單元全部是居委會(huì);這一指標(biāo)在50%—95%之間的區(qū)縣,抽取3個(gè)居委會(huì)和1個(gè)村委會(huì);指標(biāo)在15%—50%之間的區(qū)縣,抽取2個(gè)居委會(huì)和2個(gè)村委會(huì);指標(biāo)在15%以下的區(qū)縣,抽取1個(gè)居委會(huì)和3個(gè)村委會(huì)。
在這樣的抽樣設(shè)計(jì)方案下,我們可以有如下推斷:
第一,不同類型地區(qū)的樣本的城鄉(xiāng)異質(zhì)性有很大差異,而城鄉(xiāng)異質(zhì)性直接影響測(cè)算出來(lái)的基尼系數(shù)大小。必選層中的大城市樣本全部來(lái)自居委會(huì),基尼系數(shù)因此會(huì)較??;抽選層中的區(qū)縣樣本中既有居委會(huì)也有村委會(huì),基尼系數(shù)因此會(huì)較大。區(qū)縣樣本中居委會(huì)/村委會(huì)的配比與測(cè)算出來(lái)的基尼系數(shù)之間的關(guān)系如表2所示。
表2 CGSS2013樣本區(qū)縣中居委會(huì)/村委會(huì)的不同配比與基尼系數(shù)的關(guān)系
第二,不同類型地區(qū)的樣本數(shù)量及代表性有所不同,這同樣影響測(cè)算出來(lái)的基尼系數(shù)大小。大都市地區(qū)樣本的初級(jí)抽樣單元為街道而不是區(qū)縣,多數(shù)區(qū)縣中最終僅被抽到了2個(gè)居委會(huì)(50個(gè)家庭戶樣本),且在同一街道;非大城市地區(qū)樣本中的初級(jí)抽樣單元為區(qū)縣,所有區(qū)縣都被抽中了4個(gè)村委會(huì)或居委會(huì)(100個(gè)家庭戶樣本),且在不同街道。利用地域集中程度更高、樣本量更小的數(shù)據(jù),測(cè)算出來(lái)的基尼系數(shù)當(dāng)然會(huì)更低。此外,如果從嚴(yán)格的抽樣理論上來(lái)看,大都市地區(qū)樣本對(duì)區(qū)縣并無(wú)代表性。
第三,不同類型地區(qū)的居住隔離程度有所不同。由于城市房產(chǎn)價(jià)格的原因,大都市地區(qū)居住于同一居委會(huì)中的居民家庭收入往往較為接近。在農(nóng)村地區(qū),隸屬于同一村委會(huì)的村民因收入提升而搬離本村莊的可能性固然存在,但相對(duì)城市而言較小。如果大城市地區(qū)存在更嚴(yán)重的居住隔離的情況,利用上述多階抽樣方式測(cè)算出來(lái)的基尼系數(shù)也會(huì)相對(duì)偏小。
由于不同地區(qū)類型內(nèi)部的城鄉(xiāng)異質(zhì)性有非常大的差異,也由于不同地區(qū)類型在抽樣中居委會(huì)與村委會(huì)的配比并不相同,因此測(cè)算出來(lái)的區(qū)縣基尼系數(shù)取值范圍有很大差異?;谏鲜隹紤],我們認(rèn)為有必要區(qū)分樣本中的必選層(大都市地區(qū))與抽選層(其他地區(qū))來(lái)進(jìn)行分析。我們先來(lái)直觀地看一下雙變量之間的散點(diǎn)圖(圖2)。圖2中的兩個(gè)圖其實(shí)是由圖1拆分而成:左邊顯示的是數(shù)據(jù)中必選層(大都市地區(qū))的情況,右邊顯示的是抽選層(非大都市地區(qū))的情況。
圖2 區(qū)分大城市樣本與非大城市樣本分析
從圖2中我們可以直觀地看出如下幾點(diǎn):
第一,不同地區(qū)類型的基尼系數(shù)取值范圍完全不同:非大都市地區(qū)測(cè)算出的區(qū)縣基尼系數(shù)沒有低于0.3以下的情況;大都市地區(qū)測(cè)算出的區(qū)縣基尼系數(shù)除了上海市外,沒有高于0.4的情況。
第二,在非大都市地區(qū)中,區(qū)縣基尼系數(shù)與幸福感均值并無(wú)明顯的線性相關(guān)關(guān)系。在大都市地區(qū)中,粗略看起來(lái)兩個(gè)變量存在著正向相關(guān),但是圖中右上角的幾個(gè)散點(diǎn)非常特殊,它們都來(lái)自于上海樣本(圖中用十字形來(lái)代表),這些地區(qū)基尼系數(shù)估計(jì)值與幸福感均值都遠(yuǎn)高于其他都市地區(qū)??磥?lái)上海市樣本在大都市地區(qū)也有特殊性,我們有必要將其作為單獨(dú)對(duì)象來(lái)進(jìn)行分析。①其原因值得探討,但是這并非本文的主旨。在去除上海樣本后,大都市地區(qū)的區(qū)縣基尼系數(shù)與幸福感均值之間并不存在任何明顯的相關(guān)關(guān)系。
第三,盡管分組分析時(shí)兩個(gè)變量并不存在任何線性關(guān)系,但是當(dāng)兩者合并起來(lái)時(shí),由于代表大都市的散點(diǎn)位于左下角,代表非大都市的散點(diǎn)位于右上角,結(jié)果使得兩個(gè)變量之間看似存在正向相關(guān)關(guān)系。這是一個(gè)類似于經(jīng)典的“辛普森悖論”的結(jié)果。
我們進(jìn)一步把非大都市區(qū)的樣本按照區(qū)縣中居委會(huì)與村委會(huì)的配比進(jìn)行細(xì)分,然后進(jìn)行分組分析,結(jié)果如圖3所示。圖3中共有四個(gè)小圖,分別代表4個(gè)二級(jí)抽樣單元中有1個(gè)居委會(huì)到4個(gè)居委會(huì)的情況;根據(jù)CGSS的抽樣方案,這實(shí)際上代表不同的城市化水平。從圖3中可以看出:第一,二級(jí)抽樣單元中居委會(huì)比重越高的區(qū)縣,測(cè)算出來(lái)的基尼系數(shù)也越小,因此散點(diǎn)越靠近左端;第二,基尼系數(shù)與幸福感的關(guān)系方向在第一組中是正向的,在其他三組中是負(fù)向的,總體而言并不存在穩(wěn)定的模式;第三,如果說(shuō)基尼系數(shù)與幸福感之間存在關(guān)系,那么這種關(guān)系的強(qiáng)度也很微弱。①在第三組中存在一個(gè)明顯的離群點(diǎn),我們用三角形表示。為了更好地描繪變量間的關(guān)系趨勢(shì),第三組中的擬合線是排除此離群點(diǎn)之后擬合的。
圖3 非大都市區(qū)中區(qū)分城市化水平分析
通過(guò)對(duì)數(shù)據(jù)生成過(guò)程的了解,我們意識(shí)到前面的模型是需要修正的。第一,模型遺漏了一項(xiàng)最為重要的變量——所屬區(qū)縣的類型(大都市/非大都市)。這一遺漏變量與基尼系數(shù)的取值有非常強(qiáng)的相關(guān)關(guān)系,與幸福感之間也有較強(qiáng)的相關(guān)關(guān)系。我們必須把這一變量補(bǔ)充到模型當(dāng)中,再來(lái)進(jìn)行檢驗(yàn)。第二,在大都市樣本中“上?!钡貐^(qū)具有較為特殊的性質(zhì),它進(jìn)入樣本與否會(huì)使大城市地區(qū)的分析結(jié)果發(fā)生極大改變,因此我們有必要把“是否上?!弊鳛閱为?dú)變量納入模型中,以增強(qiáng)模型分析的穩(wěn)健性。第三,大都市樣本中在區(qū)縣層面是沒有代表性的,因此相對(duì)于非大都市樣本而言,我們必須更為保守地對(duì)待其分析結(jié)果。
據(jù)此,我們分別對(duì)大都市和非大都市區(qū)縣進(jìn)行最為簡(jiǎn)單的OLS回歸(表3模型6)。結(jié)果表明,無(wú)論在大都市區(qū)還是非大都市區(qū),區(qū)縣基尼系數(shù)與幸福感之間的關(guān)系在統(tǒng)計(jì)上都是不顯著的。在區(qū)分了區(qū)縣類型之后,原先的結(jié)論被否決了。當(dāng)然,OLS回歸在統(tǒng)計(jì)估計(jì)上并不是最佳的選擇,考慮到因變量的定序?qū)哟我约皵?shù)據(jù)的層級(jí)特性,我們需要選用HGLM模型來(lái)進(jìn)行更精準(zhǔn)的估計(jì)(表3模型7)。在采用了HGLM模型之后,部分系數(shù)的估計(jì)及其顯著性水平確實(shí)發(fā)生了改變,但是整體而言改變并不大。尤其是,區(qū)縣基尼系數(shù)的效應(yīng)無(wú)論在大都市區(qū)還是在非大都市區(qū)都是不顯著的。
表3 納入?yún)^(qū)縣類型之后的模型估計(jì)
對(duì)于前述“曲線關(guān)系”的說(shuō)法,我們也進(jìn)行了驗(yàn)證。在區(qū)分了大城市樣本與非大城市樣本之后進(jìn)行的HGLM模型中,基尼系數(shù)與基尼系數(shù)的平方項(xiàng)均不顯著(模型估計(jì)在此略去)。由于遺漏了地區(qū)類型這樣一個(gè)關(guān)鍵變量,原先的模型分析存在誤導(dǎo)性。事實(shí)上,一旦引入這一變量進(jìn)行分組分析,區(qū)縣基尼系數(shù)的效應(yīng)就可能會(huì)消失或者大幅降低;區(qū)縣基尼系數(shù)與幸福感之間的關(guān)系并不是穩(wěn)健存在的。①我們根據(jù)樣本中居委會(huì)與村委會(huì)的配比(這又是由其城市化水平?jīng)Q定的)將非大城市樣本分為四組,然后分組進(jìn)行了回歸模型擬合。結(jié)果同樣顯示,在每一組中區(qū)縣基尼系數(shù)對(duì)于幸福感的效應(yīng)在統(tǒng)計(jì)上均不顯著。
上述結(jié)論是與CGSS數(shù)據(jù)的抽樣方式相關(guān)的。許多研究者意識(shí)到從CGSS數(shù)據(jù)中計(jì)算區(qū)縣基尼系數(shù)可能存在較大誤差,因此從更大規(guī)模的數(shù)據(jù)(如全國(guó)1%人口抽樣調(diào)查)中去取得相對(duì)準(zhǔn)確的地市基尼系數(shù)估計(jì)值,然后與CGSS數(shù)據(jù)進(jìn)行匹配關(guān)聯(lián)。②巫錫煒、肖珊珊:《地區(qū)差異與我國(guó)居民主觀幸福感》;Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”這樣計(jì)算出來(lái)的基尼系數(shù)誤差會(huì)相對(duì)較小。但是在這樣的數(shù)據(jù)生成過(guò)程中,基尼系數(shù)測(cè)算值與地區(qū)類型之間的關(guān)聯(lián)是否存在,這仍然是值得探索的問(wèn)題。我們需要去追問(wèn)是哪些縣市在推動(dòng)變量關(guān)系得以呈現(xiàn),然后去進(jìn)行分組分析或引入新的控制變量,才能真正澄清變量關(guān)系的真實(shí)模式。③如前所述,構(gòu)建面板數(shù)據(jù)也并不能夠真正解決遺漏變量可能帶來(lái)的偏差。在進(jìn)行面板數(shù)據(jù)分析之后,我們?nèi)匀恍枰プ穯?wèn)是哪些縣市在推動(dòng)變量關(guān)系得以呈現(xiàn):哪些縣市的收入不平等程度出現(xiàn)了上升,哪些縣市出現(xiàn)了下降。我們利用CGSS2010—2015年數(shù)據(jù)構(gòu)建了省級(jí)層面的面板數(shù)據(jù),盡管對(duì)面板數(shù)據(jù)的初始分析會(huì)呈現(xiàn)出統(tǒng)計(jì)顯著的變量關(guān)系,但一旦引入地區(qū)類型變量后,就會(huì)發(fā)現(xiàn)變量關(guān)系至少在非大都市區(qū)中并不穩(wěn)健,在大都市中的顯著關(guān)系也主要起因于少數(shù)城市的特殊變化。限于篇幅,對(duì)面板數(shù)據(jù)的分析在此無(wú)法呈現(xiàn),有待未來(lái)深入討論。
如前所述在對(duì)區(qū)縣基尼系數(shù)與幸福感(及其他主觀指標(biāo))的研究中,存在一種令人困惑的現(xiàn)象:區(qū)縣基尼系數(shù)的效應(yīng)方向時(shí)而為正時(shí)而為負(fù),并不確定。對(duì)此的解釋之一是區(qū)縣基尼系數(shù)的測(cè)算中存在較大的測(cè)量誤差,但前面的分析揭示出了另一種可能的解釋。在圖4中,我們利用假想數(shù)據(jù)對(duì)此進(jìn)行直觀演示。
圖4 利用假想數(shù)據(jù)演示的兩種可能性
在圖4中,方形散點(diǎn)代表來(lái)自大城市地區(qū)的區(qū)縣;圓形散點(diǎn)代表來(lái)自非大城市的區(qū)縣。大城市的多數(shù)區(qū)縣的基尼系數(shù)測(cè)算值都低于來(lái)自非大城市的區(qū)縣。如果對(duì)大城市和非大城市進(jìn)行分組分析,區(qū)縣基尼系數(shù)與幸福感之間并不存在關(guān)聯(lián)(圖中的虛線代表分組的回歸線)。但是一旦把兩組數(shù)據(jù)合并而不加區(qū)分,那么區(qū)縣基尼系數(shù)與幸福感就會(huì)呈現(xiàn)出一種有關(guān)聯(lián)的假象(圖中的實(shí)線代表不分組的回歸線)。更重要的是,此時(shí)如果樣本中的大城市地區(qū)幸福感低于其他地區(qū)時(shí),不分組估計(jì)出來(lái)的基尼系數(shù)效應(yīng)值就是正的(如圖4中左圖所示);當(dāng)樣本中的大城市地區(qū)幸福感高于其他地區(qū)時(shí),不分組估計(jì)出來(lái)的基尼系數(shù)效應(yīng)值就是負(fù)的(如圖4中右圖所示)。當(dāng)然無(wú)論正負(fù),這種效應(yīng)其實(shí)都只是一種“統(tǒng)計(jì)假象”。①以往文獻(xiàn)中發(fā)現(xiàn)區(qū)縣基尼系數(shù)與幸福感呈負(fù)向關(guān)系的研究多數(shù)采用的是CGSS2003—CGSS2006年數(shù)據(jù),而發(fā)現(xiàn)區(qū)縣基尼系數(shù)與幸福感呈正向關(guān)系的研究多數(shù)采用的是CGSS2010—CGSS2013年數(shù)據(jù)。CGSS2003—CGSS2006數(shù)據(jù)不再公開案例所在區(qū)縣編碼,我們無(wú)法就上述推斷進(jìn)行直接驗(yàn)證。不過(guò),從CGSS2010—CGSS2013年數(shù)據(jù)看,這幾年中大都市居民的幸福感確實(shí)有所下降。
上述一系列考察達(dá)到的最終結(jié)論是:地區(qū)基尼系數(shù)與幸福感的統(tǒng)計(jì)關(guān)聯(lián)并不穩(wěn)健,至少當(dāng)前我們并沒有足夠堅(jiān)實(shí)的統(tǒng)計(jì)證據(jù)能夠判定兩者的關(guān)聯(lián)機(jī)制和方式。這樣一個(gè)結(jié)論似乎是完全否定性的,其實(shí)不然。在本文開頭提及的默頓的那篇文章中,他還提到了科學(xué)研究中的另一個(gè)常見現(xiàn)象:“明確的無(wú)知”(specified ignorance)往往是通向知識(shí)的道路的第一步。所謂“明確的無(wú)知”,就是明確我們?cè)谀男┓矫嫘枰私舛€沒有足夠的了解。它不是對(duì)知識(shí)無(wú)限性的泛泛而談,而是需要經(jīng)過(guò)努力才能夠明確的內(nèi)容。因此,我們的結(jié)論并不完全是否定性的,其中包括了未來(lái)應(yīng)該努力澄清的機(jī)制解釋方向。
如前所述,研究地區(qū)基尼系數(shù)與幸福感的關(guān)系,其理論意義在于探討行動(dòng)者的主觀觀念或主觀感受與所處社會(huì)情境的客觀特征之間的關(guān)聯(lián)機(jī)制。我們意識(shí)到,在這里需要澄清的幾個(gè)重要問(wèn)題如下:
1.在行動(dòng)者的日常生活世界中,他們對(duì)于社會(huì)平等程度的感知何種程度上取決于微觀生活情境中的具體關(guān)系性體驗(yàn),何種程度上取決于宏觀世界中的抽象性測(cè)量(如“地區(qū)基尼系數(shù)”)?或者,抽象性測(cè)量是如何能夠通過(guò)日常生活世界的中介而能夠被行動(dòng)者感知到的?
2.如果說(shuō)行動(dòng)者對(duì)社會(huì)平等程度的感知是有時(shí)間和空間的限定的,那么他能夠感知的平等程度的參照系在空間上有多大范圍?是否不同的行動(dòng)者有著不同的空間參照系范圍?
3.都市與非都市區(qū)構(gòu)成了完全不同的社會(huì)情境。在不同的生活情境中,人們對(duì)于社會(huì)平等程度的感知機(jī)制是否一樣?他們對(duì)社會(huì)平等程度的重視程度是否一樣?
只要上述三個(gè)問(wèn)題還沒有澄清,我們就不太可能確信自己掌握了地區(qū)基尼系數(shù)與幸福感之間的因果關(guān)聯(lián)。例如,如果行動(dòng)者對(duì)社會(huì)平等的感知完全取決于具體關(guān)系性體驗(yàn),而與抽象性測(cè)量只有微弱的間接關(guān)系;如果行動(dòng)者對(duì)社會(huì)平等的感知的空間參照范圍根本不是自己所在的區(qū)縣;如果在特定情境中,行動(dòng)者對(duì)社會(huì)平等根本并不在意,那么上述兩個(gè)變量之間就不可能存在穩(wěn)健的關(guān)聯(lián)。行動(dòng)者的主觀感覺過(guò)程是復(fù)雜而微妙的,它不會(huì)從根本上脫離客觀結(jié)構(gòu)的限定,但也不會(huì)是抽象的客觀結(jié)構(gòu)的直接對(duì)應(yīng)物。未來(lái)的研究應(yīng)當(dāng)針對(duì)上述分解之后的每個(gè)具體機(jī)制環(huán)節(jié)進(jìn)行探索與驗(yàn)證。
最后我們進(jìn)行一點(diǎn)方法上的反思。阿博特曾說(shuō),“好多人把社會(huì)科學(xué)當(dāng)成了獨(dú)角戲,而非二重奏。他們眼里,社會(huì)科學(xué)就是自己的一番長(zhǎng)篇大論之后,再拋出一個(gè)刻板的問(wèn)題,現(xiàn)實(shí)則像舊小說(shuō)里的矯情淑女,只是點(diǎn)頭或搖頭。真正的研究者不一樣。他們知道,現(xiàn)實(shí)才不那么老實(shí),它有層出不窮的花招來(lái)戲弄和挑逗研究者,直覺和方法之間在不斷進(jìn)行交鋒。社會(huì)科學(xué)實(shí)踐并不是舊小說(shuō),而是現(xiàn)代言情劇?!雹貯bbott,A.,Methodsof Discovery:Heuristicsfor the Social Sciences,New York:Norton,2004,p.3.那種單純以系數(shù)的統(tǒng)計(jì)顯著性為指引和目標(biāo)的定量研究方式,看起來(lái)確實(shí)很像阿博特所戲謔的“舊小說(shuō)”,尤其是它似乎不太明白,有時(shí)候現(xiàn)實(shí)世界這位淑女點(diǎn)頭與搖頭回應(yīng)的可能根本不是自己所提出的那個(gè)問(wèn)題。要真正理解點(diǎn)頭搖頭的意思,辦法只能是坐下來(lái)與她進(jìn)行多輪交流。
因此,我們得到統(tǒng)計(jì)參數(shù)顯著的結(jié)果而驗(yàn)證了自己的預(yù)設(shè)時(shí),研究并沒有結(jié)束,甚至這只是研究的開始。統(tǒng)計(jì)學(xué)家費(fèi)舍爾(Ronald Fisher)在被問(wèn)及如何在觀察研究中從相關(guān)中推出因果時(shí),曾經(jīng)回應(yīng)說(shuō):“把你的理論充分展開”(Make your theories elaborate),也就是說(shuō)“在構(gòu)建因果假設(shè)時(shí),研究者要盡可能充分地展現(xiàn)這個(gè)道理的各種不同后果,然后再用觀察研究來(lái)發(fā)現(xiàn)每個(gè)后果是否都能立得住”。②Cochran,W.G.and Chambers,S.P.,“The Planning of Observational Studies of Human Populations,”Journal of the Royal Statistical Society,Series A(General),vol.128,no.2,1965,pp.234-266.在社會(huì)學(xué)的研究中,這意味著我們需要從變量關(guān)系的表述再回到對(duì)社會(huì)情境與社會(huì)主體的理解上:是誰(shuí)推動(dòng)了這樣一種統(tǒng)計(jì)結(jié)果得以呈現(xiàn)?如何推動(dòng)?它又出現(xiàn)在何種社會(huì)情境中?數(shù)據(jù)的細(xì)節(jié)與上述理解相符嗎?我們需要從單一的經(jīng)驗(yàn)假設(shè)中推衍出豐富的經(jīng)驗(yàn)細(xì)節(jié),然后去數(shù)據(jù)中再進(jìn)行驗(yàn)證。當(dāng)然,不可能所有的細(xì)節(jié)都能被完美地驗(yàn)證,但是這個(gè)過(guò)程中蘊(yùn)含了對(duì)社會(huì)世界產(chǎn)生新洞見的可能性。研究就不再是線性的假設(shè)驗(yàn)證過(guò)程,而成為在經(jīng)驗(yàn)數(shù)據(jù)與解釋邏輯之間循環(huán)往復(fù)從而不斷逼近事實(shí)真相的過(guò)程。③Lieberson,S.and Horwich,J.,“Implication Analysis:A Pragmatic Proposal for Linking Theory and Data in the Social Sciences,”Sociological Methodology,vol.38,no.1,2008,pp.1-50.
在這個(gè)過(guò)程中,對(duì)數(shù)據(jù)生成過(guò)程的認(rèn)真推敲是非常重要的。任何數(shù)據(jù)都是通過(guò)人為手段經(jīng)過(guò)一定程序在某一“社會(huì)”空間和“社會(huì)”時(shí)間中得來(lái)的,因此有必要對(duì)數(shù)據(jù)收集方式帶來(lái)的可能后果進(jìn)行思考。如果不能夠深入數(shù)據(jù)本身,不對(duì)數(shù)據(jù)生成過(guò)程進(jìn)行推敲,忽視細(xì)節(jié)核對(duì)與分組分析,即便使用再“高級(jí)”的統(tǒng)計(jì)模型與技巧,定量研究也仍然會(huì)衍生出大量缺失穩(wěn)健性的結(jié)論。在社會(huì)學(xué)研究的“可復(fù)制性”④Freese,Jeremy and David Peterson,“Replication in Social Science,”Annual Review of Sociology,vol.43,no.1,2017,pp.147-165.已經(jīng)引起諸多研究者重視的當(dāng)下,這一點(diǎn)尤其需要強(qiáng)調(diào)。