孫秀林
(上海大學(xué) 社會(huì)學(xué)院,上海 200444)
·城市社會(huì)學(xué)研究的空間分析視角(學(xué)術(shù)主持人:孫秀林)·
社會(huì)科學(xué)中的空間分析:概念、技術(shù)和應(yīng)用實(shí)例
孫秀林
(上海大學(xué) 社會(huì)學(xué)院,上海 200444)
主持人語(yǔ):在社會(huì)學(xué)尤其是城市社會(huì)學(xué)的發(fā)展史上,空間分析占有非常重要的地位。1920年代芝加哥學(xué)派的興起,就是源于對(duì)于城市空間居住形態(tài)及其機(jī)制的闡釋。在城市社會(huì)學(xué)的諸多經(jīng)典研究領(lǐng)域中,如少數(shù)群體的居住隔離與聚居、城市貧困與貧民區(qū)、鄰里與社區(qū)對(duì)地方社會(huì)結(jié)構(gòu)的影響、越軌行為的空間分布模式、城市內(nèi)的居住遷移模式、城市公共服務(wù)設(shè)施的可達(dá)性等等,都與空間概念緊密結(jié)合在一起。近年來(lái),隨著帶有地理信息的數(shù)據(jù)(如微博數(shù)據(jù)、電商數(shù)據(jù)、交通卡數(shù)據(jù)、消費(fèi)數(shù)據(jù)等)日益增多,以及統(tǒng)計(jì)模型在集群抽樣、空間相關(guān)性、多層建模和空間回歸方面的進(jìn)展,城市空間分析獲得了越來(lái)越多的重視。相對(duì)于西方社會(huì)科學(xué)界日益廣泛應(yīng)用的空間概念和空間分析技術(shù),國(guó)內(nèi)對(duì)于城市社會(huì)學(xué)的關(guān)注更多偏重人文主義分析,對(duì)于量化的實(shí)證分析則比較缺乏,對(duì)空間概念的實(shí)證分析尚未得到足夠重視。
本欄目的三篇文章,就是試圖使用量化的分析方法,考察空間因素在城市研究的不同議題中的作用機(jī)制以及呈現(xiàn)形式。需要說(shuō)明的是,量化的空間概念如何納入社會(huì)學(xué)現(xiàn)有研究議題中,仍然是一個(gè)需要不斷摸索的過(guò)程。國(guó)內(nèi)城市社會(huì)學(xué)的研究,即使引入量化研究的范式,也應(yīng)該從理論層面討論中國(guó)城市發(fā)展的形成機(jī)制與內(nèi)在邏輯,只有這樣,我們才會(huì)形成真正有學(xué)術(shù)生命力的城市研究。這三篇文章,僅僅是這一努力方向的一個(gè)初步成果,希望能有拋磚引玉的作用。
在社會(huì)科學(xué)的研究中,空間分析占有非常重要的地位。對(duì)這一重要概念的忽略,有可能遮蔽我們對(duì)于現(xiàn)實(shí)世界的更深入了解。但是,遺憾的是,在國(guó)內(nèi)社會(huì)科學(xué)的相關(guān)研究領(lǐng)域中,空間的量化分析一直是缺失的。本文試圖簡(jiǎn)單地梳理空間分析的一些核心概念和分析技術(shù),并通過(guò)一個(gè)社會(huì)組織的實(shí)例,演示如何在社會(huì)學(xué)的分析模型中納入空間這一概念,以期對(duì)學(xué)界有所裨益。
空間分析;空間回歸;社會(huì)組織
在西方社會(huì)科學(xué)研究領(lǐng)域中,空間概念和技術(shù)一直得到廣泛的應(yīng)用,包括流行病學(xué)、公共衛(wèi)生與健康、人口學(xué)、社會(huì)學(xué)、政治學(xué)、公共管理等學(xué)科。在社會(huì)科學(xué)的發(fā)展史上,空間分析占有非常重要的地位。1920年代芝加哥學(xué)派的興起,很大程度上源于對(duì)于城市空間居住形態(tài)及其機(jī)制的闡釋,隨后發(fā)展出來(lái)對(duì)于城市居住模式、居住隔離、犯罪與自殺問(wèn)題、城市亞文化研究的議題,空間分析的概念一直受到重視。
社會(huì)學(xué)自創(chuàng)立之初就格外關(guān)注社會(huì)底層群體,如城市中少數(shù)群體的居住隔離與聚居,城市貧困與貧民區(qū),鄰里、社區(qū)及地方社會(huì)結(jié)構(gòu)在城市發(fā)展中的作用,城市中越軌行為的空間分布模式,城市內(nèi)的居住遷移模式,城市公共服務(wù)設(shè)施的可達(dá)性等等,都是城市社會(huì)學(xué)研究經(jīng)久不衰的經(jīng)典題目,而這些研究領(lǐng)域,都與空間分析概念緊密結(jié)合在一起。在新近的一篇文章中,羅根(John Logan)呼吁社會(huì)科學(xué)研究更多地關(guān)注空間概念。他認(rèn)為,在當(dāng)代社會(huì)科學(xué)的發(fā)展過(guò)程中,隨著大規(guī)模包含地理信息的調(diào)查數(shù)據(jù)日益增多,空間分析正在獲得強(qiáng)勁的發(fā)展,空間分析的可用性也在不斷增長(zhǎng),空間分析在社會(huì)科學(xué)中有更大的研究需求。同時(shí),隨著計(jì)算機(jī)技術(shù)的發(fā)展,以及統(tǒng)計(jì)程序在集群抽樣、空間相關(guān)性、多層建模和空間回歸方面的進(jìn)展,這一研究領(lǐng)域應(yīng)該獲得越來(lái)越多的注意。①John Logan,“Making a Place for Space:Spatial Thinking in Social Science,”in Annual Review of Sociology,vol.38(2012),pp.507-524.
在社會(huì)中,很多現(xiàn)象具有明顯的空間聚類(lèi)特征,即相似的事情在地理空間上也是彼此接近的。如自殺率具有明顯的空間聚集效應(yīng),即使控制了很多可能的變量,周邊地區(qū)實(shí)際上還是會(huì)影響觀測(cè)值,這種現(xiàn)象稱為“空間滯后”(spatial lag),如果忽略這一空間效應(yīng),那么模型的估計(jì)結(jié)果將會(huì)存在很大偏誤。②R.D.Baller,L.Anselin,S.F.Messner,G.Deane,and D.F.Hawkins,“Structural covariates of US county homicide rates:incorporating spatial effects,”in Criminology,vol.39(2001),pp.561–590.在社會(huì)科學(xué)的研究工作中,通過(guò)空間數(shù)據(jù)的可視化,可以使學(xué)者們很容易發(fā)現(xiàn)許多有意思的現(xiàn)象。在西方城市研究的空間分析中,很多都依賴地理信息系統(tǒng)(Geographical Information System,GIS)技術(shù)。這一分析技術(shù)在空間分析方面具有諸多優(yōu)勢(shì):首先,很多零散的數(shù)據(jù)一旦做成地圖,很多空間特征就會(huì)一目了然,從而可以發(fā)現(xiàn)一些傳統(tǒng)研究方法容易忽略的特征。如在大都市地區(qū)不同社會(huì)群體的居住和工作在空間分布上的不同形態(tài),可能存在明顯的空間不平等現(xiàn)象。其次,快速發(fā)展的空間統(tǒng)計(jì)方法,如空間相關(guān)指數(shù)(Moran’s I)、空間回歸分析模型(Spatial Regression Model)等,可以修正傳統(tǒng)數(shù)據(jù)模型中可能存在的空間自相關(guān)問(wèn)題,從而讓學(xué)者對(duì)不同變量之間的關(guān)系進(jìn)行更精確的分析。
近年來(lái),社區(qū)效應(yīng)或者稱為鄰里效應(yīng)(Neighborhood Effect),也得到越來(lái)越廣泛的關(guān)注。③Robert Sampson,Great American City,Chicago and London:The University of Chicago Press,2012.研究表明,社區(qū)環(huán)境對(duì)個(gè)體的影響并不僅僅是通過(guò)使用多層次模型(Multilevel Model)就可以解決,也就是說(shuō),不僅僅是個(gè)體所在的社區(qū)會(huì)影響到個(gè)體的某些行為特征,他也會(huì)受到周?chē)鐓^(qū)的影響,這也是“空間滯后”的影響效果。④Basile Chaix,Juan Merlo,S V Subramanian,John Lynch,Pierre Chauvin,“Comparison of a spatial perspective with the multilevel analytical approach in neighborhood studies:the case of mental and behavioral disorders due to psychoactive substance use in Malmo,Sweden,2001”,in American Journal of Epidemiology,vol.162,no.2,(2005),pp.171-182.
遺憾的是,相對(duì)于西方社會(huì)科學(xué)界日益廣泛應(yīng)用的空間概念和空間分析技術(shù),國(guó)內(nèi)社會(huì)科學(xué)界對(duì)空間概念的實(shí)證分析是非常缺乏的。究其原因,一方面是因?yàn)閹в锌臻g屬性的數(shù)據(jù)的缺乏,另一方面是因?yàn)榫唧w分析技術(shù)(包括軟件應(yīng)用)方面的缺乏。⑤孫秀林:《城市研究中的空間分析》,《新視野》2015年第1期。本文試圖用簡(jiǎn)單易懂的語(yǔ)言梳理空間分析的一些核心概念和技術(shù),并通過(guò)一個(gè)現(xiàn)實(shí)的社會(huì)組織的分析示例,展示在社會(huì)學(xué)中如何引入空間這一分析概念,以期對(duì)學(xué)界有所裨益。
在本節(jié),使用一個(gè)假設(shè)的例子(上海市某中心區(qū)的5個(gè)街道),簡(jiǎn)單介紹空間分析中的一些重要概念和計(jì)算方法,包括空間相關(guān)性、空間相鄰性、空間權(quán)重、空間滯后量、空間相關(guān)系數(shù)、空間回歸模型。
(一)空間相關(guān)性
對(duì)于空間相關(guān)性的研究,最早起源于對(duì)倫敦地區(qū)霍亂的分析。19世紀(jì),隨著倫敦地區(qū)的快速城市化,大量人口涌入倫敦地區(qū)。但是,由于公共衛(wèi)生設(shè)施的不足,倫敦受到霍亂的嚴(yán)重沖擊。在當(dāng)時(shí),人們一致認(rèn)為霍亂是由空氣傳播的。John Snow對(duì)這個(gè)觀點(diǎn)頗為懷疑,通過(guò)分析1854年英國(guó)Broad大街的霍亂爆發(fā)地點(diǎn),他發(fā)現(xiàn),死亡發(fā)生地都在Broad街道中部一處水源(水井)周?chē)?,有明顯的地理規(guī)律,而市內(nèi)其它水源周?chē)鷺O少發(fā)現(xiàn)死者(見(jiàn)圖1)。通過(guò)進(jìn)一步調(diào)查,他發(fā)現(xiàn)這些死者都飲用過(guò)這里的井水。據(jù)此,他最終確定了霍亂的源頭及傳播機(jī)制。這一研究開(kāi)啟了學(xué)者對(duì)于空間相關(guān)分析的關(guān)注。
從技術(shù)層面講,通常情況下,在我們使用最小二乘法進(jìn)行回歸分析的時(shí)候,假設(shè)我們關(guān)心的變量Y有n個(gè)觀測(cè)值y1、y2、y3、……、yn,一般我們假設(shè)這些觀測(cè)值之間是相互獨(dú)立并且服從同一分布的,均值為μ,方差為σ2(iid假設(shè))。但是,如果觀測(cè)值之間存在空間相關(guān),通過(guò)經(jīng)典檢驗(yàn)的結(jié)果將是有偏的。如果yi之間存在空間相關(guān),如觀測(cè)值yi與yj在空間上隔得越近相似性越大,那么其方差將會(huì)大于σ2;這種相關(guān)導(dǎo)致均值的真實(shí)標(biāo)準(zhǔn)誤近似于:
圖1 1854年倫敦霍亂地圖
對(duì)于存在空間相關(guān)性的數(shù)據(jù),如果忽略這種相關(guān)性,會(huì)使得基于獨(dú)立同分布假設(shè)(iid)的統(tǒng)計(jì)檢驗(yàn)出現(xiàn)嚴(yán)重的問(wèn)題,將會(huì)導(dǎo)致對(duì)數(shù)據(jù)真實(shí)方差(或標(biāo)準(zhǔn)誤)的低估:σ<σy;根據(jù)公式Z=b/σ,如果σ被低估,那么統(tǒng)計(jì)值Z值就會(huì)被高估;如果高估了統(tǒng)計(jì)值,會(huì)使得研究者更容易拒絕原假設(shè),而這種拒絕是錯(cuò)誤的。①[美]沃德、格里蒂奇:《空間回歸模型》,宋曦譯,格致出版社2012年版。而且,更為嚴(yán)重的是,這種作用并不會(huì)隨著樣本量的增大而消失。②Noel Cressie,Statistics for Spatial Data(Rev.ed.),New York:Wiley,1993.
(二)空間相鄰性
假設(shè)上海某區(qū)的5個(gè)街道,分別用1—5來(lái)表示(圖2)。要標(biāo)示這5個(gè)區(qū)域之間的空間相鄰性,可以有多種方法,如地理上是否相連、行政中心是否在某個(gè)距離之內(nèi)、是否有地鐵直達(dá)、是否能步行10分鐘到達(dá)等等。這種界定,更多地取決于理論假設(shè),如我們甚至可以根據(jù)“街道領(lǐng)導(dǎo)人是否高中同學(xué)、是否曾經(jīng)是同事、是否參加過(guò)同一個(gè)黨校學(xué)習(xí)”等來(lái)界定兩個(gè)街道是否屬于“相鄰”狀態(tài)。
圖2 上海某中心區(qū)5街道地圖
一般來(lái)說(shuō),我們通常使用空間上是否接壤來(lái)界定空間相鄰性??梢园l(fā)現(xiàn),街道1和街道2、4相鄰;街道2和街道1、3、4相鄰;街道3與街道2、4、5相鄰;街道4和其他所有4個(gè)街道都相鄰;街道5與街道3、4相鄰(圖3)??梢园焉蠄D轉(zhuǎn)化為一個(gè)類(lèi)似于社會(huì)網(wǎng)絡(luò)的表格(見(jiàn)表1):
圖3 上海某中心區(qū)5街道的空間相鄰圖
表1 空間相鄰
再進(jìn)一步,我們可以把表1用一個(gè)5*5的矩陣C來(lái)表示,Cij表示空間區(qū)域i與空間區(qū)域j是否相鄰,Cij=1表示空間區(qū)域i與空間區(qū)域j處于相鄰狀態(tài),Cij=0則表示空間區(qū)域i與空間區(qū)域j不相鄰。這一矩陣形式被稱為空間連接矩陣C(見(jiàn)表2)。
表2 空間相鄰矩陣
(三)空間權(quán)重
表3 行標(biāo)準(zhǔn)化的空間權(quán)重矩陣
(四)空間滯后量
給定一個(gè)特定的觀測(cè)值Y,如街道的人口數(shù)、GDP、社會(huì)組織數(shù)量等任意一個(gè)我們感興趣的指標(biāo),將街道i周?chē)噜弳挝籮的觀測(cè)值乘以相對(duì)應(yīng)的空間權(quán)重Wij后相加,得到街道i所有相鄰觀測(cè)值的平均值,Yis= ΣWij*Yi,稱為空間單位(街道)i的空間滯后變量,也可以記做Ys=WY。
以街道1為例,它與街道2、4相鄰,街道2、4的Y值(如人口)分別為25、20,因此街道1的空間滯后為25*0.5+20*0.5=22.5,這表示街道1周?chē)值赖钠骄丝跒?2.5(見(jiàn)表4)。
表4空間滯后量
(五)空間相關(guān)系數(shù)
其中wij是行標(biāo)準(zhǔn)化的空間權(quán)重矩陣,y是我們所關(guān)注的變量。
Moran’s I是一種基于全局分析的空間自相關(guān)(Global Spatial Autocorrelation)的測(cè)量指標(biāo),表示該區(qū)域空間聚集或離散的總體情況。Moran’s I指標(biāo)的值介于-1到1之間,當(dāng)指標(biāo)相似的地區(qū)存在空間聚集時(shí),Moran’s I為正(正相關(guān)),表示觀測(cè)值高的地區(qū)其周?chē)挠^測(cè)值也高,觀測(cè)值低的地區(qū)其周?chē)挠^測(cè)值也低;當(dāng)指標(biāo)相反的地區(qū)存在空間聚集時(shí),Moran’s I為負(fù)(負(fù)自相關(guān)),表示觀測(cè)值高的地區(qū),其周?chē)挠^測(cè)值偏低;而當(dāng)不相關(guān)時(shí),為-1/(n-1)(當(dāng)n足夠大時(shí),其值接近于0)。②M.F.Goodchild,Spatial Autocorrelation,Catmog 47,Geo Books,Norwich,1986.
通過(guò)圖4可以看出,上面例子中的變量Y與其滯后變量之間存在比較明顯的正相關(guān)關(guān)系。某個(gè)地區(qū)單位(街道)的Y(人口數(shù))越大,其周?chē)值赖娜丝跀?shù)也越大。如街道1的人口數(shù)為50,周?chē)值赖钠骄丝跀?shù)為22.5;而街道5的人口數(shù)為5,周?chē)值赖钠骄丝跀?shù)為15。
如同常規(guī)的相關(guān)系數(shù)一樣,Moran’s I系數(shù)在統(tǒng)計(jì)上是否顯著,也是可以進(jìn)行統(tǒng)計(jì)檢驗(yàn)的。對(duì)于Moran’s I系數(shù)的檢驗(yàn),一般采取兩種方法:一種是假設(shè)數(shù)據(jù)分布是正態(tài)的,③A.D.Cliff and J.K.Ord.“Evaluating the Percentage Points of a Spatial Autocorrelation Coefficient”,in Geographical Analysis,vol.4(1971),pp.51-62.一種是假設(shè)數(shù)據(jù)分布是隨機(jī)的,使用蒙特卡洛模擬(Monte Carlo Simulation)進(jìn)行檢驗(yàn)。④Roger S Bivand,Edzer J.Pebesma and Virgilio Gomez-Rubio,Applied Spatial Data Analysis with R,Springer US,2008.通常情況下這兩種方法會(huì)得到相似的結(jié)果。使用第二種方法,對(duì)上述5個(gè)街道的Y進(jìn)行空間相關(guān)性檢驗(yàn),得到Moran’s I系數(shù)為2.37,p值為0.0089。即這5個(gè)街道的Y存在顯著的空間聚集現(xiàn)象,Y值比較大的街道,其周?chē)值赖钠骄鵜值也比較大,反之亦然。
圖4 Moran’s I及顯著性檢驗(yàn)
(六)空間回歸模型
如前所示,如果觀測(cè)值存在顯著的空間相關(guān),那么就不應(yīng)忽略這種會(huì)影響統(tǒng)計(jì)結(jié)果的因素,而應(yīng)將之納入統(tǒng)計(jì)分析模型。在過(guò)去幾十年中,統(tǒng)計(jì)學(xué)家已經(jīng)發(fā)展出了比較成熟的空間回歸模型來(lái)處理這個(gè)問(wèn)題。在當(dāng)今的社會(huì)科學(xué)界,有2種空間回歸模型應(yīng)用最廣:空間滯后模型與空間誤差模型。
傳統(tǒng)的最小二乘法回歸(OLS)可以如下表達(dá):
如果我們將觀測(cè)變量Y的空間滯后變量WY認(rèn)為是Y的一種本質(zhì)特征,而不是一種統(tǒng)計(jì)上的干擾,即某一特定觀測(cè)單位i周?chē)臻g單位的平均Y會(huì)對(duì)地區(qū)i的Y產(chǎn)生影響,如GDP高的地區(qū),其周?chē)貐^(qū)的平均GDP也會(huì)比較高,那么,可以把這種空間滯后變量的影響效果獨(dú)立出來(lái),并納入回歸模型進(jìn)行分析。可以將上式中的誤差項(xiàng)分解為兩項(xiàng):因變量的空間滯后項(xiàng)和自變量的誤差,即:ε=ρWY+μ
代入式(1),就得到空間滯后回歸模型(spatial lag model):
ρ表示因變量Y的空間滯后項(xiàng)WY對(duì)因變量的影響效果。
或者,如果我們把空間相關(guān)看做一種統(tǒng)計(jì)干擾,認(rèn)為模型中的誤差項(xiàng)雖然在空間上是相關(guān)的,但并非由因變量的空間滯后導(dǎo)致,那么,可以將誤差項(xiàng)拆分為兩個(gè)部分:包含空間因素的誤差項(xiàng)與空間不相關(guān)的誤差項(xiàng),即:ε=λWξ+μ
代入式(1),就得到空間誤差回歸模型(spatial error model):
λ表示相鄰觀測(cè)值的空間誤差項(xiàng)Wξ的相關(guān)程度,如果觀測(cè)值i和觀測(cè)值j之間的誤差項(xiàng)在空間上不存在相關(guān)關(guān)系,則λ=0,上式可簡(jiǎn)化為傳統(tǒng)的OLS模型。
在本節(jié)中,筆者使用上海市2010年社會(huì)組織的數(shù)據(jù),進(jìn)行一個(gè)實(shí)際的空間回歸分析,對(duì)空間分析的應(yīng)用進(jìn)行演示。
(一)數(shù)據(jù)說(shuō)明
上海市社會(huì)組織的數(shù)據(jù)來(lái)自于上海社團(tuán)管理部門(mén)網(wǎng)站(“上海社會(huì)組織”網(wǎng)站)所公示的上海所有在冊(cè)社會(huì)組織信息,通過(guò)“網(wǎng)絡(luò)爬蟲(chóng)”,我們獲得了上海所有在冊(cè)社會(huì)組織的如下變量:組織名稱、組織注冊(cè)代碼、注冊(cè)時(shí)間、證書(shū)有效時(shí)間、組織類(lèi)型、注冊(cè)地、主管單位、法人代表、地址、郵編、電話、網(wǎng)址、主要業(yè)務(wù)內(nèi)容以及獎(jiǎng)懲情況等變量信息。網(wǎng)絡(luò)爬取時(shí)間為2014年1月1日。
國(guó)內(nèi)社會(huì)組織分為三種類(lèi)型,包括民辦非企業(yè)組織、社會(huì)團(tuán)體和基金會(huì)。在本文的實(shí)際分析中,僅保留了2010年及之前成立的“民辦非企業(yè)組織”作為分析的示例。①之所以選取2010年作為分析,是因?yàn)楣P者手頭的自變量主要來(lái)自于2010年六普數(shù)據(jù)。本文使用的所有源代碼均可公開(kāi),讀者如有興趣,歡迎給作者來(lái)信。本文使用的軟件為R,下文所有結(jié)果均由R軟件計(jì)算得到。②R Core Team,R:A language and environment for statistical computing,R Foundation for Statistical Computing,Vienna,Austria,2014,URL http://www.R-project.org/.
(二)自變量
用于分析的自變量數(shù)據(jù),主要來(lái)自《中國(guó)2010年人口普查分鄉(xiāng)、鎮(zhèn)、街道資料》中的上海部分?jǐn)?shù)據(jù),包括總?cè)丝凇?4歲以下人口、60歲以上人口、戶籍人口等幾個(gè)核心指標(biāo)。
還有一部分地理信息的自變量,通過(guò)R中的GIS包生成,包括街道/鄉(xiāng)鎮(zhèn)面積、是否屬于鄉(xiāng)鎮(zhèn)(虛擬變量,鄉(xiāng)鎮(zhèn)=1。在上海,鄉(xiāng)鎮(zhèn)具有獨(dú)立的財(cái)政,而街道沒(méi)有),是否屬于中心城區(qū)(虛擬變量,中心城區(qū)=1)。
(三)社會(huì)組織的空間分布
在進(jìn)行模型分析之前,首先進(jìn)行分析數(shù)據(jù)的前期準(zhǔn)備工作,包括:(1)讀取上海地圖數(shù)據(jù),一般是GIS軟件通用的shape格式(polygon);(2)讀取社會(huì)組織數(shù)據(jù),通常是外部文件,包括stata格式、文本格式、excel格式等等,然后轉(zhuǎn)化為shape格式的點(diǎn)圖(point)格式;(3)讀取人口數(shù)據(jù),通常為excel格式;(4)將人口數(shù)據(jù)與地圖數(shù)據(jù)合并、生成我們需要的一系列測(cè)量指標(biāo)(如街道/鄉(xiāng)鎮(zhèn)面積、是否屬于鄉(xiāng)鎮(zhèn)、是否屬于中心城區(qū))。在數(shù)據(jù)準(zhǔn)備完成之后,可以先進(jìn)行數(shù)據(jù)的地圖展示,比如社會(huì)組織的空間分布、歷史發(fā)展、頻數(shù)分布等。
圖5 上海社會(huì)組織分布圖
從圖5可以看出,上海社會(huì)組織的分布,存在明顯的空間聚集,具體表現(xiàn)為:(1)在中心城區(qū),存在密集的空間分布形態(tài);(2)在各個(gè)區(qū)縣的中心地區(qū),社會(huì)組織的分布更密集一些,呈現(xiàn)明顯的中心化趨勢(shì)。
從成立年份可以看出,民辦非企業(yè)組織在2000年之后開(kāi)始迅猛發(fā)展,且一直保持比較高的發(fā)展速度,每年都有約500個(gè)新的民辦非企業(yè)組織成立。
圖6是民辦非企業(yè)組織的分布密度圖。從圖中可以看出,雖然這個(gè)變量的分布不是完全正態(tài)分布,但比較接近正態(tài)分布,因此本文使用線性模型(Linear Model)進(jìn)行估計(jì)。①根據(jù)觀測(cè)變量的分布,空間回歸模型已經(jīng)發(fā)展出適用于二項(xiàng)分布、poisson分布等的不同模型。這些模型相對(duì)更加復(fù)雜,本文不進(jìn)行介紹。
圖6 上海民辦非企業(yè)組織的分布密度
(四)空間相鄰與空間權(quán)重
空間權(quán)重矩陣是進(jìn)行空間回歸分析的必要前提。引入不同的空間權(quán)重矩陣,可能會(huì)導(dǎo)致不同的模型結(jié)果(當(dāng)然,對(duì)于不同空間權(quán)重的界定,更需要來(lái)源于理論上對(duì)于觀測(cè)變量的理解)。本文使用地理空間是否接壤(Queen)來(lái)界定上海市街道的空間相鄰。利用空間相鄰矩陣C,生成用于后文分析的空間權(quán)重矩陣W,空間權(quán)重矩陣采用行標(biāo)準(zhǔn)化的方法。圖7展示了本文使用數(shù)據(jù)的空間相鄰圖。
(五)Moran’s I檢驗(yàn)
圖7 上海街道的空間相鄰圖
我們關(guān)注的觀測(cè)變量,是否存在空間相關(guān)性,可以使用Moran’s I系數(shù)進(jìn)行檢驗(yàn)。如果檢驗(yàn)不顯著,說(shuō)明并不存在明顯的空間相關(guān),那可以使用傳統(tǒng)的OLS進(jìn)行估計(jì);如果檢驗(yàn)顯著,則認(rèn)為存在明顯的空間相關(guān)關(guān)系,也就是說(shuō),某個(gè)街道的社會(huì)組織數(shù)目,受到周?chē)值郎鐣?huì)組織數(shù)目的影響,在這種情況下,忽略空間影響的效果,OLS估計(jì)的結(jié)果將是有嚴(yán)重問(wèn)題的,需要使用空間回歸模型來(lái)進(jìn)行估計(jì)。
通過(guò)Moran’s I檢驗(yàn),民辦非企業(yè)組織的Moran’s I統(tǒng)計(jì)值為7.76,在0.0001的水平上顯著(見(jiàn)圖8),也就是說(shuō),“2010年上海市民辦非企業(yè)組織”這一觀測(cè)值在空間上存在統(tǒng)計(jì)顯著的空間聚集效應(yīng),民辦非企業(yè)組織數(shù)目多的街道,其周?chē)值赖拿穹墙M織平均數(shù)也高。因此,在這種情況下,對(duì)于社會(huì)組織的分析,應(yīng)將空間滯后變量納入模型估計(jì)當(dāng)中,需要使用空間回歸模型而非OLS模型來(lái)進(jìn)行估計(jì)。
圖8 上海民辦非企業(yè)組織的空間相關(guān)性檢驗(yàn)
(六)空間回歸模型結(jié)果
對(duì)于空間滯后模型或者空間誤差模型的選擇,更多取決于理論的假設(shè)。如果我們把空間相關(guān)看作一種統(tǒng)計(jì)干擾,那么就選擇空間誤差模型;如果我們將觀測(cè)變量的空間滯后變量看作是影響觀測(cè)變量的一種本質(zhì)特征,即某一特定觀測(cè)單位周?chē)臻g單位的數(shù)值會(huì)與周?chē)ハ嘤绊?,則選擇空間滯后模型。一般來(lái)說(shuō),社會(huì)科學(xué)家更傾向于選擇空間滯后模型,即把觀測(cè)變量的空間滯后項(xiàng)作為影響觀測(cè)變量的因素納入模型。本文僅考慮空間滯后的回歸分析。
事實(shí)上,對(duì)于空間回歸模型的選擇,可以進(jìn)行一個(gè)統(tǒng)計(jì)檢驗(yàn),看具體是存在空間滯后效應(yīng)還是空間誤差效應(yīng)。本文也進(jìn)行了檢驗(yàn),結(jié)果顯示,模型存在明顯的空間滯后效應(yīng),而非空間誤差效應(yīng)。①Lucas Anselin,I.Syabri,and Y.Kho,“GeoDa:An Introduction to Spatial Data Analysis”,in Geographical Analysis,vol.38(2006),pp.5-22.對(duì)于空間滯后效應(yīng)回歸模型的估計(jì),有兩種不同的估計(jì)方式:一種是使用最大似然法(Maximum Likelihood,ML);另外一種是二階段估計(jì)方法(two stage OLS),通過(guò)把解釋變量的空間滯后項(xiàng)作為因變量的工具變量(IV),在同步聯(lián)立方程組中使用二階段最小二乘法來(lái)擬合模型。②Lucas Anselin,Spatial Econometrics:Methods and Models,Kluwer,Dordrecht,1988.前者在R中使用“spdep”包的“l(fā)agsarlm”命令,后者使用“stsls”命令,本文使用第二種方法進(jìn)行估計(jì)。
在空間回歸模型Y=Xβ+ρWY+μ中,系數(shù)ρ表示Y的空間滯后項(xiàng)的影響效果,系數(shù)ρ顯著則表示存在空間滯后效應(yīng);系數(shù)ρ不顯著,則表示不存在空間滯后效應(yīng),即空間滯后項(xiàng)對(duì)Y沒(méi)有顯著影響。表5分別呈現(xiàn)了最小二階段回歸模型(OLS)、使用二階段估計(jì)方法的空間滯后回歸模型(two stages Spatial Lag Model)的結(jié)果。③為了檢驗(yàn)?zāi)P偷姆€(wěn)健性(Robustness),本文嘗試使用了不同的變量界定方式,如取百分比方式、取log方式等,模型結(jié)果都是一致的。
表5 民辦非企業(yè)組織的回歸結(jié)果
從模型結(jié)果可以看出,“民辦非企業(yè)組織”的二階段估計(jì)方法的空間滯后回歸模型(Spatial Lag)的結(jié)果顯示,系數(shù)ρ是非常顯著的。這說(shuō)明,街道i周?chē)值赖纳鐣?huì)組織數(shù)目會(huì)對(duì)街道i的社會(huì)組織數(shù)產(chǎn)生顯著的影響;而且,這一系數(shù)的符號(hào)為正,說(shuō)明街道的社會(huì)組織數(shù)目與周?chē)纳鐣?huì)組織數(shù)目存在正向的相關(guān)關(guān)系,即周?chē)纳鐣?huì)組織數(shù)目越多,街道本身的社會(huì)組織數(shù)目也會(huì)越多。
在這種情況下,如果僅僅使用OLS方法進(jìn)行分析,會(huì)忽略非常重要的空間聚集效應(yīng),在這種情況下,OLS的估計(jì)也是有問(wèn)題的。對(duì)于這一點(diǎn),從模型結(jié)果的常數(shù)項(xiàng)可以看出,在OLS模型中,常數(shù)項(xiàng)是非常顯著的,而在控制空間滯后效應(yīng)后,常數(shù)項(xiàng)則變得不顯著。從對(duì)現(xiàn)實(shí)世界的實(shí)質(zhì)理解上,這表明,社會(huì)組織的發(fā)展存在明顯的空間聚集,這也許與地方政府之間的組織模仿行為有關(guān)。在經(jīng)驗(yàn)?zāi)P椭?,如果忽略這點(diǎn),對(duì)于經(jīng)驗(yàn)世界的理解是有偏差的。
從民辦非企業(yè)組織的回歸結(jié)果可以看出,在加入空間效應(yīng)之后,原先在OLS模型中顯著的變量如“是否鄉(xiāng)鎮(zhèn)”變得不顯著,說(shuō)明這一變量的作用與空間效應(yīng)是重合的,在控制空間效應(yīng)之后,這一變量對(duì)于民非組織的影響效果消失了。在這種情況下,如果忽略空間滯后效果,僅僅使用OLS模型進(jìn)行估計(jì),得到的結(jié)果是有偏差的。其余幾個(gè)在空間回歸模型中仍然顯著的變量,在控制空間滯后效應(yīng)滯后,其系數(shù)明顯減小,如總?cè)丝诘挠绊懶Ч?絕對(duì)值)從1.7減少為1.6,14歲以下人口的效應(yīng)從23.3減少為21.1,中心城區(qū)的效果(絕對(duì)值)從9.5減少為5.1。當(dāng)然,對(duì)于社會(huì)組織分布形態(tài)的更詳盡的分析,超出了本文的容量,作者擬在后續(xù)的研究中進(jìn)一步探討。
一直以來(lái),在社會(huì)科學(xué)的很多重要議題中,如居住隔離、犯罪與自殺問(wèn)題、城市亞文化研究等等,空間分析的概念和技術(shù)都扮演著非常重要的角色。但是,遺憾的是,在國(guó)內(nèi)社會(huì)科學(xué)尤其是社會(huì)學(xué)的研究領(lǐng)域中,空間分析的概念一直付諸闕如。而對(duì)這一重要概念的忽略,有可能遮蔽我們對(duì)于現(xiàn)實(shí)世界的更深入了解。因此,本文試圖簡(jiǎn)單地梳理空間分析的一些核心概念和分析技術(shù),并通過(guò)一個(gè)社會(huì)組織的實(shí)例,演示如何在社會(huì)學(xué)的分析模型中納入空間這一概念,以期對(duì)學(xué)界有所裨益。
當(dāng)然,我們需要看到,將空間分析引入中國(guó)的社會(huì)科學(xué)研究,仍然面臨一些問(wèn)題。首先,從理論層面來(lái)看,國(guó)內(nèi)對(duì)于城市社會(huì)學(xué)的關(guān)注,具有非常明顯的人文主義色彩,對(duì)于比較量化的實(shí)證分析則比較缺乏,尤其是對(duì)于西方城市研究中已經(jīng)非常成熟的社會(huì)區(qū)因子分析的研究范式,在國(guó)內(nèi)社會(huì)學(xué)的城市研究中尚未得到足夠重視,這種情況在某種程度上可能會(huì)阻礙我們對(duì)于當(dāng)今中國(guó)快速城市化背景下的城市研究。
其次,從數(shù)據(jù)方面來(lái)看,在國(guó)內(nèi),獲取含有GIS信息的社會(huì)科學(xué)技術(shù)比較困難,在西方,這部分工作多由政府來(lái)完成,如含有GIS信息的普查數(shù)據(jù)的公開(kāi)發(fā)布,而這一點(diǎn),在國(guó)內(nèi)仍然具有一定的困難,尤其是對(duì)于社會(huì)學(xué)家而言。
再次,從技術(shù)層面來(lái)看,對(duì)于空間分析需要的技術(shù)方法、軟件操作等等,都對(duì)社會(huì)科學(xué)研究人員提出了新的要求,如ArcGIS軟件、R軟件等。這些知識(shí)的掌握,需要一個(gè)學(xué)科的人才培養(yǎng)、課程設(shè)置等方面都做出一系列的調(diào)整。
最后,空間概念如何納入現(xiàn)有研究議題中,仍然是一個(gè)需要不斷摸索、討論的過(guò)程。西方的城市空間研究,已經(jīng)形成了定性與定量相結(jié)合的發(fā)展模式。國(guó)內(nèi)城市社會(huì)學(xué)的研究,即使引入量化研究的范式,也應(yīng)該從理論層面討論中國(guó)城市發(fā)展的形成機(jī)制與內(nèi)在邏輯,只有這樣,我們才會(huì)形成真正有學(xué)術(shù)生命力的城市研究。
(責(zé)任編輯:陸影)
C912.81
A
1003-4145[2015]08-0063-08
2015-04-15
孫秀林(1978—),男,博士,上海大學(xué)社會(huì)學(xué)院副研究員,主要研究方向?yàn)榻M織社會(huì)學(xué)、空間分析。
本項(xiàng)目由上海市教育發(fā)展基金會(huì)和上海市教育委員會(huì)“曙光計(jì)劃”資助;本文系國(guó)家社會(huì)科學(xué)基金資助資目“我國(guó)新社會(huì)群體研究”(項(xiàng)目編號(hào):14BSH026)的階段性成果。