沈菲飛
農(nóng)村抽樣調(diào)查中的抽樣框問題
沈菲飛
準(zhǔn)確、完備的抽樣框是抽樣調(diào)查的前提條件,對農(nóng)村抽樣框的選擇應(yīng)考慮到中國農(nóng)村具體情況,不能照搬城市調(diào)查的方法。分析了抽樣框老化、遺漏目標(biāo)等四種抽樣框誤差類型,并結(jié)合中國農(nóng)村實際,提出入鄉(xiāng)隨俗、多方合作、加強(qiáng)過程控制、戶籍制度改革等建議。
抽樣框;抽樣調(diào)查;農(nóng)村
抽樣調(diào)查是按照隨機(jī)原則從總體中抽取部分個體進(jìn)行觀察,并據(jù)此推斷有關(guān)總體的數(shù)字特征。與全面調(diào)查比較,抽樣調(diào)查需要的時間短,調(diào)查經(jīng)費較少,動員人力物力也相對較少。抽樣框是用來代表總體,并從中抽選樣本的框架[1]。要使抽樣樣本的結(jié)果真正代表總體參數(shù),樣本的抽取必須遵循隨機(jī)原則且貫穿在調(diào)查的全過程。準(zhǔn)確、完備的抽樣框是開展抽樣調(diào)查的前提條件,然而抽樣框的完整性一直是我國抽樣調(diào)查的瓶頸,常規(guī)做法就是通過擴(kuò)大樣本量來減少誤差。
由于空間結(jié)構(gòu)上的不同,農(nóng)村居民和城市居民抽樣的差別較為明顯,因此農(nóng)村抽樣不能照搬城市抽樣的方法。筆者結(jié)合參與中國科協(xié)《中國公民科學(xué)素質(zhì)評估指標(biāo)及實證研究》項目的體會,對農(nóng)村抽樣調(diào)查中抽樣框的選擇和誤差進(jìn)行初步分析和討論。本調(diào)查共抽取了安徽省17個城市101個居委會364個村委會共12550人,其中城鎮(zhèn)3518人,農(nóng)村9032人;調(diào)查時間為2007年2月。來自抽樣點所在縣(市、縣、區(qū))的400多位安徽大學(xué)本科生,經(jīng)過培訓(xùn)和考核后擔(dān)任了此次調(diào)查的資料搜集和入戶訪問工作。省、市、縣、區(qū)等各級科協(xié)利用行政權(quán)力適度地為調(diào)查員的調(diào)查進(jìn)行組織協(xié)調(diào),課題組派出督導(dǎo)員深入一線對被調(diào)查地區(qū)的調(diào)查環(huán)節(jié)分別進(jìn)行監(jiān)督指導(dǎo)。
本次調(diào)查以2000年第五次全國人口普查數(shù)據(jù)為基礎(chǔ)進(jìn)行抽樣框設(shè)計,采用四階段分層定比抽樣(Four-Stage,Probability Proportionate to Size Sampling,PPS)方法(見表 1),在經(jīng)過中國公民科學(xué)素質(zhì)調(diào)查課題組的前三個階段的抽樣以后,要求調(diào)查員在抽中的居委會或村委會中采用簡單隨機(jī)或等距抽樣的方法確定最終的調(diào)查對象(戶、具體到人)。
表1 四階段分層定比(PPS)抽樣單位和方法
對抽樣框的選擇必須建立在評價、構(gòu)造、使用該抽樣框的費用和采用該抽樣框時調(diào)查估計值的總誤差基礎(chǔ)上,更應(yīng)考慮具體的國情。
出于節(jié)省費用的考慮,在家庭電話普及的地區(qū)和國家(美、加)采用電話訪問,通過RDD(random digit dialing)程序,產(chǎn)生的所有家庭電話號碼作為抽樣框[2]。在美國,經(jīng)過科學(xué)分類和加工以后的基礎(chǔ)性人口或戶籍資料,也很容易以市場購買的方式獲取。日本和歐洲有詳盡的人口管理制度,均采用入戶面訪法。在日本,有向社會公開的居民注冊系統(tǒng),為抽樣設(shè)計提供了較大的便利。中國雖然有完備的戶口管理系統(tǒng)和戶籍管理制度,但不對社會公開,只能憑借與行政組織主管負(fù)責(zé)人的私人關(guān)系來獲取抽樣框資料。
我國農(nóng)村的抽樣調(diào)查多以人口普查的統(tǒng)計資料為基礎(chǔ)進(jìn)行抽樣框設(shè)計,采用PPS方法抽取樣本進(jìn)行精度高的入戶調(diào)查。PPS抽樣是一個逐級收集樣本的方法,由城市抽樣總體抽取鄉(xiāng)鎮(zhèn),從鄉(xiāng)鎮(zhèn)抽取村委會,再由村委會抽取居民戶,最后落實被訪者。這種層層落實的多階抽樣有助于逐級控制、逐級采用靈活合適的抽樣方法,以達(dá)到理想的最終訪問對象。PPS抽樣的基礎(chǔ)是業(yè)已形成的文本登記檔,一旦獲得全面反映人口狀況的登記文本,抽樣就簡單易行了。但文本資料與當(dāng)?shù)厝丝趯嶋H變動狀況之間的脫節(jié)和資料的不公開,會引起抽樣誤差[3]。
在資料非市場化的中國,抽樣必須全程借助各級行政資源。以往的農(nóng)村抽樣調(diào)查樣本量大、調(diào)查時間長,多借助于行政力量層層推廣,形式上的抽樣調(diào)查成了實質(zhì)上的全面調(diào)查,抽樣的功能被異化[4]。本次調(diào)查發(fā)現(xiàn),在農(nóng)村二維隨機(jī)數(shù)表使用率很低,鄉(xiāng)村的“熟人社會”使采用替代樣本,樣本出現(xiàn)同質(zhì)化、親緣化。而借助行政力量進(jìn)行集中地點調(diào)查時,熟人會相互討論從而影響調(diào)查結(jié)果。因此,如果不按照隨機(jī)原則抽樣,不加強(qiáng)調(diào)查過程中的質(zhì)量控制,就會造成樣本同質(zhì)化,這樣,通過擴(kuò)大樣本量來減少抽樣框誤差的做法就沒意義了。
抽樣框誤差指在實踐中抽樣框(抽樣總體)與所研究的總體(目標(biāo)總體)不一致。本次安徽省調(diào)查以2000年第五次全國人口普查數(shù)據(jù)為抽樣依據(jù),以抽中地區(qū)的公安局和村委會提供的戶籍信息為抽樣框,這可能是現(xiàn)實中最理想的抽樣框,但仍有各類不足,主要有以下問題:
(一)抽樣框老化
當(dāng)代中國正處在一個劇烈的社會變遷時期,社會生活的各個方面都在改變。統(tǒng)計數(shù)據(jù)有很強(qiáng)的即時性,隨著時間的推移,抽樣框必須更新,否則就會老化,不符合實際情況,使樣本產(chǎn)生偏差,如行政區(qū)域調(diào)整、農(nóng)村城鎮(zhèn)化、居民搬遷等;同時有些新建社區(qū)的目標(biāo)不在抽樣框中,成為丟失單位??刹捎幂o助抽樣框進(jìn)行補(bǔ)救。本次調(diào)查四級抽樣時在某些村委會就使用了糧種補(bǔ)貼登記表作為輔助抽樣框。
(二)遺漏目標(biāo)總體單位
安徽省有大量農(nóng)村人口外出異地打工,造成人籍分離,這使得按農(nóng)業(yè)戶籍人口抽樣出現(xiàn)大規(guī)模的空缺成為可能。本次調(diào)查以2000年第五次全國人口普查數(shù)據(jù)為基礎(chǔ)進(jìn)行抽樣框設(shè)計,按照“五普”的城鄉(xiāng)人口分類標(biāo)準(zhǔn),凡人口密度在1500人/平房公里以上,在城鎮(zhèn)建設(shè)延伸區(qū)內(nèi)的農(nóng)村戶籍人口均為城鎮(zhèn)人口,這部分人口的居住形態(tài)、生活形態(tài)、工作形態(tài)與農(nóng)村的農(nóng)民并沒有區(qū)別,但由于城市化的行政操作使擁有城市居民身份的農(nóng)民在抽樣框中缺失。
無論是根據(jù)村委會提供的戶籍資料一次到位選人方案,還是采用進(jìn)入被訪戶家中確定被訪者,或者是請干部復(fù)核初步被選名單,基層行政人員只要介入抽樣框的選取過程,會以影響工作進(jìn)度和質(zhì)量的角度,有意無意的剔除和干部關(guān)系不好或交通不便的“特殊”樣本戶和被訪者。
(三)抽樣樣本包含了非目標(biāo)總體單位
由于發(fā)現(xiàn)非目標(biāo)總體單元相對比較容易,可以通過一定程序進(jìn)行剔除,因此這種誤差影響較小。
(四)復(fù)合聯(lián)接
復(fù)合聯(lián)接指一個目標(biāo)總體單位接著一個以上的抽樣單位,比如有的家庭擁有兩個住所、兩個地址,那么他們被選中的概率就是一般家庭的兩倍。
(一)優(yōu)化調(diào)查時間,用地址代替名冊抽樣
安徽省大量外出務(wù)工人員使按農(nóng)業(yè)戶籍資料編制的抽樣框?qū)嶋H抽樣時會出現(xiàn)大規(guī)模的空缺,使用替補(bǔ)方案目前還無法做到補(bǔ)測抽中異地務(wù)工人員,因此選取外出務(wù)工人員集中返鄉(xiāng)的春節(jié)前后作為調(diào)查時間。另外,本次調(diào)查中用地址代替名冊抽樣也值得提倡,即當(dāng)抽樣進(jìn)入到村委會一級時,不按戶籍資料抽取住戶,而是按照門牌號碼抽取住戶,以解決名冊與居民實際居住地址相脫離的狀況(調(diào)查者需要在調(diào)研前親赴調(diào)查點熟悉情況)。鑒于調(diào)查時間不可能都安排在春節(jié)前后,按照戶籍或政府的統(tǒng)計口徑抽樣會造成較大偏差,農(nóng)村抽樣調(diào)查的調(diào)查目標(biāo)總體應(yīng)以實際居住地為原則。
(二)建立公開、科學(xué)的人口管理系統(tǒng),完善樣本框資料
在中國,比較重要的社會資源往往直接掌控在國家或地方行政組織手里。要建立比較完備的抽樣調(diào)查框,除了利用行政組織獨家控制的戶籍資料或人口普查數(shù)據(jù)及其他居民資料以外,別無其他途徑。國內(nèi)相關(guān)行政機(jī)關(guān)獨家壟斷的人口基礎(chǔ)信息沒有對社會公開,也沒有相應(yīng)的法律制度規(guī)范這方面的工作。只有當(dāng)壟斷性信息的保護(hù)壁壘消除以后,學(xué)術(shù)調(diào)查對政府資源的依賴性才會弱化。
我國人口管理部門分散,存在不同程度的部門分割、交叉重疊現(xiàn)象,如出生、死亡、城鄉(xiāng)流動人口統(tǒng)計調(diào)查由公安部門進(jìn)行,死亡原因和嬰兒死亡統(tǒng)計等由衛(wèi)生部門統(tǒng)計,老年人口、殘疾人口等情況由民政機(jī)關(guān)負(fù)責(zé),人口普查是國家統(tǒng)計局進(jìn)行的。需要設(shè)立專門機(jī)關(guān)從宏觀上對全局進(jìn)行把握,清晰劃分每個部門管轄的范圍[5]?,F(xiàn)行城鄉(xiāng)分割的戶籍制度是計劃經(jīng)濟(jì)時代的產(chǎn)物,隨著市場經(jīng)濟(jì)體制的逐步建立和完善,越來越不適應(yīng)形勢發(fā)展的要求了。對我國大量的流動人口管理,應(yīng)以“居住地人口管理”取代“戶籍屬地管理”模式,以“戶籍隨人走”取代“人籍分離”[6]。
(三)入鄉(xiāng)隨俗,多方合作,加強(qiáng)過程控制
目前很多科研性質(zhì)較強(qiáng)的抽樣調(diào)查主要實施力量都是研究項目組,形式也多為入戶調(diào)查。誠然,入戶調(diào)查適合具有封閉式的個性自由的城鎮(zhèn)居民,但在方言多、生活方式相對固定、居住又分散的農(nóng)村,入戶調(diào)查難度很大,借助行政力量采用有效組織的集中調(diào)查可能會更快更好的實現(xiàn)調(diào)查需要[7]。本次調(diào)查基本采用入戶調(diào)查方式,在特殊情況下借助了行政力量進(jìn)行集中調(diào)查。在中國社會文化中,人們對政府的權(quán)威感很強(qiáng),鄉(xiāng)村領(lǐng)導(dǎo)出面會有快速一致的行動,但也會對被訪者心理造成無形的暗示影響,因此必須對被訪者進(jìn)行心理干預(yù),請政府工作人員暫時回避,以保證調(diào)查結(jié)果的客觀性、科學(xué)性。
本次調(diào)查的順利實施得益于專家學(xué)者、政府行政人員和學(xué)生調(diào)查員三個群體之間分工合作,各自的文化資本和政治資本體現(xiàn)出強(qiáng)大的互補(bǔ)優(yōu)勢。
專家學(xué)者利用專業(yè)知識等文化資本有效投入,既在前期的設(shè)計研究中設(shè)計、論證,也在中期的調(diào)查中組成督導(dǎo)員對被調(diào)查地區(qū)的調(diào)查環(huán)節(jié)(從地方科協(xié)到調(diào)查員,再到被調(diào)查者)分別進(jìn)行監(jiān)督指導(dǎo),還在后期的研究、檢驗中提供專業(yè)理論技術(shù)的支撐。
省市縣區(qū)等各級科協(xié)部門層級分明,行政權(quán)力由上而下直到地方基層,這一政治資本特色補(bǔ)充了專家學(xué)者的不足??茀f(xié)人員在前期的設(shè)計論證中給予配合、提出意見;在中期的調(diào)查中更是為本問卷調(diào)查提供抽樣各類基礎(chǔ)性資料和便利的行政機(jī)制運行保證。鑒于地方語言、風(fēng)俗等文化差異,地方科協(xié)利用行政權(quán)力適度地為調(diào)查員的調(diào)查進(jìn)行組織協(xié)調(diào)工作,是調(diào)查順利進(jìn)行的行政保障。
從大學(xué)生中抽取的調(diào)查員,經(jīng)過專家的培訓(xùn),具備問卷調(diào)查的知識以及假期實踐的經(jīng)驗,并且由于被調(diào)查地區(qū)家鄉(xiāng)籍貫的身份,加上地方科協(xié)對他們的支持與協(xié)助,增加了調(diào)查研究過程的效率和信度。
抽樣框在抽樣調(diào)查中處于基礎(chǔ)地位,抽樣框是否全面對推斷總體具有較大影響。對農(nóng)村抽查的抽樣框選擇不能照搬西方或者城市抽查的方法,應(yīng)該考慮到中國具體的國情。農(nóng)村抽樣調(diào)查抽樣框的完善除了寄希望于戶籍改革,建立公開科學(xué)的人口管理系統(tǒng),完善抽樣框資料外,還應(yīng)在調(diào)研前親赴調(diào)查點熟悉情況,強(qiáng)化抽樣的可操作性,使理想的抽樣設(shè)計與實際調(diào)研完美結(jié)合,避免閉門造車、紙上談兵。調(diào)研實施中和實施后要結(jié)合多方力量進(jìn)行質(zhì)量控制,社會約束和監(jiān)督。
[1]J u d i t h TL e s s l e r,Wi l l i a mDK a i s b e e k.調(diào)查中的非抽樣誤差[M].朱金勇進(jìn)譯.北京:中國統(tǒng)計出版社,1 9 9 7:4 7.
[2]胡志萍,王斌會.蓋洛普民意測驗及其實現(xiàn)抽樣隨機(jī)原則的思考[J].統(tǒng)計與決策,2 0 0 4(3):8 9-9 0.
[3]邊燕杰,李路路,蔡禾.社會調(diào)查方法與技術(shù)[M].北京:社會科學(xué)文獻(xiàn)出版社,2 0 0 6:7 2.
[4]馮士雍.抽樣調(diào)查應(yīng)用與理論中的若干前沿問題[J].統(tǒng)計與信息論壇,2 0 0 7(1).
[5]白海軍,徐海俊.我國戶籍制度改革發(fā)展現(xiàn)狀及對策分析[J].河北大學(xué)學(xué)報,2 0 0 6(4).
[6]肖文韜.工業(yè)化力度、人口流動行為與戶籍改革[J].人口與經(jīng)濟(jì),2 0 0 4(3).
[7]王振威.對“官入”調(diào)查研究方法之反思[J].調(diào)研世界,2 0 0 8(3).
C811
A
1673-1999(2010)01-0057-03
沈菲飛(1980-),男,安徽巢湖人,碩士,巢湖學(xué)院(安徽巢湖238000)管理系講師,從事科技傳播工作。
中國科學(xué)技術(shù)協(xié)會“中國公民科學(xué)素質(zhì)評估指標(biāo)及實證研究”(項目編號:2006DCYJ11-A)課題資助。
2009-12-12