賀建風(fēng)
農(nóng)業(yè)發(fā)展緩慢、農(nóng)民收入低下、農(nóng)村普遍貧困等“三農(nóng)”問題是關(guān)系國計(jì)民生的根本問題,也是阻礙城鄉(xiāng)融合發(fā)展的難題。黨的十九大報(bào)告指出必須始終把解決好“三農(nóng)”問題作為全黨工作的重中之重,并提出了鄉(xiāng)村振興的新時(shí)代戰(zhàn)略構(gòu)想。目前我國正處在決勝全面建成小康社會和建設(shè)社會主義現(xiàn)代化強(qiáng)國的關(guān)鍵時(shí)期,而“三農(nóng)”問題無疑是我國前進(jìn)道路上的攔路虎,只有“三農(nóng)”問題徹底解決了,全面建成小康社會和建設(shè)社會主義現(xiàn)代化強(qiáng)國的宏偉目標(biāo)方能順利實(shí)現(xiàn)。有關(guān)農(nóng)業(yè)、農(nóng)民和農(nóng)村各方面的統(tǒng)計(jì)數(shù)據(jù)是有效處理“三農(nóng)”問題的依據(jù)。因此,獲取詳細(xì)而準(zhǔn)確的高質(zhì)量統(tǒng)計(jì)數(shù)據(jù)則是解決“三農(nóng)”問題的關(guān)鍵。
現(xiàn)階段,抽樣調(diào)查方法是獲取我國“三農(nóng)”領(lǐng)域數(shù)據(jù)的最主要手段。抽樣框的設(shè)計(jì)是抽樣調(diào)查的基礎(chǔ),如果基于不完善的抽樣框進(jìn)行調(diào)查,所得到的統(tǒng)計(jì)推斷結(jié)果往往質(zhì)量不高。由于中國城鎮(zhèn)化進(jìn)程的快速發(fā)展,傳統(tǒng)上基于周期性普查資料編制的單一抽樣框無法實(shí)現(xiàn)連續(xù)多個(gè)調(diào)查期的持續(xù)完整覆蓋。將多個(gè)已有的不完整抽樣框整合起來形成一個(gè)完整的抽樣框體系的方法稱為多重抽樣框方法,多重抽樣框能夠解決單一抽樣框覆蓋不全的問題。國外基于多重抽樣框進(jìn)行抽樣設(shè)計(jì)和抽樣估計(jì)的理論研究始于Hartley(1962),他最先對雙重抽樣框的估計(jì)方法進(jìn)行理論研究,提出了方差最小條件下的最優(yōu)估計(jì)量。隨后,F(xiàn)uller and Burmeister(1972),Kalton and Anderson(1986),Skinner and Rao (1996,2000),Lohr and Rao(2006)等人對多重抽樣框的估計(jì)問題進(jìn)行了更深入的理論研究。在多重抽樣框的應(yīng)用研究方面,Hartley(1974)在農(nóng)業(yè)抽樣調(diào)查中提出采用名錄框與地域框組合的雙重抽樣框系統(tǒng),這表明在相同的精度要求下,雙重抽樣框相比較單一抽樣框花費(fèi)更少。此外,F(xiàn)AO(Food and Agriculture Organization)(1996)描述了聯(lián)合國農(nóng)業(yè)調(diào)查中的雙重框設(shè)計(jì),提出一個(gè)抽樣框是農(nóng)業(yè)單位的名錄框(費(fèi)用便宜,但不完整),另一個(gè)抽樣框是地域框(覆蓋完整,但費(fèi)用昂貴)的基本思路。國內(nèi)對于多重抽樣框調(diào)查的理論研究和實(shí)際應(yīng)用開展得較晚,涉及這一領(lǐng)域開展研究的學(xué)者較少。在理論方法領(lǐng)域中,金勇進(jìn)(1996)對雙重抽樣框的概念進(jìn)行了簡略的介紹;雷欽禮介紹了雙重抽樣框的抽樣方法及篩選估計(jì)量的形式;賀建風(fēng)對各種雙重抽樣框估計(jì)方法進(jìn)行了系統(tǒng)梳理,做了詳細(xì)的分類和比較;賀建風(fēng)研究了基于多重抽樣框情形下的連續(xù)性抽樣估計(jì)方法。但是對于我國抽樣實(shí)踐中該如何基于多重抽樣框?qū)嵤┏闃釉O(shè)計(jì)和抽樣估計(jì)的研究未曾多見,僅賀建風(fēng)針對我國服務(wù)業(yè)抽樣調(diào)查的情況進(jìn)行了探索研究。
本文以我國“三農(nóng)”問題涉及的主體為抽樣調(diào)查對象,研究在我國“三農(nóng)”抽樣中,基于多重抽樣框的合理抽樣設(shè)計(jì)和科學(xué)抽樣估計(jì)方法。文章余下部分的安排如下:第二部分簡要介紹目前我國“三農(nóng)”抽樣調(diào)查的運(yùn)行方式及其抽樣框問題;第三部分將深入分析適合我國目前國情的“三農(nóng)”抽樣方法,并按對“戶”抽樣和對“地”抽樣兩種情形分別給出了基于多重抽樣框的抽樣方案設(shè)計(jì);第四部分則在抽樣設(shè)計(jì)的基礎(chǔ)上,按照基于設(shè)計(jì)的思路給出相應(yīng)的總體總值估計(jì)量、相應(yīng)的估計(jì)量方差以及方差的估計(jì)量;第五部分則是對全文的總結(jié)和未來研究的展望。
自1949年以來,最早開展的抽樣調(diào)查便是“三農(nóng)”領(lǐng)域中的農(nóng)產(chǎn)量抽樣調(diào)查。早在1963年,國家統(tǒng)計(jì)局就有專門的農(nóng)產(chǎn)量抽樣調(diào)查方案。改革開放后,我國政府統(tǒng)計(jì)部門的各級組織機(jī)構(gòu)逐漸得到恢復(fù),到1984年,隨著各級農(nóng)村抽樣調(diào)查隊(duì)的建立,“三農(nóng)”抽樣調(diào)查才逐漸成型,不僅包括原有的農(nóng)產(chǎn)量抽樣調(diào)查,還增加了農(nóng)村住戶情況和農(nóng)村基本經(jīng)濟(jì)情況的抽樣調(diào)查。1994年,我國明確了建立以周期性普查為基礎(chǔ),經(jīng)常性抽樣調(diào)查為主體的政府統(tǒng)計(jì)調(diào)查體系,并將這一規(guī)定寫入了《中華人民共和國統(tǒng)計(jì)法》中。至此,現(xiàn)代化的統(tǒng)計(jì)調(diào)查制度在我國得以基本建立。其中,涉及“三農(nóng)”問題的周期性普查有農(nóng)業(yè)普查與人口普查兩大類,均是10年開展一次,涉及“三農(nóng)”問題的抽樣調(diào)查(簡稱“三農(nóng)”抽樣)則包括農(nóng)產(chǎn)量調(diào)查、城鄉(xiāng)住戶調(diào)查、人口變動情況調(diào)查、農(nóng)村經(jīng)濟(jì)基本情況調(diào)查和其他專項(xiàng)調(diào)查等。隨著經(jīng)濟(jì)社會的發(fā)展,更多類型的“三農(nóng)”問題調(diào)查將不斷涌現(xiàn),如農(nóng)民生活質(zhì)量、農(nóng)村老齡人口健康情況、農(nóng)村留守兒童問題、農(nóng)村文化生活狀況、鄉(xiāng)村生態(tài)建設(shè)和農(nóng)村自然資源等專題抽樣調(diào)查。
目前,為了調(diào)查過程的實(shí)施方便,我國政府統(tǒng)計(jì)部門開展的大型抽樣調(diào)查一般是以省(自治區(qū)、直轄市)為總體,實(shí)施多階段抽樣設(shè)計(jì),對于涉及“三農(nóng)”問題的抽樣調(diào)查也不例外。由于多階段抽樣是分階段實(shí)施的,抽樣框可以分階段進(jìn)行準(zhǔn)備,因此能夠在一定程度上化解由于全局抽樣框不完善帶來的代表性不足問題。在多階段抽樣中,第一階段只需對初級抽樣單元編制抽樣框,其余各階段,只需要對被抽中的上一級抽樣單元準(zhǔn)備抽樣框即可。多階段抽樣調(diào)查既可以節(jié)省編制大范圍抽樣框的費(fèi)用,又比較容易操作,且抽樣過程易于組織和控制,相對比較適合我國現(xiàn)階段的國情。但是由于每個(gè)階段抽樣都會帶來誤差,另外由于最末階段延伸過細(xì)可能導(dǎo)致所選樣本具有同類性而嚴(yán)重影響其代表性,因此,抽樣的階段數(shù)越多,則抽樣誤差越大且樣本的代表性較差。如果抽樣調(diào)查的階數(shù)較少,例如進(jìn)行一階、二階抽樣時(shí),則會面臨難以構(gòu)建完整覆蓋的全局抽樣框問題。目前,我國“三農(nóng)”抽樣調(diào)查中的階數(shù)呈逐漸減少的態(tài)勢,很多地方已實(shí)行了省直接抽村的調(diào)查方式。所以,多階段抽樣與完整抽樣框的構(gòu)建之間如何權(quán)衡是目前我國“三農(nóng)”抽樣調(diào)查中的主要矛盾之一。
隨著經(jīng)濟(jì)社會的不斷變化,農(nóng)民的務(wù)工遷移和農(nóng)地的經(jīng)營流轉(zhuǎn)現(xiàn)象已越來越普遍。基于周期性普查資料編制單一且能完全覆蓋的“三農(nóng)”抽樣框已成為抽樣實(shí)踐中的難題。相對而言,在一個(gè)普查周期的初期階段,單一抽樣框覆蓋性可能較好。但是經(jīng)過2至3年以后,調(diào)查對象往往會出現(xiàn)很大的變動,原來的抽樣框覆蓋性會越來越差,而抽樣框的維護(hù)和更新的成本又十分高昂?;诖耍覈鴮W(xué)者賀建風(fēng)最早提出基于雙重抽樣框的視角編制“三農(nóng)”抽樣框來解決單一抽樣框覆蓋不全的問題,并給出了簡單抽樣框和復(fù)雜抽樣框的編制思路,但是針對雙重“三農(nóng)”抽樣框情形下的具體抽樣設(shè)計(jì)和抽樣估計(jì)問題并未展開深入研究。本文接下來的章節(jié)將在編制多重(包含雙重)抽樣框的基礎(chǔ)上,深入探討基于多重抽樣框的“三農(nóng)”抽樣設(shè)計(jì)和估計(jì)方法,為我國“三農(nóng)”抽樣調(diào)查的改進(jìn)提供一套全新的思路。
基于多重抽樣框進(jìn)行抽樣調(diào)查,可以彌補(bǔ)單一抽樣框無法完整覆蓋的缺陷,同時(shí)也可以盡量減少多階段抽樣調(diào)查的抽樣階段數(shù),進(jìn)而在節(jié)約成本的同時(shí)提高估計(jì)精度?,F(xiàn)階段,隨著城市化的持續(xù)推進(jìn)和農(nóng)村經(jīng)濟(jì)社會的快速發(fā)展,我國“三農(nóng)”調(diào)查對象變動日益頻繁,使用基于名錄框和地域框相結(jié)合的多重抽樣框系統(tǒng)進(jìn)行抽樣設(shè)計(jì)已經(jīng)勢在必行。我國政府統(tǒng)計(jì)部門正在開展或?qū)砜赡芤_展的各類涉及“三農(nóng)”問題的抽樣調(diào)查,應(yīng)該根據(jù)各類調(diào)查項(xiàng)目自身的特點(diǎn)和調(diào)查實(shí)踐的可操作性設(shè)計(jì)基于多重抽樣框背景下的抽樣方案,從而避免單一抽樣框無法完整覆蓋的問題。按照調(diào)查對象和關(guān)注問題的不同,我國政府統(tǒng)計(jì)部門的各類抽樣調(diào)查可以分為人口住戶類、社會經(jīng)濟(jì)類和其他專項(xiàng)調(diào)查三大類。就具體到涉及“三農(nóng)”情況的抽樣調(diào)查而言,人口住戶類調(diào)查主要包括城鄉(xiāng)住戶調(diào)查、人口變動抽樣調(diào)查等,主要目的是了解各類人口和住戶的生產(chǎn)、收入、消費(fèi)和遷移等基本情況;經(jīng)濟(jì)社會類調(diào)查有農(nóng)業(yè)調(diào)查、農(nóng)村居民消費(fèi)價(jià)格調(diào)查等;其他專項(xiàng)調(diào)查有農(nóng)村醫(yī)療健康狀況調(diào)查、農(nóng)村居民滿意度調(diào)查等。
在“三農(nóng)”抽樣調(diào)查中,如果需要了解的調(diào)查對象是以村為基本單位的農(nóng)村發(fā)展情況,例如村辦企業(yè)、村內(nèi)幼兒園和教師情況等,則可以將行政村設(shè)計(jì)為抽樣末端單位,按照行政管理的需要,以省或者縣作為抽樣總體。這種情況下,我們可以稱為對“村”抽樣,只需要編制完整的包含各村編碼的名錄抽樣框即可,相對而言較為容易,重點(diǎn)在于摸清鄉(xiāng)村撤銷合并的情況。然而現(xiàn)實(shí)的調(diào)查中,更多的時(shí)候是需要調(diào)查村以下的農(nóng)戶或者地塊,深入了解農(nóng)戶的生產(chǎn)、生活情況和農(nóng)地的耕作情況。若抽樣調(diào)查對象為農(nóng)戶或農(nóng)業(yè)生產(chǎn)經(jīng)營單位,如城鄉(xiāng)住戶抽樣、農(nóng)業(yè)企業(yè)經(jīng)營情況抽樣等,視為對“戶”抽樣調(diào)查,若抽樣調(diào)查對象為農(nóng)業(yè)用地,如農(nóng)產(chǎn)量抽樣、養(yǎng)殖業(yè)調(diào)查、經(jīng)濟(jì)作物耕種調(diào)查等則可視為對“地”抽樣調(diào)查。本節(jié)將按對“戶”抽樣調(diào)查與對“地”抽樣調(diào)查兩種情況分別給出基于多重抽樣框的抽樣設(shè)計(jì)方案。
本文對于“戶”的界定包含兩大群體,一類就是普通的農(nóng)戶,在我國主要是人數(shù)眾多的小農(nóng)戶,經(jīng)營規(guī)模和耕種面積不大,一般群居在自然村落中;另一類是農(nóng)業(yè)經(jīng)營單位和規(guī)模經(jīng)營大戶,隨著土地流轉(zhuǎn)政策實(shí)施,越來越多的農(nóng)業(yè)經(jīng)營單位和規(guī)模經(jīng)營大戶在鄉(xiāng)村出現(xiàn),為了更好地統(tǒng)一起來,本文將這部分調(diào)查對象也歸類為廣義上的“戶”。對于經(jīng)營大戶和經(jīng)營單位而言,相對比較容易獲取他們的詳細(xì)名錄,可進(jìn)行基于名錄框的抽樣設(shè)計(jì)。但是,對于眾多小農(nóng)戶來說,由于編制完整的名錄框較難,因此可考慮基于地域框來進(jìn)行抽樣。
根據(jù)多重抽樣框的定義,針對多重抽樣框進(jìn)行樣本抽選時(shí),各抽樣框的抽樣過程相互獨(dú)立。當(dāng)“三農(nóng)”抽樣調(diào)查的調(diào)查對象為“戶”時(shí),據(jù)以抽樣的名錄框由各級行政區(qū)劃清單和規(guī)模以上農(nóng)戶及農(nóng)業(yè)生產(chǎn)經(jīng)營單位名冊構(gòu)成,地域框?yàn)樘囟ㄐ姓^(qū)劃下地域分塊的有限集合,整個(gè)地域框是一份特定行政區(qū)劃下的具有空間地理信息的地圖,條件成熟的縣區(qū)可構(gòu)建基于地理信息系統(tǒng)的電子地圖模式的地域框?qū)Φ貕K進(jìn)行分割。
圖1 基于名錄框的對“戶”抽樣調(diào)查過程圖示
1.基于名錄框的抽樣實(shí)施過程
在對“戶”抽樣調(diào)查中,基于名錄框的抽樣過程可設(shè)計(jì)為二階段抽樣調(diào)查的模式,具體實(shí)施過程如圖1所示。
第一步,確定初級抽樣單元,并按與調(diào)查目的有關(guān)的輔助標(biāo)志進(jìn)行分層。在我國各級行政管理中,中央與省(市、區(qū))兩級最重要,因此本文認(rèn)為以省為總體實(shí)施抽樣比較合理,這也是目前一般的做法。我國一般可按照行政區(qū)劃來界定初級抽樣單元,但初級抽樣單元設(shè)在哪一級呢?如果選擇市(地、州、盟)一級為初級抽樣單位,由于市以下有縣(區(qū)、市、旗)、縣以下有鄉(xiāng)鎮(zhèn),抽樣層級過多會帶來較大的抽樣誤差。而我國同一個(gè)縣區(qū)內(nèi),一般而言農(nóng)業(yè)生產(chǎn)條件相差不大,而且有些縣是國家抽樣調(diào)查縣,設(shè)有專門的抽樣調(diào)查隊(duì),因此確定縣一級為初級抽樣單元比較合適。根據(jù)對“戶”抽樣調(diào)查的具體小類項(xiàng)目,按有關(guān)標(biāo)志對初級抽樣單元進(jìn)行分層,將具有相似特征的初級抽樣單元?dú)w為同一層,盡量做到層內(nèi)差異小、層間差異大。比如,在住戶抽樣調(diào)查中,可按照人均可支配收入對縣進(jìn)行分層;在主要畜禽抽樣調(diào)查中,可按照所調(diào)查主要畜禽(豬、雞等)的歷史出欄規(guī)模等輔助信息對縣進(jìn)行分層。
第二步,對初級抽樣單元實(shí)施分層抽樣,得到第一階段樣本。對初級抽樣單元進(jìn)行抽樣可以在各層內(nèi)獨(dú)立進(jìn)行,抽樣方式為層內(nèi)簡單隨機(jī)抽樣,各層抽樣比的大小可視層內(nèi)抽樣單元的具體特征而定。例如在主要畜禽抽樣調(diào)查中,可將初級抽樣單元按照養(yǎng)殖規(guī)模分為主要畜禽養(yǎng)殖特大縣、養(yǎng)殖大縣和普通養(yǎng)殖縣三層。結(jié)合調(diào)查人員配置和財(cái)政預(yù)算,對養(yǎng)殖特大縣這一層,盡可能實(shí)施全面調(diào)查;對于養(yǎng)殖大縣這一層,可以按較高的抽樣比實(shí)施簡單隨機(jī)抽樣;對于普通養(yǎng)殖縣則可以視具體情況進(jìn)一步降低抽樣比。
第三步,準(zhǔn)備好第一階段抽樣中被選初級單元內(nèi)的下一階抽樣單元名錄,即農(nóng)業(yè)生產(chǎn)經(jīng)營單位與規(guī)模以上農(nóng)戶的清單,實(shí)施抽樣得到第二階段樣本。根據(jù)具體的調(diào)查研究目的,利用復(fù)雜名錄框的有關(guān)資料,對名錄框中的規(guī)模以上農(nóng)戶和農(nóng)業(yè)生產(chǎn)經(jīng)營單位按有關(guān)標(biāo)志排隊(duì),然后進(jìn)行抽樣。如果調(diào)查對象為農(nóng)業(yè)生產(chǎn)經(jīng)營單位,則抽樣方式為全面調(diào)查;如果調(diào)查對象為規(guī)模以上農(nóng)戶,則在調(diào)查資源充足時(shí)可以采用全面調(diào)查方式,而調(diào)查資源不足,則可以采用πps抽樣方式來獲取樣本。
2.基于地域框的抽樣實(shí)施過程
在對小農(nóng)戶抽樣調(diào)查中,基于地域框的抽樣過程可以設(shè)計(jì)為三階段抽樣。第一階段抽樣同樣為省抽縣,可以基本沿用對名錄框第一階段的方案,第二、三階段抽樣的設(shè)計(jì)則與名錄框的情況差異較大。具體實(shí)施過程如圖2所示。
第一步,確定初級抽樣單元,并按與調(diào)查目的有關(guān)的輔助標(biāo)志進(jìn)行分層。具體操作同上。
第二步,對初級抽樣單元實(shí)施分層抽樣,得到第一階段樣本。具體操作同上。
第三步,準(zhǔn)備已抽中縣的地域框,對地域框中的單元進(jìn)行系統(tǒng)抽樣,得到第二階段抽樣單元。在第二階段抽樣實(shí)施前,首先需要提供該縣的地域框,地域框由各縣內(nèi)的所有地域分塊構(gòu)成??紤]到最終調(diào)查單元為具體的規(guī)模以下農(nóng)戶,因此地域框的分塊可直接選用最新的人口普查或者農(nóng)業(yè)普查小區(qū)。根據(jù)具體的調(diào)查研究內(nèi)容,對該縣區(qū)內(nèi)的所有人口普查小區(qū)進(jìn)行編碼并按有關(guān)標(biāo)志排隊(duì),而后實(shí)行系統(tǒng)抽樣,得到第二階段抽樣單元。
圖2 基于地域框的對“戶”抽樣調(diào)查過程圖示
第四步,編制抽中普查小區(qū)的所有規(guī)模以下農(nóng)戶名冊,進(jìn)行簡單隨機(jī)抽樣,最終得到第三階段抽樣單元。第三階段抽樣單元為規(guī)模以下農(nóng)戶,一般來說,在同一普查小區(qū)內(nèi),規(guī)模以下農(nóng)戶間的各類特征基本一致。因此,最后階段抽樣可以采用簡單隨機(jī)抽樣的方式實(shí)施,考慮到操作的簡便和方差估計(jì)的需要,每個(gè)樣本普查小區(qū)抽取2戶規(guī)模以下農(nóng)戶即可。滿足基本要求,如果需要調(diào)查更多戶的話,情況完全一致。
以上對“戶”調(diào)查的方案,對于調(diào)查內(nèi)容為涉及農(nóng)業(yè)經(jīng)濟(jì)狀況問題的情形較為適用。如果涉及流動人口情況、留守兒童狀況以及農(nóng)村婦女地位等調(diào)查內(nèi)容為人口與社會問題的情形,則情況較為簡單,不必設(shè)計(jì)規(guī)模以上農(nóng)戶,可直接按照基于地域框的抽樣思路來實(shí)現(xiàn),需要注意的是地域框中無須排除規(guī)模以上農(nóng)戶,另外,農(nóng)業(yè)生產(chǎn)經(jīng)營單位本身就不在抽樣范圍內(nèi)。這樣,以上抽樣設(shè)計(jì)的思路可分別適用于各類對“戶”抽樣的“三農(nóng)”領(lǐng)域調(diào)查。
當(dāng)“三農(nóng)”抽樣的調(diào)查對象為“地”時(shí),名錄框也可由規(guī)模以上農(nóng)戶和農(nóng)業(yè)生產(chǎn)經(jīng)營單位的名冊構(gòu)成,調(diào)查對象是其所經(jīng)營的農(nóng)業(yè)用地,抽樣過程可以看成由“戶”連接到“地”的方式,但這里規(guī)模以上調(diào)查戶的判斷標(biāo)準(zhǔn)需要根據(jù)具體的調(diào)查項(xiàng)目進(jìn)行適當(dāng)調(diào)整;地域框由行政區(qū)劃內(nèi)所有實(shí)際農(nóng)業(yè)用地分塊構(gòu)成,抽樣過程的最末階段表現(xiàn)為對分塊進(jìn)行抽樣。
圖3 對“地”抽樣調(diào)查過程圖示[注]圖中左邊實(shí)線箭頭流程表示基于名錄框的抽樣過程,右邊虛線箭頭流程表示基于地域框的抽樣過程,而第一階段的省抽縣過程,左右兩邊流程實(shí)際上為同一套初級樣本縣。
基于名錄框的抽樣設(shè)計(jì)可以基本沿用對“戶”抽樣時(shí)的方案,即二階段抽樣。不同之處在于他們的輔助變量的選用,這里要選擇與對“地”調(diào)查項(xiàng)目密切相關(guān)的特征值。比如在農(nóng)產(chǎn)量抽樣調(diào)查中,可以按主要種植類型、播種面積等標(biāo)志為輔助變量;實(shí)施πps抽樣得到樣本縣之后,對其中的規(guī)模以上農(nóng)戶和農(nóng)業(yè)生產(chǎn)經(jīng)營單位的農(nóng)業(yè)用地進(jìn)行全面調(diào)查。
地域框的基本單元為農(nóng)業(yè)用地分塊,分塊的構(gòu)建是地域框形成以及抽樣過程能否順利實(shí)施的關(guān)鍵。我國可依據(jù)農(nóng)業(yè)普查資料和衛(wèi)星遙感技術(shù)所獲取到的農(nóng)業(yè)用地信息進(jìn)行地域框構(gòu)建,各縣統(tǒng)計(jì)部門負(fù)責(zé)本轄區(qū)地域框分塊構(gòu)建的全面工作,同時(shí),盡量爭取與當(dāng)?shù)剞r(nóng)業(yè)局等農(nóng)業(yè)管理部門開展合作。為了便于管理和實(shí)際操作,以行政村為實(shí)際操作部門確定各村內(nèi)分塊的劃分。就分塊的劃分而言,首先要根據(jù)農(nóng)業(yè)用地使用情況進(jìn)行分類,按照農(nóng)業(yè)用地的統(tǒng)計(jì)分類標(biāo)準(zhǔn)結(jié)合最新的衛(wèi)星遙感信息,將農(nóng)村的土地按照用途分為農(nóng)業(yè)用地、林業(yè)及森林占地和山地、湖泊等其他土地三大類。然后利用網(wǎng)格線對各類農(nóng)業(yè)用地的地域進(jìn)行等分劃塊;最后結(jié)合實(shí)際調(diào)查的可行性,繪制出各分塊邊界調(diào)整線,調(diào)整后的分塊面積與等分劃塊的面積誤差盡量控制在10%以內(nèi)。實(shí)際抽樣的地域框分塊過程,要求盡量做到不重不漏,并按序號編碼,分塊的邊界線最好選擇地面實(shí)際存在的自然界線(如田埂、溝渠、道路、橋梁等)?;诰群唾M(fèi)用以及管理方便等方面考慮,基于地域框的對“地”抽樣調(diào)查也可以設(shè)計(jì)為二階段抽樣。第一階段抽樣同樣以各縣為初級抽樣單元,以縣區(qū)農(nóng)業(yè)用地面積等資料作為輔助變量,實(shí)施省抽縣的πps方式抽樣。第二階段抽樣則是在抽中縣的基礎(chǔ)上抽選地域框分塊,在抽選分塊之前,先按照分塊的具體農(nóng)業(yè)用地使用情況進(jìn)行分層,將相同類型的分塊歸為同一層;然后對各層實(shí)行獨(dú)立抽樣,抽樣方式為簡單隨機(jī)抽樣;對于抽中分塊,選用合格的調(diào)查員進(jìn)行實(shí)地觀測,從而獲取調(diào)查數(shù)據(jù)。具體過程如圖3所示。
“三農(nóng)”抽樣調(diào)查的估計(jì)目標(biāo)一般是獲取總體總值或均值的推斷信息,當(dāng)實(shí)施連續(xù)性抽樣調(diào)查時(shí)還需要估計(jì)目標(biāo)總體在時(shí)間上的變動量。從上一節(jié)的抽樣設(shè)計(jì)方案可知,基于多重抽樣框的“三農(nóng)”抽樣方式大多設(shè)計(jì)為二階段抽樣,只有在對“戶”抽樣調(diào)查中,針對地域框進(jìn)行樣本選取時(shí)才涉及三階段抽樣的情況(對此,本文后面將單獨(dú)討論)。因此,可以按照二階段抽樣的理論進(jìn)行估計(jì)量設(shè)計(jì)。
本文設(shè)計(jì)的各多階段抽樣方案有一個(gè)共同的特點(diǎn)就是第一階段均為省抽縣,對于由某省內(nèi)所有縣級行政區(qū)劃所構(gòu)成的抽樣框顯然只有一個(gè)。因此,第一階段抽樣實(shí)際上是基于單一抽樣框進(jìn)行的,可以直接根據(jù)一般的抽樣估計(jì)方法推算總體特征值。對于縣以下的第二階段抽樣則表現(xiàn)為從多重抽樣框中取樣,分別為從名錄框和地域框中抽選樣本。一般來說地域框只有一個(gè),且完全覆蓋特定地區(qū)。而名錄框可能為一個(gè),也可能有多個(gè),例如由多個(gè)行政部門提供不同的名錄冊,就形成了多個(gè)名錄框。如果名錄框只有一個(gè),則與地域框構(gòu)成雙重抽樣框結(jié)構(gòu),可以利用雙重抽樣框估計(jì)方法對研究變量的總體特征進(jìn)行推算。如果名錄框不止一個(gè),則與地域框就構(gòu)成多重抽樣框結(jié)構(gòu),可以利用多重抽樣框估計(jì)方法對研究變量的總體特征值進(jìn)行推算。為了估計(jì)公式的簡化,本文僅分析名錄框只有一個(gè)的情形,對于多個(gè)的情形可以在本文研究的基礎(chǔ)上進(jìn)行擴(kuò)展。
首先,按照π估計(jì)量思路,可以給出適用于“三農(nóng)”抽樣調(diào)查的估計(jì)方法,以省為總體的總值估計(jì)量為:
(1)
其中:y
為第一階段抽樣時(shí)第i
個(gè)樣本的研究變量總值,π1為第一階段抽樣時(shí)第i
個(gè)單位的入樣概率,n
為省內(nèi)樣本縣個(gè)數(shù),并記N
為省內(nèi)縣的總個(gè)數(shù)。公式(1)中y
的具體數(shù)值需要根據(jù)第二階段的樣本信息進(jìn)行估計(jì),而第二階段為從名錄框與地域框結(jié)合的多重抽樣框中取樣。按照上一節(jié)的抽樣設(shè)計(jì)可知,地域框完全覆蓋了整個(gè)縣區(qū),是一個(gè)完整的抽樣框,顯然不完整的名錄框包含于地域框中。記A為地域框,B為名錄框,設(shè)子域a為屬于抽樣框A且不屬于抽樣框B的部分,子域ab為兩個(gè)框的公共部分。所以y
的估計(jì)量為:(2)
(3)
(4)
因此,將(2)、(3)、(4)代入(1)可得,總體總值的估計(jì)量為式(5)的形式:
(5)
(6)
其中第一階段的抽樣方差為:
(7)
(8)
V
的無偏估計(jì)量為:(9)
其中
(10)
(11)
(12)
(13)
對地域框的抽樣并不是最終階段的取樣,還需要對各普查小區(qū)按照簡單隨機(jī)原則抽取2個(gè)規(guī)模以下農(nóng)戶,因此,式(3)可具體寫成:
(14)
其中:y
1為第i
個(gè)樣本縣內(nèi)第k
個(gè)分塊中第1個(gè)規(guī)模以下農(nóng)戶的調(diào)查變量值,y
2為第i
個(gè)樣本縣內(nèi)第k
個(gè)分塊中第2個(gè)規(guī)模以下農(nóng)戶的調(diào)查變量值,M
為第i
個(gè)樣本縣內(nèi)第k
個(gè)分塊中規(guī)模以下農(nóng)戶的總數(shù)。將式(1)、(2)、(13)和(14)結(jié)合在一起,可以得到對“戶”抽樣調(diào)查時(shí)的總體總值估計(jì)量:
(15)
根據(jù)式(6)、(7)、(8)和三階段抽樣估計(jì)量方差的公式可以推算出估計(jì)量的方差:
(16)
(17)
對“地”調(diào)查的抽樣過程比對“戶”調(diào)查要相對簡單,無論是名錄框還是地域框均為二階段抽樣設(shè)計(jì),第一階段抽樣為按土地面積成比例的πps抽樣,第二階段抽樣為基于多重抽樣框下的抽樣設(shè)計(jì)。因此,第一階段的π估計(jì)量可以設(shè)計(jì)為HT估計(jì)量的形式:
(18)
y
的具體值由第二階段抽樣的樣本信息估計(jì)可得。在第二階段抽樣中,基于名錄框的單元進(jìn)行的是全面調(diào)查,對于地域框的單元實(shí)施的是分層隨機(jī)抽樣。根據(jù)式(3)和(4)可得第i
個(gè)樣本縣中y
的估計(jì)量為:(19)
將估計(jì)量代入式(18)中,可以得到對“地”抽樣調(diào)查時(shí)的總體總值估計(jì)量為:
(20)
根據(jù)式(6)、(7)、(8)可以給出估計(jì)量的方差計(jì)算公式:
(21)
(22)
(23)
本文在已有的多重抽樣框理論研究的基礎(chǔ)上,結(jié)合我國“三農(nóng)”抽樣的實(shí)際情況,基于多重抽樣框的思路,開展了“三農(nóng)”抽樣調(diào)查的抽樣設(shè)計(jì)和抽樣估計(jì)研究。通過本文的研究,建立了一套基于多重抽樣框的“三農(nóng)”抽樣調(diào)查設(shè)計(jì)方案,并為樣本推斷總體特征提供了估計(jì)量設(shè)計(jì),同時(shí)也給出了估計(jì)量的方差以及方差的估計(jì)量,為我國政府統(tǒng)計(jì)部門搜集“三農(nóng)”問題的數(shù)據(jù)提供了一條新路徑。建立這套基于多重抽樣框的“三農(nóng)”抽樣調(diào)查體系可以為涉及“三農(nóng)”問題的實(shí)際調(diào)查工作者提供方法上的指導(dǎo)。同時(shí),該抽樣調(diào)查體系的構(gòu)建思路還可以為其他抽樣調(diào)查領(lǐng)域?qū)嵤┗诙嘀爻闃涌虻某闃诱{(diào)查提供參考和幫助。
限于篇幅,本文未就提出的抽樣設(shè)計(jì)方案和估計(jì)量的功效進(jìn)行檢驗(yàn)。下一階段研究的主要任務(wù)是積極開展與政府統(tǒng)計(jì)部門的合作,將本文提出的設(shè)想和方法應(yīng)用于我國政府統(tǒng)計(jì)部門的“三農(nóng)”抽樣調(diào)查中,對所給出的設(shè)計(jì)方案和估計(jì)量效果進(jìn)行檢驗(yàn),為我國將來開展基于多重抽樣框的調(diào)查方法奠定基礎(chǔ)。