王 迪,陳仲新,周清波,劉 佳
(1.農(nóng)業(yè)部農(nóng)業(yè)信息技術重點實驗室,北京 100081;2.中國農(nóng)業(yè)科學院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所,北京 100081)
農(nóng)作物播種面積信息是國家制定糧食政策和經(jīng)濟計劃的重要依據(jù)[1-2]。及時準確地估計農(nóng)作物播種面積對于加強農(nóng)作物生產(chǎn)管理,確保我國糧食安全具有重要意義[3-4]。以往國內外大區(qū)域尺度的農(nóng)作物播種面積抽樣統(tǒng)計調查大多通過構建簡單或回歸估計量進行總體相關指標 (如總體總值、方差等)的推斷與估計[5-12]。簡單估計量具有構建簡便、線性無偏等優(yōu)點,因此在早期的農(nóng)作物播種面積抽樣統(tǒng)計調查中得以廣為應用[13],但由于其在抽樣外推總體過程中僅局限于利用調查變量的樣本指標進行總體估計,而無法利用輔助變量信息進一步改善總體外推精度,因此表現(xiàn)為有效性偏差。隨著遙感 (RS)、地理信息系統(tǒng)(GIS)等空間信息技術的迅速發(fā)展,通過遙感數(shù)據(jù)獲取輔助變量信息構建的回歸估計量和比率估計量在農(nóng)作物播種面積空間抽樣調查中逐漸為人們所應用。如美國國家農(nóng)業(yè)統(tǒng)計署 (NASS)以“六月面積大調查 (June Area Survey)”數(shù)據(jù)作為抽樣樣本地面調查數(shù)據(jù) (即調查變量),以通過對遙感影像 (主要為IRS-AWIFS和LandSat5-TM)進行監(jiān)督分類得到的農(nóng)作物空間分布信息作為輔助變量,構建回歸估計量進行了全美農(nóng)作物播種面積估計。實踐表明,利用該回歸估計量外推全美主要農(nóng)作物 (小麥、玉米和棉花)播種面積總體精度均在95%以上[14]。歐盟的農(nóng)業(yè)遙感監(jiān)測計劃 (MARS)中也利用遙感數(shù)據(jù) (Landsat-TM或SPOT-XS)提取歐盟地區(qū)農(nóng)作物空間分布信息作為輔助變量,通過聯(lián)合抽中切塊 (Segments)內的農(nóng)作物播種面積地面調查數(shù)據(jù)進行回歸估計量構建,對歐盟地區(qū)17種農(nóng)作物的播種面積進行了估計,結果表明,利用回歸估計量進行主要農(nóng)作物播種面積估計時的相對效率 (即全部使用樣本地面調查數(shù)據(jù)產(chǎn)生的總體估計方差與回歸估計量產(chǎn)生的估計方差比值)均高于2[15]。Gonzalez[16]等利用與抽樣樣本地面調查數(shù)據(jù)同年和上一年的遙感數(shù)據(jù) (Landsat-TM)提取農(nóng)作物空間分布信息作為輔助變量,通過聯(lián)合樣本地面調查數(shù)據(jù)和輔助變量信息構建回歸估計量,對西班牙東北部的大麥播種面積進行了估計,結果表明,當研究區(qū)年際間土地利用狀況不發(fā)生較大變化時,利用上年遙感影像作為輔助變量進行大麥播種面積估計時,同樣可以得到較高的估計精度。張錦水等[17]利用Landsat-TM影像獲取輔助變量信息,通過構建比率估計量對冬小麥播種面積分層抽樣效率的影響因子進行了分析。
綜上所述,以往國內外在利用統(tǒng)計估計量進行農(nóng)作物播種面積抽樣外推總體研究方面,主要集中于利用單一種類的估計量 (如簡單估計量或回歸估計量)進行區(qū)域農(nóng)作物播種面積估計,缺乏對多種估計量進行農(nóng)作物播種面積外推總體效率高低的定量比較,更未進行估計量的優(yōu)化選擇,從而限制了農(nóng)作物播種面積抽樣調查效率的進一步改善。針對于此,該研究以安徽省蒙城縣為研究區(qū),選取冬小麥播種面積為研究對象,通過聯(lián)合研究區(qū)冬小麥播種面積遙感影像數(shù)據(jù)和抽樣樣本地面調查數(shù)據(jù),構建多種統(tǒng)計估計量,以抽樣外推總體相對誤差及穩(wěn)定性為評價指標,定量比較多種估計量總體外推效率的高低,實現(xiàn)對統(tǒng)計估計量的優(yōu)選,從而為進一步改進現(xiàn)有農(nóng)作物播種面積抽樣調查效率提供解決途徑。
蒙城縣位于安徽省西北部,地處淮北平原中部,行政區(qū)域介于北緯32°55'29″~32°29'64″、東經(jīng)116°15'43″~116°49'25″之間,縣境整體略呈長方形,東西寬40km,南北長60km,國土面積約2 091km2,其中耕地面積為15.3萬hm2。蒙城縣屬暖溫帶半濕潤季風氣候,典型的平原地區(qū)。全縣多年平均氣溫14.7℃,平均日照2 320小時,平均無霜期216天,多年平均降水量822mm。蒙城縣自然條件優(yōu)越、土地肥沃,盛產(chǎn)優(yōu)質小麥、水稻、玉米等糧食作物,其中冬小麥是蒙城縣最重要的糧食種植作物,其種植面積約占耕地面積的70%。
圖1 蒙城縣冬小麥及地面調查樣本的空間分布
圖2 地面樣本內自然地塊組成情況
主要包括3部分:(1)基礎地理信息數(shù)據(jù)。蒙城縣行政邊界數(shù)據(jù) (比例尺為1:25萬,矢量格式);(2)冬小麥面積空間分布數(shù)據(jù)。蒙城縣2009年冬小麥播種面積空間分布矢量數(shù)據(jù) (基于ALOS AVNIR-2影像提取,影像軌道號:162652930,獲取日期:2009年2月12日,空間分辨率10m);(3)冬小麥播種面積地面調查樣本數(shù)據(jù) (矢量格式)。蒙城縣冬小麥播種面積地面調查樣本數(shù)據(jù)中包含12個樣本,為保證能夠基于樣本觀測值進行總體外推與誤差估計,本研究中的冬小麥面積地面調查樣本是采用簡單隨機抽樣方法抽選。為確保樣本地面調查的可操作性實施,采用自然地塊邊界作為樣本邊界,以500m×500m為抽樣基礎單元尺寸的設計標準,對研究區(qū)進行以自然地塊邊界為樣本單元邊界的抽樣基礎單元劃分。需要說明的是,在按自然邊界進行抽樣基礎單元劃分時,如樣本單元面積超出設計標準較大時 (研究設計為20%),利用該樣本單元進行冬小麥面積總體外推需要進行面積加權處理。采用手持式差分GPS(測量精度1.0~5.0m)人工測量每個樣本內的冬小麥面積,測量日期為2009年5月10日。為減小測量誤差,對每個樣本的冬小麥面積均分別進行3次測量,取平均值作為樣本內的冬小麥面積測量值。需要說明的是,在樣本地塊內進行冬小麥面積測量時,所測面積為冬小麥純播種面積,不包括地塊中的田埂面積。圖1給出了蒙城縣冬小麥和地面調查樣本的空間分布。圖2給出了地面調查樣本 (以編號為5的地面調查樣本為例)內自然地塊組成情況。
1.3.1 簡單估計量
由于研究采用簡單隨機抽樣方法進行樣本抽選,對于簡單隨機抽樣,可利用樣本均值作為總體均值的估計,即總體均值的簡單估計量為
總體總值的簡單估計量見式 (2)??傮w總值簡單估計量方差的無偏估計按式 (3)計算[18]。
1.3.2 比率估計量
為構建比率估計量,該研究以通過地面調查得到的研究區(qū)冬小麥面積總體為目標變量Y,以基于遙感調查得到的研究區(qū)冬小麥面積總體為輔助變量X,研究區(qū)冬小麥面積總體均值和總值的比率估計量分別見公式 (4)和 (5)[19]。
總體總值比率估計量方差按式 (6)~(10)計算。
1.3.3 回歸估計量
參考比率估計量的構建,同樣以通過地面調查得到的研究區(qū)冬小麥面積總體為目標變量Y,以基于遙感調查得到的研究區(qū)冬小麥面積總體為輔助變量X,構建回歸估計量。對于簡單隨機抽樣而言,研究區(qū)冬小麥面積總體均值和總體總值回歸估計量分別見式(11)和(12)[19]。
總體總值回歸估計量方差按式 (14)計算[19]。
1.3.4 相對誤差和變異系數(shù)計算
為定量評價基于3種估計量的冬小麥播種面積抽樣外推總體誤差和穩(wěn)定性,該研究選取相對誤差 (r)和總體總值估計量的變異系數(shù) (CV)2個指標,其中CV用于評價總體推斷的穩(wěn)定性,外推總體相對誤差(r)按公式 (16)計算,CV按公式 (17)計算。
為構建多種估計量,該研究中采取2種方式進行樣本觀測值獲取:一種是地面調查方式。采用差分GPS人工測量樣本地塊內冬小麥播種面積得到;另一種是遙感調查方式。通過將研究區(qū)2009年冬小麥空間分布數(shù)據(jù) (遙感影像解譯得到)與樣本地面調查數(shù)據(jù) (矢量格式)相疊加,采用GIS軟件統(tǒng)計樣本單元內冬小麥播種面積完成對樣本觀測值的獲取。
樣本觀測值的準確與否直接關系到外推總體的精度。為檢查基于地面和遙感兩種調查方式下的樣本觀測值的真實性和準確性,表1中列出了研究區(qū)冬小麥播種面積抽樣樣本的地面調查和遙感調查結果。從表中可以看出,樣本的遙感調查精度為±10m2(受ALOS AVNIR-2影像的空間分辨率制約),而地面調查精度可達到±1m2,這說明相對于遙感調查,樣本的地面調查精度更高。另外,除個別樣本外,樣本的地面調查面積普遍高于遙感調查面積。相對于遙感調查面積,樣本的地面調查面積更接近圖測面積,這一點可以從遙感與地面調查分別占圖測面積的比例中看出。由于在最初的抽樣框構建時,抽樣基礎單元的設計就選擇在冬小麥種植區(qū)域內進行,因此樣本單元內除冬小麥以外的其他地物面積比例一般會較低,從這一角度也說明了樣本的地面調查真實性和準確性要高于遙感調查。對樣本的遙感調查地面調查結果進行差異顯著性檢驗,t(11)=-1.969 <t0.05(11)=1.795 9,說明兩者之間的差異性不顯著。
為定量分析研究區(qū)冬小麥播種面積地面調查與遙感調查結果間的相關關系,進而為抽樣外推總體的統(tǒng)計估計量的構建提供參考依據(jù),圖3繪制了研究區(qū)冬小麥播種面積抽樣樣本地面調查與遙感調查結果間的散點圖,從圖中可以看出,兩者呈線性相關關系,對回歸方程進行顯著性檢驗,F(xiàn)(1,10)=15.207 >F0.01(1,10)=10.04,說明研究區(qū)冬小麥播種面積地面調查與遙感調查結果間極顯著相關。另外,從兩者間的回歸方程y=1.106 2x(R2=0.777)可以看出,抽樣樣本的地面調查與遙感調查結果間的相關關系為正比例關系。
為比較3種估計量外推總體的效率高低,從而為實現(xiàn)農(nóng)作物面積抽樣外推總體的統(tǒng)計估計量優(yōu)選提供參考依據(jù),表2中給出了利用3種估計量外推研究區(qū)冬小麥播種面積總體與誤差估計結果。從表中可以看出,相對于簡單估計量 (外推總體相對誤差和變異系數(shù)(CV)值分別為34.91%和9.61%)而言,利用比率估計量和回歸估計量外推總體的相對誤差更小 (分別為11.01%和13.11%),同時穩(wěn)定性也表現(xiàn)為更高 (CV值分別為6.20%和8.04%),這說明相對于單純利用地面調查樣本進行總體外推結果,利用遙感影像作為輔助變量構造的比率估計量和回歸估計量外推總體的效率更高。此外,對比率估計量和回歸估計量外推總體結果可以看出,在研究的試驗條件下,利用比率估計量外推總體的精度更高,穩(wěn)定性更好。需要說明的是,盡管利用3種估計量外推研究區(qū)冬小麥面積總體的相對誤差仍偏高 (大于10%),但分析其原因主要是因為研究設計選取的樣本容量偏低所致。研究中的抽樣比僅為0.21%,其中總體容量為5783,通過研究區(qū)總土地面積除以地面調查樣本面積均值并取整得到。
圖3 地面調查與遙感調查樣本冬小麥面積散點
表1 冬小麥播種面積空間抽樣樣本地面與遙感調查結果
表2 基于3種估計量的冬小麥播種面積外推總體與誤差估計結果
為定量評價多種估計量外推總體的效率高低,從而為實現(xiàn)農(nóng)作物播種面積抽樣外推總體的統(tǒng)計估計量優(yōu)選提供參考依據(jù),研究以安徽省蒙城縣為研究區(qū),選取冬小麥播種面積為研究對象,通過聯(lián)合研究區(qū)冬小麥播種面積抽樣樣本地面與遙感調查數(shù)據(jù),分別構建3種估計量 (簡單估計量、比率估計量和回歸估計量)進行了研究區(qū)冬小麥播種面積總體外推與誤差估計試驗研究,結果表明:
(1)樣本內的冬小麥播種面積地面調查精度高于遙感調查,但兩種調查方式下的樣本觀測值間差異不顯著。
(2)樣本的地面調查與遙感調查結果間存在極顯著的正比例關系。
(3)以相對誤差和變異系數(shù)CV為抽樣外推總體效率評價指標,在研究設計的3種估計量中,比率估計量外推總體的效率最高 (相對誤差和CV值最小);其次是回歸估計量;簡單估計量外推總體的效率最低。因此,比率估計量外推法對于提高冬小麥面積遙感估計精度可能有一定的作用。
[1]陳水森,柳欽火,陳良富,等.糧食作物播種面積遙感監(jiān)測研究進展.農(nóng)業(yè)工程學報,2005,6(21):166~170
[2]錢永蘭,楊邦杰,焦險峰.基于遙感抽樣的國家尺度農(nóng)作物面積統(tǒng)計方法評估.農(nóng)業(yè)工程學報,2007,23(11):180~187
[3]楊邦杰,裴志遠.國家級農(nóng)情遙感監(jiān)測系統(tǒng)的研究開發(fā)與運行.農(nóng)業(yè)工程學報,2003,19:11~14
[4]周清波.國內外農(nóng)情遙感現(xiàn)狀與發(fā)展趨勢.中國農(nóng)業(yè)資源與區(qū)劃,2004,25(5):9~14
[5]Chhikara R S,Lundgren J C,Houston A G.Crop acreage estimation using a Landsat-Based estimator as an auxiliary variable.IEEE Transactions on Geoscience and Remote Sensing,1986,24(1):157 ~167
[6]González F,Cuevas M.Remote sensing and agricultural statistics:crop area estimation through regression estimators and confusion matrices.International Journal of Remote Sensing,1993,14(6):1215~1219
[7]Gallego F J.Remote sensing and land cover area estimation.International Journal of Remote Sensing.2004,25(15):3019 ~3047
[8]陳仲新,劉海啟,周清波等.全國冬小麥面積變化遙感監(jiān)測抽樣外推方法的研究.農(nóng)業(yè)工程學報,2000,16(5):126~129
[9]焦險峰,楊邦杰.全國棉花種植面積遙感檢測抽樣方法設計,農(nóng)業(yè)工程學報,2002,18(4):168~171
[10]焦險峰,楊邦杰,裴志遠.基于分層抽樣的中國水稻種植面積遙感調查方法研究.農(nóng)業(yè)工程學報,2006,22(5):105~110
[11]王迪,周清波,劉佳.作物面積空間抽樣框架及抽樣基礎要素優(yōu)化設計研究.中國農(nóng)業(yè)資源與區(qū)劃,2008,29(4):9~15
[12]王迪,周清波,陳仲新,等.空間抽樣方法估算冬小麥播種面積.農(nóng)業(yè)工程學報,2012,28(10):177~184
[13]FAO.Multiple frame agricultural surveys.Volume I:Current surveys based on area and list sampling methods,Rome,1996
[14]Boryan C,Yang Z W,Mueller R,et al.Monitoring US agriculture:the US Department of Agriculture,National Agricultural Statistics Service,Cropland Data Layer Program.Geocarto International,2011,26(5):341~358
[15]Gallego F J.Crop area estimation in the MARS project.MARS Conference:10 years of demand-driven technical support(Brussels:Office for publications of the EC),1996,April 22~23
[16]González F,Cuevas M J,Arbiol R,et al.Remote sensing and agricultural statistics:crop area estimation in north-eastern Spain through diachronic Landsat TM and ground sample data.International Journal of Remote Sensing.1997,18(2):467~470
[17]張錦水,潘耀忠,胡潭高,等.冬小麥種植面積空間抽樣效率影響因子分析.農(nóng)業(yè)工程學報,2009,25(8):169~173
[18]金勇進,蔣妍,李序穎.抽樣技術.北京:中國人民大學出版社,北京,2002,168~177
[19]李金昌.應用抽樣技術.北京:科學出版社,2006,66~82