王子龍 陳偉杰 付 強(qiáng) 姜秋香 印玉明 常廣義
(東北農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院,哈爾濱 150030)
土壤特性與其變異性研究必須以科學(xué)的采樣策略為依托。抽樣策略的本質(zhì)即尋求經(jīng)濟(jì)投入與實(shí)驗精度間的優(yōu)化平衡,以最小的經(jīng)濟(jì)投入所換取的離散樣本集來估測連續(xù)總體集的主要信息而不失其精確性[1]。建立集代表性、準(zhǔn)確性和經(jīng)濟(jì)適用性為一體的土壤采樣設(shè)計不但有助提高工作效率,而且也是研究的關(guān)鍵。采樣設(shè)計一般建立在統(tǒng)計非全面調(diào)查的基礎(chǔ)上,根據(jù)實(shí)際工作所研究對象的性質(zhì)和相關(guān)工作的目的而采用與其相適用的方法。各種采樣設(shè)計會形成各異的采樣結(jié)果,由此產(chǎn)生的抽樣誤差也有較大的差別[2]。相對于實(shí)驗室分析誤差而言,不科學(xué)的采樣設(shè)計帶來的誤差影響更為顯著[3]。
目前,國內(nèi)外土壤采樣的常用方法主要包括簡單隨機(jī)采樣、嵌套采樣、分層采樣、系統(tǒng)采樣和整群采樣等方法[4-8],采樣點(diǎn)分布策略的研究主要集中在基于地統(tǒng)計學(xué)的插值模型對采樣點(diǎn)空間位置和采樣數(shù)目的優(yōu)化[9],如李潤林等[10]和李楠等[11]基于輔助變量運(yùn)用克里格法進(jìn)行了采樣數(shù)目優(yōu)化;VAT等[12]和韓宗偉等[13]通過模擬退火法對樣點(diǎn)空間布局進(jìn)行了優(yōu)化,但其缺陷在于不適用于初步采樣,而偏重于為多次采樣和后期監(jiān)測點(diǎn)的布置提供參考,同時,支撐其理論的初步采樣數(shù)據(jù),往往遵循隨機(jī)抽樣,忽略了空間相關(guān)性,在一定程度上造成了結(jié)果偏差。除傳統(tǒng)的插值模型外,侯建花等[14]提出了MDI空間采樣策略來提高采樣點(diǎn)估算精度,但沒有考慮地形和地貌的影響,其效果受到一定影響。在利用先驗知識輔助采樣方面,曾也魯?shù)萚15]提出了基于NDVI先驗知識的LAI地面采樣方法;江雨佳等[16]利用濕度與碳通量的相關(guān)性提出了一種基于輔助因子空間分布特征的小尺度空間采樣策略,在碳通量采樣設(shè)計中取得較好效果;劉京等[17]基于土壤景觀模型認(rèn)為土壤景觀越相似,其所對應(yīng)的土壤越相似,提出了基于樣點(diǎn)個體代表性的采樣制圖方法。此外,YANG等[18]和孫孝林等[19]運(yùn)用基于土壤景觀模型理論的代表性等級采樣法在土壤制圖方面可得到一系列代表性較好的采樣點(diǎn),但其存在如下缺陷:忽略了各協(xié)同因子對目標(biāo)屬性空間分布的影響差異;在確定代表性樣本時,多協(xié)同因子的聚類會因為隸屬度閾值的選擇而導(dǎo)致有效信息的流失;協(xié)同因子局限于定量因子的范疇(如坡度、地形濕度指數(shù)、沿等高線曲率等)無法加入定性因子(如土地利用形式)。本文建立一種可賦權(quán)、信息傳遞完整、包容性強(qiáng)(可涵蓋定性、定量兩類協(xié)同因子)的基于優(yōu)先級指數(shù)的土壤采樣設(shè)計方法(簡稱優(yōu)先級采樣法)。
土壤景觀學(xué)[20]系統(tǒng)論述了土壤成因與景觀類型的必然關(guān)系,土壤景觀學(xué)模型結(jié)合空間分析成為土壤調(diào)查方法研究的主要趨勢,并在國內(nèi)外相關(guān)研究中得到驗證[21-24]。優(yōu)先級指數(shù)采樣法的基本思路是分析與目標(biāo)土壤屬性直接相關(guān)的協(xié)同因子的空間分布,通過賦予其權(quán)重并疊加計算優(yōu)先級指數(shù),將研究區(qū)域分割成為具有各自優(yōu)先級指數(shù)的區(qū)域,優(yōu)先級指數(shù)越高則越能表現(xiàn)研究區(qū)土壤屬性變化的主要特征,而優(yōu)先級指數(shù)低的點(diǎn)則是目標(biāo)土壤屬性變化特征的細(xì)化補(bǔ)充,在合理采樣數(shù)的限定下,依照優(yōu)先級指數(shù)從高到低選取采樣點(diǎn),即可較好地平衡采樣的代表性和全局性,也可為多次采樣提供依據(jù)。
為保證土壤性質(zhì)空間分布預(yù)測具有較高精度,將定量和定性因子相結(jié)合作為輔助變量,對于提高土壤性質(zhì)空間分布預(yù)測精度有較好的效果[25]。協(xié)同因子選取的合理性直接影響分析結(jié)果的科學(xué)性和可靠性。因此,在已有研究的基礎(chǔ)上,選取與目標(biāo)土壤屬性相關(guān)因子作為研究集合,通過Pearson相關(guān)性系數(shù)應(yīng)用MAXTED等[26]的標(biāo)準(zhǔn)刪除冗余信息,以確保相關(guān)因子都能反映一個獨(dú)立的信息。由于定性協(xié)同因子無法通過Pearson相關(guān)性系數(shù)來與定量因子做相關(guān)性分析,在聚類處理后,可以借助信息熵的概念來評判兩者攜帶信息的獨(dú)立性。
為了綜合考慮各協(xié)同因子對目標(biāo)土壤屬性空間分布的不同影響,可通過粗糙集理論予以賦權(quán),其原理和步驟詳見文獻(xiàn)[27],或采用專家打分法等策略。在各協(xié)同因子中,通過聚類方法又可劃分為多個子集,其各子集所占空間決定了其在一定空間范圍內(nèi)的景觀類型的主要特性,由此,以信息尺度設(shè)定的柵格為單位,可通過計算各子集所占總空間面積比與其所歸屬協(xié)同因子的權(quán)重之積,作為其對目標(biāo)土壤屬性空間分布預(yù)測的貢獻(xiàn)值。將賦有貢獻(xiàn)值的各協(xié)同因子圖層作為輸入層,可疊加計算同一空間位置下柵格貢獻(xiàn)值之和,即得到賦有采樣優(yōu)先級指數(shù)的報告層。其中,具有相同優(yōu)先級指數(shù)的相鄰柵格可進(jìn)一步看作一個代表性圖斑,其數(shù)值越大,即表明該圖斑覆蓋的地理空間位置越具備研究區(qū)空間范圍內(nèi)的樣本特性。將該優(yōu)先級指數(shù)由高到低排序,其序列的順次,即優(yōu)先級別。圖層疊加原理如圖1所示。圖中,EA為協(xié)同因子子集的貢獻(xiàn)值;SP為優(yōu)先級指數(shù)。
圖1 各協(xié)同因子圖層疊加原理圖Fig.1 Layers overlapping principle sketch of synergistic factors
采樣點(diǎn)布設(shè)一般遵循以下原則:①根據(jù)圖斑的優(yōu)先級別設(shè)置采樣點(diǎn),優(yōu)先在優(yōu)先級別高的圖斑內(nèi)布設(shè)。②根據(jù)路網(wǎng)緩沖區(qū)級別設(shè)置采樣點(diǎn),在具有相同優(yōu)先級別的圖斑間決定取舍時,優(yōu)先在具有較高級別路網(wǎng)緩沖區(qū)的圖斑內(nèi)布設(shè)。③每個圖斑內(nèi)的樣本容量可以是一個或者多個,也可以為零,根據(jù)采樣點(diǎn)緩沖區(qū)半徑、合理采樣數(shù)和采樣預(yù)算來決定。
路網(wǎng)緩沖區(qū)級別是在報告層上疊加各級路網(wǎng)圖,根據(jù)實(shí)際采樣需求,沿國道、省道、縣道、鄉(xiāng)道對應(yīng)生成具有一定半徑的Ⅰ、Ⅱ、Ⅲ、Ⅳ級緩沖區(qū)。為使采樣點(diǎn)盡可能地分散布置,需要設(shè)定采樣點(diǎn)的緩沖區(qū),以避免采樣點(diǎn)集聚造成局部信息冗余。設(shè)研究區(qū)面積為M,采樣點(diǎn)的緩沖區(qū)半徑為
(1)
式中,N為合理采樣數(shù),可通過Cochran公式初步計算,具體算法可參照文獻(xiàn)[28]。
以嫩江縣土壤飽和導(dǎo)水率空間變異性研究的采樣方案為例,驗證基于優(yōu)先級指數(shù)的土壤采樣設(shè)計方法的實(shí)用性及采樣點(diǎn)的代表性。
嫩江縣地處松嫩平原黑土區(qū)嫩江流域上游,隸屬黑龍江省黑河市,共轄8鎮(zhèn)6鄉(xiāng),總面積達(dá)1.51×104km2,約占松嫩平原黑土區(qū)的1/8,如圖2所示。嫩江縣屬中溫帶半濕潤大陸季風(fēng)氣候,多年平均氣溫-1.4~0.8℃,無霜期80~130 d,土壤多為壤土,速效氮質(zhì)量比平均為220.7 mg/kg,速效磷質(zhì)量比平均為61.9 mg/kg,速效鉀質(zhì)量比平均為172.7 mg/kg,飽和導(dǎo)水率在3.88~86.27 cm/min之間,均值為23.15 cm/min,標(biāo)準(zhǔn)差11.27 cm/min。土壤養(yǎng)分豐富,保水、保肥力強(qiáng),適合多種作物的生長,是重要的商品糧基地。
圖2 研究區(qū)地理位置Fig.2 Geographical location of study area
飽和導(dǎo)水率反映了水在土壤中流動的阻礙作用。影響飽和導(dǎo)水率的因素較多,目前已有諸多文獻(xiàn)對此進(jìn)行了研究[29-34]?;谇叭搜芯拷Y(jié)論及先驗知識的可獲取性,本研究協(xié)同因子涵蓋有機(jī)質(zhì)含量、碎石含量、粉粒含量、沙粒含量、粘粒含量、土壤容重、土地利用情況、坡度。其中,土地利用數(shù)據(jù)來源于Earth Science Data Interface (ESDI),坡度數(shù)據(jù)來源于地理空間數(shù)據(jù)云,其余數(shù)據(jù)均來源于聯(lián)合國糧農(nóng)組織(FAO)和維也納國際應(yīng)用系統(tǒng)研究所(IIASA)所構(gòu)建的世界土壤數(shù)據(jù)庫(Harmonized World Soil Database version 1.1)中第2次全國土地調(diào)查南京土壤所提供的1∶1 000 000土壤數(shù)據(jù)。
由相關(guān)性分析可知(表1),沙粒與粉粒(相關(guān)系數(shù)-0.935)、粘粒(相關(guān)系數(shù)-0.791)、土壤容重(相關(guān)系數(shù)0.939)的信息重疊程度以及土壤容重與粉粒(相關(guān)系數(shù)-0.773)、粘粒(相關(guān)系數(shù)-0.926)的信息重疊度均達(dá)到了篩選標(biāo)準(zhǔn)(相關(guān)系數(shù)絕對值大于0.75),則從協(xié)同因子中剔除沙粒與土壤容重。
由土地利用方式信息熵(2.170 4)和協(xié)同因子坡度、碎石、粉粒、粘粒、有機(jī)質(zhì)信息熵1.999 8、1.958 2、1.989 2、1.978 0、1.756 9得到聯(lián)合熵與K值如表2所示,可知土地利用方式與坡度、碎石、粉粒、粘粒、有機(jī)質(zhì)之間相關(guān)性弱,具有極好的信息獨(dú)立性。最終,確定坡度、碎石、粉粒、粘粒、有機(jī)質(zhì)及土地利用方式為協(xié)同因子。
表1 協(xié)同因子相關(guān)性分析(N=258)Tab.1 Correlation analysis between synergistic factors (N=258)
注:** 表示顯著水平為P<0.01;*表示顯著水平P<0.05。
圖3 各協(xié)同因子輸入層圖Fig.3 Input layer diagrams of synergistic factors
表2 土地利用方式與協(xié)同因子聯(lián)合熵與K值Tab.2 United entropy and K-value of land use patterns and collaborative factor
基于先驗知識的圖層?xùn)鸥窬鶠?0″(緯度差)×30″(經(jīng)度差),故而設(shè)定柵格大小為1 km×1 km,以此作為后續(xù)運(yùn)算的基本單元。由于土壤屬性的先驗知識來源于第2次全國土地調(diào)查南京土壤所提供的1∶1 000 000土壤數(shù)據(jù),其數(shù)據(jù)并不完全連續(xù),因此可根據(jù)數(shù)據(jù)集中的幾個區(qū)間進(jìn)行聚類。通過ArcGIS分別計算各協(xié)同因子的輸入層,如圖3所示。
由粗糙集理論可得到有機(jī)質(zhì)含量、碎石體積含量、粉粒含量、粘粒含量、坡度、土地利用方式的權(quán)重分別為0.129、0.185、0.089、0.096、0.217、0.284。為探究不同權(quán)重設(shè)定對采樣方案的影響,同時考慮到該法涉及種別差異的定性因子,故而另外采用專家打分法計算權(quán)重進(jìn)行對比,由收集到的20份調(diào)查問卷結(jié)果可得有機(jī)質(zhì)含量、碎石體積含量、粉粒含量、粘粒含量、坡度、土地利用方式的權(quán)重分別為0.146、0.246、0.200、0.216、0.077、0.114。
將各協(xié)同因子的輸入層通過ArcGIS的柵格計算器按各自權(quán)重疊加計算即可得到對應(yīng)的報告層,將優(yōu)先級指數(shù)從高到低排序,依次賦予其優(yōu)先級別,如圖4所示。對研究區(qū)域柵格化處理后,其柵格總量可視為樣本總量。根據(jù)所適用的不同合理采樣數(shù)計算公式,Cochran采樣數(shù)法、由樣本方差替代總體方差條件下的Cochran采樣數(shù)法、小樣本平均極差替代標(biāo)準(zhǔn)差條件下的Cochran采樣數(shù)法、小樣本均值替代總體均值條件下的Cochran采樣數(shù)法分別得合理采樣數(shù)計算結(jié)果為86、31、44、82個。其中,Cochran采樣數(shù)法與小樣本均值替代總體均值條件下的Cochran采樣數(shù)法所得的合理采樣數(shù)較為接近,綜合考慮采樣尺度和范圍的條件下,選取Cochran采樣數(shù)為最終合理采樣數(shù)。
圖4 優(yōu)先級別及采樣點(diǎn)分布圖Fig.4 Priority and sampling points distribution
由式(1)可計算得,嫩江縣采樣點(diǎn)的緩沖區(qū)半徑為7.47 km,與王衛(wèi)華等[35]提出的飽和導(dǎo)水率采用間距7.14 km較為契合。疊加嫩江縣范圍內(nèi)的國道、省道、縣道和鄉(xiāng)道后,綜合考慮采樣所選用的交通工具及人力可及程度,自主選擇半徑生成Ⅰ、Ⅱ、Ⅲ、Ⅳ級緩沖區(qū),并遵循前文提及的采樣原則進(jìn)行布點(diǎn)。以基于粗糙集理論的優(yōu)先級指數(shù)采樣法為例,最后得到的采樣點(diǎn)分布如圖4所示。
本研究采用普通克里格法作為飽和導(dǎo)水率空間插值算法,并通過獨(dú)立驗證以均方根誤差作為評價指標(biāo)。本文在研究區(qū)范圍內(nèi)隨機(jī)選取20個點(diǎn)作為獨(dú)立樣本。此外,該方法所需的飽和導(dǎo)水率均以第2次全國土地調(diào)查南京土壤所提供土壤數(shù)據(jù)為基礎(chǔ)由Campbell土壤轉(zhuǎn)換函數(shù)計算所得。
圖5 基于不同采樣方法的飽和導(dǎo)水率插值結(jié)果比較Fig.5 Comparison of saturated hydraulic conductivity interpolation between different sampling methods
本研究采用包含600個樣點(diǎn)的總集通過GS+7.0選擇半方差函數(shù),將基于粗糙集理論的優(yōu)先級指數(shù)采樣法、基于專家打分法的優(yōu)先級指數(shù)采樣法、分層采樣法和隨機(jī)采樣法得到的點(diǎn)集分別作為已知數(shù)據(jù),通過ArcGIS中的Geostatistics模塊進(jìn)行克里格插值來預(yù)測獨(dú)立樣本點(diǎn)的數(shù)據(jù),并與獨(dú)立樣本值作比較,如圖5所示。由結(jié)果可知,基于粗糙集理論的優(yōu)先級指數(shù)采樣法、基于專家打分法的優(yōu)先級指數(shù)采樣法、分層采樣法、隨機(jī)采樣法得到的預(yù)測值相對于獨(dú)立樣本而言,其均方根誤差分別為51.930、46.901、54.772、55.980 cm/min。
由表3的對應(yīng)點(diǎn)均方根誤差均值及標(biāo)準(zhǔn)差可知,優(yōu)先級指數(shù)采樣法相對于分層采樣法和隨機(jī)采樣法均最小,即優(yōu)先級指數(shù)采樣法插值得到的預(yù)測值與獨(dú)立樣本值最接近。就空間分布而言,由圖6可知,優(yōu)先級指數(shù)采樣法在一定程度上比分層采樣和隨機(jī)采樣更加接近樣點(diǎn)總集?;诖植诩瘍?yōu)先級采樣法與基于專家打分法在空間分布上較隨機(jī)采樣法和分層采樣法更為接近,由圖6可知,基于專家打分法得到的空間分布信息比基于粗糙集優(yōu)先級采樣法得到的信息略為豐富。在表3中對應(yīng)點(diǎn)均方根誤差的統(tǒng)計信息可知,基于專家采樣優(yōu)先級采樣法最接近真實(shí)值,其變異系數(shù)最小,即得到的數(shù)據(jù)集最為收斂。
表3 基于不同采樣方法的獨(dú)立驗證點(diǎn)統(tǒng)計參數(shù)對比Tab.3 Comparison of statistical parameter of independent verification point based on different sampling methods
圖6 基于不同采樣方法的空間分布對比Fig.6 Comparison diagrams of spatial distribution between different sampling methods
相對于傳統(tǒng)采樣法而言,優(yōu)先級指數(shù)采樣法能夠較好地捕捉研究區(qū)土壤信息的主要特征,在允許條件下,可以多批次增加采樣密度,滿足于靈活變更采樣計劃對研究區(qū)細(xì)部信息進(jìn)行補(bǔ)充。目前采樣點(diǎn)分布策略多運(yùn)用克里格插值、模擬退火法等模型進(jìn)行優(yōu)化,該方法需要在隨機(jī)抽樣等傳統(tǒng)方法為初步采樣的基礎(chǔ)上進(jìn)行,目的更偏重于后期監(jiān)控點(diǎn)布設(shè),相比之下,優(yōu)先級指數(shù)采樣法在協(xié)同因子可獲得的情況下,能滿足初步采樣設(shè)計和后期監(jiān)測點(diǎn)布置的任務(wù)需求,其所花費(fèi)的人力物力在一定程度上性價比更高。相對于土壤景觀理論的代表性等級采樣法,優(yōu)先級指數(shù)采樣法具有可賦權(quán)、信息傳遞完整及包容性強(qiáng)的特點(diǎn)。
優(yōu)先級指數(shù)采樣法旨在利用有效協(xié)同因子的情況下靈活把握研究區(qū)的整體屬性分布特征,優(yōu)先級指數(shù)較高的區(qū)域?qū)ρ芯繀^(qū)整體特征的把握能力較好,而優(yōu)先級指數(shù)較低的區(qū)域則更能反映局部特性的細(xì)節(jié),隨著優(yōu)先級指數(shù)從高到低依次增加采樣點(diǎn),采樣精度會在一定程度上有逐步上升的過程。但由于優(yōu)先級指數(shù)較低的點(diǎn)位對全局的代表性相對較小,在一定程度上僅能表征局部范圍的空間分布特性,若以采樣精度變化量和采樣成本變化量之比來定義采樣效益,那么樣點(diǎn)數(shù)隨著優(yōu)先級指數(shù)從高到低依次增加,對整體采樣效益而言在一定程度上會有逐步上升達(dá)到峰值又轉(zhuǎn)而回落的過程,該峰值所對應(yīng)的采樣數(shù),在經(jīng)濟(jì)效益上能夠為合理采樣數(shù)目進(jìn)一步的確定提供一定程度指導(dǎo)。
(1)優(yōu)先級指數(shù)采樣法考慮了各協(xié)同因子對目標(biāo)屬性空間分布的影響差異,同時能夠容納多種定性定量因子;在確定優(yōu)先級別時,不會因為聚類數(shù)的選擇而導(dǎo)致有效信息的流失。
(2)相比于傳統(tǒng)隨機(jī)采樣和分層采樣法,優(yōu)先級指數(shù)采樣法能夠在一定程度上避免局部最優(yōu),能更好的反映研究區(qū)的主要信息。此外,在兼顧樣點(diǎn)布設(shè)均勻性和隨機(jī)性的同時,與路網(wǎng)相關(guān)聯(lián)能夠極大地改善實(shí)際采樣的便捷性,為采樣路線的設(shè)計提供一定的依據(jù)。
(3)協(xié)同因子的權(quán)重對優(yōu)先級指數(shù)采樣法的結(jié)果在空間分布及預(yù)測的準(zhǔn)確性上都有一定程度的影響。相比于傳統(tǒng)的分層采樣和隨機(jī)采樣,基于不同權(quán)重優(yōu)先級指數(shù)采樣法得到的結(jié)果較為接近。