陳旭飛 ,任向寧 ,張 池 ,咸春龍,馮雪珂,馬 濤,劉健美
(1.廣東省土地開發(fā)整治中心,廣東 廣州 510630;2.華南農(nóng)業(yè)大學資源環(huán)境學院,廣東 廣州 510642;3.華南農(nóng)業(yè)大學經(jīng)濟管理學院,廣東 廣州 510642)
【研究意義】隨著人口規(guī)模增長,工業(yè)化、城市化快速發(fā)展及農(nóng)業(yè)結構的調整等,耕地產(chǎn)能下降與社會經(jīng)濟需求增加之間的矛盾愈發(fā)突出,成為區(qū)域可持續(xù)發(fā)展的重要制約因素。中國人口眾多,社會經(jīng)濟對農(nóng)產(chǎn)品需求巨大,但人均耕地遠低于世界平均水平[1];且耕地后備資源多位于區(qū)位較差、海拔較高、坡度較大地區(qū)[2],其開墾成本高、生態(tài)環(huán)境風險大,相對經(jīng)濟產(chǎn)出效益偏低[3]。據(jù)第二次全國土地調查的耕地質量分等成果,中低等農(nóng)田占現(xiàn)有農(nóng)田的比例達70.6 %[4],其產(chǎn)能提升潛力巨大。因此,進一步完善農(nóng)田產(chǎn)能提升潛力評價技術,挖掘現(xiàn)有農(nóng)田產(chǎn)能潛力,促進農(nóng)田高效利用,提高農(nóng)田供給能力,對保障區(qū)域糧食安全,降低對外糧食依存度具有重要的現(xiàn)實意義[5]?!厩叭搜芯窟M展】農(nóng)田產(chǎn)能提升潛力評價是基于農(nóng)田整理潛力評價的定向糧食生產(chǎn)潛力提升的農(nóng)田產(chǎn)能評價,區(qū)別于一般農(nóng)田整理潛力評價注重農(nóng)田數(shù)量與質量提升的復合目標,農(nóng)田產(chǎn)能提升潛力評價則集中在農(nóng)田質量及其內在的產(chǎn)能提升目標[6]。早期的農(nóng)田產(chǎn)能提升潛力評價側重于單方面生產(chǎn)力水平的提高,如德國通過農(nóng)田狀況、耕作條件、種植結構等評價產(chǎn)能提升的潛力[7]。進入20世紀90年代后,逐漸注重農(nóng)田的保護及其合理性利用,如俄羅斯從水土流失等自然災害的防治、土壤肥力保持、高產(chǎn)農(nóng)田建設的角度評價農(nóng)田的潛力[8-9]。我國早期注重農(nóng)田數(shù)量潛力的評價,通過引入耕地標準系數(shù)的概念[10],建立農(nóng)田潛力評價系統(tǒng)[11]測算農(nóng)田數(shù)量提升潛力。隨著研究的深入,進一步提出多目標評價指標體系,即在農(nóng)田數(shù)量評價的基礎上增加了農(nóng)田產(chǎn)能、生態(tài)環(huán)境等方面的評價指標[12]。同時,逐漸將數(shù)學建模思想運用到農(nóng)田產(chǎn)能提升潛力評價中[13],不斷促進了農(nóng)田產(chǎn)能提升潛力評價的科學性與適用性。目前,構建農(nóng)田產(chǎn)能提升潛力評價指標體系,一般多采用理論分析與專家咨詢相結合的方法,以滿足評價指標的科學性和完整性[14]?!颈狙芯壳腥朦c】但是,綜合了土地資源學、系統(tǒng)科學、生態(tài)學、經(jīng)濟學等理論分析,及各專業(yè)學科專家的專家經(jīng)驗判斷,構建的農(nóng)田產(chǎn)能提升潛力評價指標體系較為龐大,不同指標影響尺度不一致,導致潛力評價難度上升,評價結果的科學性與真實性下降。因此,如何從眾多自然、社會與經(jīng)濟影響指標中篩選、構建可信度高、科學性強,且較少人為因素干擾的潛力評價指標體系,是目前進一步推進農(nóng)田產(chǎn)能提升潛力評價的重要現(xiàn)實問題。【擬解決的關鍵問題】本文以中國華南區(qū)廣東省為研究區(qū)域,試將隨機森林算法引入農(nóng)田產(chǎn)能提升潛力評價指標體系的構建中,進一步明晰農(nóng)田產(chǎn)能提升潛力評價的關鍵性指標及其影響力大小,提高評價結果的科學性和準確性。
廣東省位于中國大陸最南部,毗鄰港澳,東鄰福建、西接廣西,北面與湘、贛兩省接壤,西南端隔瓊州海峽與海南省相望。全境位于北緯20°13′~25°31′,東經(jīng)109°41′~117°20′之間,陸地面積17.83×104km2。2015年,廣東省現(xiàn)轄廣州、深圳、珠海、佛山、東莞等21個地級市,119個縣級行政區(qū)劃單位,1586個鄉(xiāng)鎮(zhèn)(街道)。2015年末,廣東省常住人口10 849 萬人,其中城鎮(zhèn)人口7454.35 萬人,鄉(xiāng)村人口3394.65 萬人。
廣東省地處低緯度,北回歸線橫貫省境陸域中部,大部分地區(qū)屬亞熱帶季風氣候,部分屬熱帶季風氣候,全年太陽高度角大,所得到的太陽輻射多,熱量豐富,年平均氣溫22 ℃,年平均降水量1500~2000 mm。廣東省地形受深度地質構造與地史發(fā)育過程影響,大體是北高南低。陸地以山地丘陵為主,山地面積大,分布較廣。山地之間,丘陵、臺地、盆地、平原斷續(xù)分布,地貌類型復雜多樣,相互交錯。其中500 m以上的山地占21.08 %,丘陵占41.26 %,臺地占13.35 %,平原占23.42 %,內陸水域占0.89 %。廣東的山地均屬于中低山地,全省山地面積為375.48×104hm2。丘陵面積較大,共有734.87×104hm2(圖1-A,圖1-B)。廣東省境內河流密布、縱橫交錯,水資源豐富。其中集雨面積在100 km2以上的河流有542 條,多年平均水資源總量1.82×1011m3,其中地表水資源量1.82×1011m3,地下水資源量4.5×1010m3,地表水與地下水重復計算量為4.4×1010m3。但區(qū)域水資源時空分布不均,沿海臺地和低丘陵區(qū)不利蓄水,缺水現(xiàn)象突出,尤以粵西的雷州半島最為典型。
受氣候、地形、成土母質、水文、植被以及人為活動的綜合影響,廣東省主要分為河谷平原土壤組合、紅巖盆地土壤組合和石灰?guī)r山地土壤組合3種類型的土壤組合。其中河谷平原土壤組合主要由河流沖積物和三角洲沉積物發(fā)育而成,包括潮土、泥田、砂泥田、赤紅地,以及潛育型水稻土、潴育型水稻土等。紅巖盆地土壤組合主要由紫色砂頁巖及其洪積沖積物發(fā)育而成,主要包括紫色土、牛肝地和牛肝土田等。石灰?guī)r山地土壤組合主要由石灰?guī)r風化物發(fā)育而成,形成紅色石灰土和黑色石灰土。根據(jù)第二次土壤普查成果,廣東省土壤類型主要包括16個土類,36個亞類,131個土屬,522個土種(圖1-C)。
根據(jù)2011-2015年土地利用變更調查數(shù)據(jù),廣東省水田和水澆地面積呈現(xiàn)逐年減少趨勢,水田面積由167.39×104hm2減少至165.96×104hm2,年均減少0.36×104hm2;水澆地面積由12.18×104hm2減少至11.77×104hm2,年均減少0.10×104hm2。通過耕地“占補平衡”政策管制,旱地面積呈現(xiàn)逐年增加的趨勢,旱地面積則由80.56×104hm2增加至84.21×104hm2,年均增加0.91×104hm2(表1)。廣東省旱地分布主要集中在粵西和粵西北的山地丘陵區(qū),占全省旱地總面積的78.08 %(圖1-D)。
圖1 廣東省概況
表1 2011-2015年廣東省耕地面積變化情況統(tǒng)計
研究區(qū)農(nóng)田產(chǎn)能潛力變化樣點來源于2011-2015年廣東省高標準農(nóng)田建設項目庫,共3531個(表2,圖2)。農(nóng)田樣點可實現(xiàn)產(chǎn)能潛力數(shù)據(jù)、農(nóng)田土壤屬性及量化數(shù)據(jù)及農(nóng)田基礎設施狀況數(shù)據(jù)采集于2011-2015年廣東省耕地質量等別年度更新數(shù)據(jù)庫,中低產(chǎn)田數(shù)據(jù)采集于廣東省耕地地力評價成果更新成果(2015),生態(tài)環(huán)境資料來源于廣東省地質災害防治規(guī)劃及其基礎數(shù)據(jù)與規(guī)劃數(shù)據(jù)庫,研究區(qū)水體、植被數(shù)據(jù)及行政區(qū)劃界線主要根據(jù)研究區(qū)2015年度土地利用變更調查成果,并采用地理空間數(shù)據(jù)云下載的高分一號遙感影像解譯進行檢驗、修正。DEM數(shù)據(jù)采用ASTER GDEM數(shù)據(jù)(國家基礎數(shù)據(jù)中心),用于研究區(qū)海拔高度、地形坡度等信息提取,空間分辨率30 m。人口、經(jīng)濟等數(shù)據(jù)主要來源于研究區(qū)下轄各區(qū)1980和2015年統(tǒng)計年鑒或統(tǒng)計報表,公路交通數(shù)據(jù)采集于公開地圖(open street map)。
1.3.1 隨機森林算法模型 隨機森林(Random Forest, RF)算法模型[15]是一種基于分類樹的算法模型,屬于機器學習技術。隨機森林利用Boot-strap重抽樣方法從原始樣本中抽取多個樣本,對每個Boot-strap樣本進行決策樹建模,通過產(chǎn)生大量的分類樹,建立若干自變量與因變量的關系,然后組合多棵決策樹的預測,最終通過投票得出預測結果。RF模型通過對大量分類樹的匯總提高了預測精度,是較神經(jīng)網(wǎng)絡等傳統(tǒng)機器學習方法更為先進的算法模型。
RF算法現(xiàn)已被廣泛應用到諸如生物信息[16]、醫(yī)學研究[17]、商業(yè)管理[18]、語言建模[19]、文本分類[20]、經(jīng)濟金融[21]等實際領域,這些領域的問題利用隨機森林方法都取得了較優(yōu)的解決方案。在面對較大變量數(shù)目及海量數(shù)據(jù)集時,算法模型較經(jīng)典建模有很多不可比擬的優(yōu)越性。隨機森林學習算法用于評價指標的選取,能較好地挖掘出原始數(shù)據(jù)包含的內在信息,針對原始數(shù)據(jù)集不同的訓練數(shù)據(jù),該算法選出的指標具有一致性,比簡單的統(tǒng)計評價方法更為科學準確[22-23]。同時,隨機森林克服了決策樹過擬合問題,對耦合噪聲和樣本異常值有較好的容忍性,具有良好的可擴展性和并行性。此外,隨機森林作為一種由數(shù)據(jù)驅動的非參數(shù)分類方法,對分類先驗知識的依賴性下降[15]。
1.3.2 影響因素遴選與量化方法 受自然環(huán)境變化與人為活動雙重擾動,農(nóng)田產(chǎn)能提升潛力其具有較強的空間變異性,且影響因素眾多[24]。農(nóng)田產(chǎn)能提升潛力一般可分為自然潛力和外部潛力[25],其中自然潛力主要為農(nóng)田自然稟賦,如光溫生產(chǎn)潛力、自然地理環(huán)境、土壤條件、水文條件等;外部潛力包括農(nóng)田管理措施、農(nóng)田投入水平、農(nóng)業(yè)科技水平、農(nóng)田生產(chǎn)設施狀況、農(nóng)田施肥狀況等。采用文獻法收集已有研究成果,整理出農(nóng)田立地條件、基礎設施配套、社會經(jīng)濟環(huán)境、農(nóng)田管理措施和生態(tài)環(huán)境改善5個方面25個影響因素[6,14,25-26],并通過“現(xiàn)代農(nóng)業(yè)發(fā)展趨勢-時空變化-影響因素”響應特征分析,剔除與現(xiàn)代農(nóng)業(yè)發(fā)展趨勢響應度較低的人均耕地、農(nóng)業(yè)人口比重、財政收入、農(nóng)民人均收入、權屬狀況和插花地狀況等社會、經(jīng)濟因素,及農(nóng)田管理措施、農(nóng)田投入水平、農(nóng)業(yè)科技水平、農(nóng)田施肥狀況具有較強的空間隨機性和不穩(wěn)定性的影響因素,補充對產(chǎn)能提升影響顯著的區(qū)域水源與農(nóng)田匹配程度這一因素,初步篩選確定海拔高度、地形坡度、水源與農(nóng)田的匹配程度、土壤有機質含量、有效土層厚度、剖面構型、土壤pH值、障礙層深度、灌溉保證狀況、排水條件、田間道路狀況、中低產(chǎn)田面積指數(shù)、田塊破碎程度、土壤侵蝕程度、農(nóng)田防護林建設狀況、自然災害抵御狀況、對外交通便利狀況等17個影響因素[14,26]。
圖2 廣東省高標農(nóng)田項目分布
表2 廣東省農(nóng)田產(chǎn)能潛力變化樣點統(tǒng)計
采用ArcGIS軟件中空間分析工具完成研究區(qū)農(nóng)田產(chǎn)能提升潛力影響因素的空間化,其中海拔高度與地形坡度根據(jù)區(qū)域DEM采用ArcGIS進行測算,水源與農(nóng)田的匹配程度根據(jù)農(nóng)田與水庫、河流、灌渠等水源的空間距離進行度量,農(nóng)田土壤有機質含量、有效土層厚度、剖面構型、土壤pH值、障礙層深度及灌溉保證狀況、排水條件直接采用耕地質量等別年度更新數(shù)據(jù)庫中的量化數(shù)據(jù),田間道路狀況根據(jù)土地利用變更調查成果測算農(nóng)田路網(wǎng)密度進行測度,中低產(chǎn)田面積指數(shù)根據(jù)行政村內中低產(chǎn)田面積比率及省內平均中低產(chǎn)田面積比率進行測度[14]。田塊破碎程度根據(jù)樣點工程建設前后的農(nóng)田總面積與斑塊數(shù)量,測算出農(nóng)田破碎化指數(shù)的變化量,表征田塊破碎度的變化強度。土壤侵蝕程度、農(nóng)田防護林建設狀況、自然災害抵御狀況根據(jù)廣東省地質災害防治規(guī)劃基礎數(shù)據(jù)庫進行量化,對外交通便利狀況則結合公開地圖與土地利用變更調查成果,采用ArcGIS軟件分級進行空間分析完成量化。不同因素對農(nóng)田產(chǎn)能提升潛力的影響方向是不同的,因素值越高,農(nóng)田產(chǎn)能提升潛力越大的因素為正向影響因素。反之,則為負向影響因素。
圖3 研究區(qū)農(nóng)田產(chǎn)能提升潛力影響因素分析
以廣東省2011-2015年高標準農(nóng)田建設項目為樣點,項目建設前后農(nóng)田可實現(xiàn)產(chǎn)能變化量為因變量,各影響因素為自變量,采用SPSS19.0進行多重共線性診斷。其結果顯示:各因素之間特征根(Eigenvalue)在0.021~6.638,,條件指數(shù)(Condition Index)在1.000~7.163,相關系數(shù)矩陣為非線性弱相關關系,各因素間不存在顯著共線性。采用隨機森林算法模型進行探測,17個影響因素的重要度(I值)在0.21~12.71。其中水源與農(nóng)田匹配系數(shù)重要度最大,其I值為12.71,地形坡度、剖面構型、有效土層厚度、土壤有機質含量的I值在6.35~9.32。其余12個因素對項目區(qū)農(nóng)田提升潛力指數(shù)的重要度均在5.00以下。其重要度序列為:水源與農(nóng)田匹配系數(shù)>地形坡度>剖面構型>有效土層厚度>土壤有機質含量>灌溉保證狀況>排水條件>障礙層深度>田塊破碎程度>土壤pH值>海拔高度>土壤侵蝕程度>田間道路狀況>對外交通便利狀況>中低產(chǎn)田面積指數(shù)>農(nóng)田防護林建設狀況>抵御自然災害狀況。
農(nóng)田潛力提升潛力的影響因素中,抵御自然災害狀況(RND)、農(nóng)田防護林建設狀況(FSC)、中低產(chǎn)田面積指數(shù)(MLYA)、對外交通便利狀況(TC)、田間道路狀況(FR)的重要度在1.00以下,對農(nóng)田產(chǎn)能提升影響較?。煌寥狼治g程度(SE)、海拔高度(Altitude)、土壤pH值(pH)、田塊破碎程度(FF)、障礙層深度(OD)、排水條件(DC)、灌溉保證狀況(IGR)的重要度在2.43~4.45之間,屬于一般影響因素;土壤有機質含量(SOMC)、有效土層厚度(EST)、剖面構型(PC)、地形坡度(Slope)、水源與農(nóng)田匹配系數(shù)(WFMC)等5個因素的重要度大于5.00,其I值平均值為8.47,對農(nóng)田產(chǎn)能提升影響顯著,為中大尺度上農(nóng)田產(chǎn)能提升潛力評價的核心指標(圖3)。
圖4 廣東省農(nóng)田產(chǎn)能提升潛力級別分布
根據(jù)評價指標對農(nóng)田產(chǎn)能提升的重要度,采用加和分權法測度指標權重,地形坡度、水源與農(nóng)田的匹配系數(shù)、有機質含量、有效土層厚度、剖面構型等5個指標權重分別為地形坡度權重是0.22,水源與農(nóng)田的匹配系數(shù)權重是0.30,土壤肥力是0.15,有效土層厚度是0.15,剖面構型是0.18。按照農(nóng)田產(chǎn)能提升潛力評價體系,采用多因素加權評判法測算廣東省21.29×104hm2產(chǎn)能較低的農(nóng)田提升潛力指數(shù)。采用自然斷點法進行潛力等級劃分,其中I級(潛力指數(shù)>88.86)為6.06×104hm2、II級(80.01<潛力指數(shù)≤88.86)6.81×104hm2、III級(71.81<潛力指數(shù)≤80.01)4.68×104hm2、IV級(63.47<潛力指數(shù)≤71.81)2.70×104hm2、V級(潛力指數(shù)≤63.47)1.04×104hm2(圖4)。
目前,一般的農(nóng)田產(chǎn)能評價多采用理論分析與專家咨詢相結合的方法,該方法綜合性強,指標覆蓋領域廣泛,指標數(shù)量多在10~25[24,27]。但是該方法過于追求指標覆蓋度,且受人為因素的影響較大,部分參與評價的指標重要性不高,導致評價指標體系的整體離散性顯著,針對性和真實性下降。同時,現(xiàn)有的評價指標體系涉及的資料數(shù)據(jù)龐大,數(shù)據(jù)難以獲取,評價工作量大,難以滿足在中大尺度上對時間、質量的要求[14,27]。而隨機森林模型通過組合多棵決策樹測度不同影響因素的重要性,有效降低了農(nóng)田產(chǎn)能提升潛力評價的指標維度,將廣東省農(nóng)田產(chǎn)能提升潛力評價指標從17個降低到5個。該方法減少了因素間的相互干擾噪音,進一步收斂了評價結果的針對性,提高了評價效率。
研究區(qū)(廣東省)產(chǎn)能較低的農(nóng)田多位于區(qū)位較差、遠離海岸線、海拔較高且坡度較大地區(qū),因此,在沿海或內陸干旱半干旱區(qū)農(nóng)田中影響顯著的土壤pH值[26]、對農(nóng)田系統(tǒng)中物質能量交換具有重要作用的對外交通便利狀況[25],對田塊尺度上農(nóng)田產(chǎn)能影響顯著的灌溉排水等基礎設施狀況、田塊破碎程度、田間道路狀況等因素[6,25-26],在隨機森林模型判定中都屬一般影響或較小影響,重要性較低。但是,我國幅員遼闊,不同區(qū)域、不同空間尺度,地理環(huán)境與農(nóng)作方式不同,農(nóng)田產(chǎn)能提升潛力評價指標必然存在一定的差異性,其指標體系構建應盡量采用科學數(shù)據(jù)與方法測度。同時,在現(xiàn)有研究成果中尚未采用的水源與農(nóng)田匹配系數(shù),在中大空間尺度上對農(nóng)田產(chǎn)能提升的重要性最大,高于土壤條件、地形坡度等其他16個影響因素。因此,建議在其他區(qū)域的農(nóng)田產(chǎn)能提升潛力評價進行廣泛的試算,進一步探討、判定其重要性。
基于隨機森林模型構建農(nóng)田產(chǎn)能提升潛力評價指標體系,進一步提高了指標體系與區(qū)域農(nóng)田特征的契合度,保證了評價結果的科學性、有效性。在人為活動的強烈干擾下,農(nóng)田產(chǎn)能的影響因素眾多,包括農(nóng)田立地條件、基礎設施配套、社會經(jīng)濟環(huán)境、農(nóng)田管理措施和生態(tài)環(huán)境等各方面因素,具有強烈的多因性和復雜性。根據(jù)隨機森林模型的重要性測度結果,在中大空間尺度上,交通、基礎設施配套、社會經(jīng)濟環(huán)境、農(nóng)田管理措施和生態(tài)環(huán)境等因素對農(nóng)田產(chǎn)能提升潛力影響較小,而地形坡度、水源與農(nóng)田的匹配系數(shù)、有機質含量、有效土層厚度、剖面構型等5個自然地理環(huán)境指標對農(nóng)田產(chǎn)能提升潛力的影響較為顯著。其中水源與農(nóng)田的匹配系數(shù)在諸多因素中影響最為顯著,綜合體現(xiàn)了區(qū)域“水-土”資源協(xié)調關系的緊密程度。
農(nóng)田產(chǎn)能提升潛力評價結果顯示:廣東省農(nóng)田產(chǎn)能提升潛力較大的I、II級面積12.87×104hm2,主要分布于廣東省中部的惠州市、東部的汕尾市、西部的湛江市和茂名市,一級北部的清遠市,占全省一、二級潛力總面積的60.48 %。
由于時間及數(shù)據(jù)資料收集的限制,農(nóng)田產(chǎn)能數(shù)據(jù)直接采用了省級耕地質量等別年度更新數(shù)據(jù)庫中的可實現(xiàn)產(chǎn)能結果,下一步可基于科學實測數(shù)據(jù)提高影響因素重要性測度的精度。