趙國富
(山東理工大學(xué)網(wǎng)絡(luò)信息中心,淄博 255049)
分層聚類在土地利用中的應(yīng)用
趙國富
(山東理工大學(xué)網(wǎng)絡(luò)信息中心,淄博 255049)
通過分析分層聚類法理論基礎(chǔ),實現(xiàn)分層聚類算法。運用分層聚類算法研究土地利用變化,通過多次嘗試、比較不同的距離變量,得到較好的結(jié)果,驗證聚類結(jié)果的正確性,提高算法結(jié)果的有用性。
聚類分析;土地利用;分層聚類
當(dāng)前,土地科研工作者對于土地利用的研究不斷采用更先進(jìn)的技術(shù)方法,所得到的結(jié)果也越來越能反映陸地的表層(巖石、巖石的風(fēng)化物和土壤)的實際情況。當(dāng)前很多工作者選用聚類分析的策略,其中分層聚類算法是常用的一種技術(shù)方法。根據(jù)計算類別間距離的不同,構(gòu)成了不同的分層聚類方法[1]。通過研究、比較分層聚類的類別間不同的距離,參照實際的土地狀況,可以得到較好的結(jié)果,可以為進(jìn)一步改善我國土地利用、保護(hù)土地資源提出更好的策略。
分析數(shù)據(jù),可以從原始數(shù)據(jù)開始,對原始數(shù)據(jù)對象展開調(diào)查、研究,分析有用的主要成分,形成所需要的有效數(shù)據(jù),并將每一個有效數(shù)據(jù)對象作為矩陣的變量,置于相應(yīng)的行列位置。所以,可用p個變量來表示n個對象,將這種數(shù)據(jù)結(jié)構(gòu)看成如下n×p的數(shù)據(jù)矩陣[2]:
在這個數(shù)據(jù)矩陣中,往往因為各個變量可以選用不同的度量單位,而不同的度量值經(jīng)常導(dǎo)致觀測值有一定偏差,所以需要對度量值進(jìn)行絕對值轉(zhuǎn)換,以減小變量的不同帶來的具體影響。
在統(tǒng)計中,聚類具有不可替代的作用,通常選用群重心、群中心、群間距離中的一種作為聚類統(tǒng)計量進(jìn)行統(tǒng)計。在聚類分析過程中,聚類統(tǒng)計量的選取較為關(guān)鍵。如果選取不盡合理,可能導(dǎo)致錯誤的結(jié)論。對于空間聚類,聚類統(tǒng)計量通常采用歐氏距離[2]。
聚類算法一般是建立在相異度矩陣的基礎(chǔ)上。將數(shù)據(jù)矩陣轉(zhuǎn)化為相異度矩陣,表示對象與對象之間的關(guān)系緊密程度,即相似度或相異度,表現(xiàn)形式是一個n×n維的矩陣[2]:對象i和j越相似,d()i,j值就越接近0,所以相異度矩陣能夠充分地表示出各分類對象間的相似度,作為基礎(chǔ)數(shù)據(jù)用于進(jìn)行聚類分析。為了確保各變量在分析中的作用相同,需要對分析數(shù)據(jù)進(jìn)行中心化和標(biāo)準(zhǔn)化變換[3]
顧名思義,分層聚類就是對給定的數(shù)據(jù)按層次進(jìn)行劃分,直到滿足要求的條件結(jié)束。該方法可以是基于距離的或基于密度或連通性的,有“自底向上”和“自頂向下”兩種。
通過分析具體數(shù)據(jù),選擇“自底向上”分層聚類法較為合理,其實現(xiàn)過程為[1]:
(1)將初始的n各數(shù)據(jù)對象分別作為一個類別,將原始數(shù)據(jù)矩陣做相應(yīng)處理,生成一個距離矩陣;
(2)分析該距離矩陣,將距離最小的兩個數(shù)據(jù)對象歸并,生成了n-1個類別的新的距離矩陣;
(3)迭代第二步,直到所有的數(shù)據(jù)都滿足條件,這時意味著生成一新的類別。
分層聚類法的計算主要是“起初聚類統(tǒng)計量的計算”和“統(tǒng)計量在類別合并過程中的刷新”[4]。
為適應(yīng)經(jīng)濟(jì)全球化的大趨勢,依據(jù)《土地利用現(xiàn)狀分類》(GB/T 21010-2007),要求各?。▍^(qū)、市)農(nóng)業(yè)部門會同國土資源部門的土地工作者有效科學(xué)地規(guī)劃土地,合理利用土地,對土地的管理達(dá)到最優(yōu),所以迫切需要一些切實可行的技術(shù)方法,為土地決策者提供有力的技術(shù)支持。算法以各省(區(qū)、市)的農(nóng)用地的利用現(xiàn)狀(2006)為基礎(chǔ)數(shù)據(jù)。通過分析,在各因素中農(nóng)用地(如牧草地、建筑用地、未利用土地等)因素分布變化較大,需合理選取農(nóng)用地分析因素算法的變量,用于分層聚類方法生成符合需求的聚類。通過綜合分析,算法選用幅員面積、農(nóng)用地、建筑用地和未利用地四個方面進(jìn)行處理[5]。
(1)數(shù)據(jù)處理
對原始數(shù)據(jù)對象進(jìn)行中心化和標(biāo)準(zhǔn)化變換,生成的相異度矩陣,如表1所示。
表1 相異度矩陣
(2)聚類分析過程
對土地利用進(jìn)行的分層聚類算法的分類結(jié)果顯示以離差平方和法較為合理[5],其聚類過程如表2所示。
表2 聚類過程
由表2,第1列表示聚類過程的步驟號,第2列和第3列表示在某一步驟中參與合并的省市,第4列表示每一步聚類的聚類系數(shù),第5列和第6列表示合并的?。ㄊ校┏醮纬霈F(xiàn)在哪一步。在聚類過程中,一個記錄代表的是一個類別,0代表該記錄在聚類過程中第初次出現(xiàn)。根據(jù)聚類系數(shù)的變化,聚類過程共進(jìn)行了29步。
(3)實驗結(jié)果
根據(jù)我國土地資源的基本狀況,聚類結(jié)果應(yīng)滿足各?。▍^(qū)、市)的農(nóng)業(yè)發(fā)展規(guī)劃和土地利用規(guī)劃,盡可能反映各地實際情況,為土地工作者提供具有價值的聚類數(shù)據(jù),以進(jìn)一步對各?。▍^(qū)、市)的農(nóng)業(yè)發(fā)展規(guī)劃和土地利用規(guī)劃提供決策,達(dá)到不斷改進(jìn)規(guī)劃,更好的利用土地資源的目的。綜合考慮30個?。ㄊ校┩恋刭Y源的地方差異,將試驗結(jié)果分為4類比較合理如下:
第一類:北京、天津、上海、江蘇、安徽、山東、河南;
第二類:河北、山西、內(nèi)蒙古、湖北、廣東、廣西、海南、貴州、云南、陜西;
第三類:遼寧、吉林、黑龍江、浙江、福建、江西、湖南、四川、寧夏;
第四類:西藏、甘肅、青海、新疆。
通過上述分析,基于土地利用的分層聚類算法的結(jié)果符合各地農(nóng)業(yè)發(fā)展規(guī)劃和土地利用規(guī)劃的要求,可以為改善我國土地利用狀況,提供一定參考價值,較好地引導(dǎo)農(nóng)業(yè)發(fā)展。算法還表明各部門的土地工作者需要對土地利用盡量優(yōu)化,例如盡量利用荒山荒坡、灘涂等未利用土地。因此,通過我們的算法,在開展土地資源的調(diào)查研究和科學(xué)評價中,能夠更好地對土地組成、利用現(xiàn)狀進(jìn)行綜合的考慮,做到有計劃有限制地開發(fā)土地資源,增加耕地面積,提高耕地質(zhì)量,以達(dá)到對土地資源的更加科學(xué)的改造與治理的目標(biāo),保持土地的良性循環(huán),土地利用可持續(xù)化,同時為社會發(fā)展、城市化進(jìn)程不斷推進(jìn)、國民經(jīng)濟(jì)建設(shè)提供決策支持。
[1]張文彤,董偉.SPSS統(tǒng)計分析高級教程[M].北京:高等教育出版社,2004.
[2]Jiawei Han,Micheline Kambe著.數(shù)據(jù)挖掘概念與技術(shù).范明,孟小峰譯.機(jī)械工業(yè)出版社,223-262.
[3]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M],北京:中國水利水電出版社,2003.
[4]郭仁忠.空間分析(第二版).北京:高等教育出版社,2001.
[5]趙國富.基于聚類的空間數(shù)據(jù)挖掘方法與應(yīng)用研究[碩士學(xué)位論文]。山東:山東理工大學(xué),2006.
Abstract:Analyzes the basic theories of the hierarchical cluster algorithm,and makes the algorithm come true.Applies the hierar?chical cluster algorithm into land use change,so attains a better result through many times of attempting,comparing some space regular clustering algorithm,validates the correctness of clustering gained,improves arithmetic serviceability.
Keywords:Cluster Analysis;Soil Utilization;Hierarchical Cluster
Application of the Hierarchical Cluster Algorithm in Soil Utilization
ZHAO Guo-fu
(Network Information Center,Shandong University of Technology,Zibo 255049)
山東省自然科學(xué)基金資助項目(No.2004ZX31)
1007-1423(2017)26-0033-03
10.3969/j.issn.1007-1423.2017.26.008
趙國富(1971-),男,山東濰坊人,碩士,高級工程師,研究方向為空間數(shù)據(jù)處理、計算機(jī)應(yīng)用
2017-06-02
2017-08-30