趙俊祥
(城鄉(xiāng)院(廣州)有限公司,廣東 廣州 510000)
在近年來(lái)的科技發(fā)展中,由于遙感技術(shù)的進(jìn)步,數(shù)據(jù)采集方法的優(yōu)化,基于遙感技術(shù)的應(yīng)用需求持續(xù)增加,遙感數(shù)據(jù)技術(shù)的應(yīng)用領(lǐng)域變得更加廣泛。采用遙感技術(shù)可以獲取到多樣化的地表信息數(shù)據(jù),還可以分析預(yù)測(cè)到地表的動(dòng)態(tài)變換趨勢(shì),能收集多樣化的微觀層面數(shù)據(jù)變換,在土地資源勘測(cè)工作中可以節(jié)省大量的人力、物力并提升效率。借助遙感技術(shù)可以對(duì)特定區(qū)域的土地資源分布、覆蓋范圍加以監(jiān)測(cè)和分類,這也是土地資源分類中最為迅速也是更可靠、理想的方法之一。本文結(jié)合Ensemble-ELM 分類器的特點(diǎn)[1],分析了應(yīng)用多通道分割算法的測(cè)試SAR 數(shù)據(jù)表達(dá)方法[2],與單個(gè)ELM、SVM 分類器[3-4]、隨機(jī)分類器[5]、KNN 分類器加以對(duì)比分析,研究后評(píng)估采用集成ELM 分類算法的優(yōu)勢(shì)與不足。
以廣州市增城區(qū)某區(qū)域?yàn)槔芯糠秶譃樗?、植被、城市和鄉(xiāng)村。在比較實(shí)驗(yàn)中,地面區(qū)域參考圖中已對(duì)地表類的樣本點(diǎn)加以標(biāo)注,累計(jì)有8 038 個(gè),包括訓(xùn)練樣本803 個(gè)、測(cè)試樣本7 235 個(gè),不同地物類別的待測(cè)樣本與測(cè)試樣本數(shù)量如表1 所示。
表1 增城某地區(qū)待測(cè)訓(xùn)練樣本點(diǎn)、測(cè)試樣本點(diǎn)數(shù)目
對(duì)于采用多通道分割算法[2]分析某地區(qū)SAR 圖像加以分類,方法分別為集成ELM、單個(gè)ELM、SVM、隨機(jī)森林、KNN 分類。其中ELM 中文名為極限學(xué)習(xí)機(jī),它作為人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中一個(gè)最新出現(xiàn)的用于訓(xùn)練數(shù)據(jù)的模型,被充分地應(yīng)用于人類多樣化情感識(shí)別、人體行為方式識(shí)別以及系統(tǒng)故障檢查測(cè)試等諸多方面,被很多領(lǐng)域的專家學(xué)者所關(guān)注。而集成ELM 則是在此方法基礎(chǔ)上的擴(kuò)展與集成,相對(duì)更有優(yōu)勢(shì)。依據(jù)分類圖中的數(shù)據(jù),與地面的實(shí)際參考圖加以對(duì)比,借助實(shí)驗(yàn)確定的訓(xùn)練方法與樣本、地表中確定的標(biāo)記數(shù)據(jù)分類后加以評(píng)估。此方法可以用于判定使用的分類是否合理,驗(yàn)證采用的分類方法是否準(zhǔn)確,為分析提供準(zhǔn)確的數(shù)據(jù)支持。在精度評(píng)估比較中,不用借助圖片中相關(guān)圖像數(shù)據(jù),只利用所確定的訓(xùn)練樣本即可實(shí)現(xiàn)。
本文借助四個(gè)精度指標(biāo)加以評(píng)估分析:生產(chǎn)方精確度(Producer’s Accuracy,PA)、用戶精確度(User’s Accuracy,UA)、總體精確度(Overall Accuracy,OA)、Kappa 系數(shù)(Kappa Coefficient,KC)。指標(biāo)的詳細(xì)說(shuō)明如下。
生產(chǎn)方的精確度(PA):此種分類中,對(duì)于任何一個(gè)待測(cè)資源,此類別確定訓(xùn)練樣本,可以正確表達(dá)此種類別的發(fā)生概率。
用戶精確度(UA):這種分類中,對(duì)于任一類待測(cè)樣本而言,分類在此類別中的各類訓(xùn)練樣本,可以分析類別的發(fā)生概率。
總體精確度(OA):表明準(zhǔn)確分類后的訓(xùn)練樣本累計(jì)數(shù)量(面向各類地物類型)占整個(gè)累計(jì)訓(xùn)練樣本數(shù)的比例,相除得到結(jié)果,可以反映分類結(jié)果的正確度。
Kappa 系數(shù)(KC)[6]:這種方法由 Cohen 在 1960 年首次創(chuàng)立,采用隨機(jī)分類的方法體現(xiàn)指標(biāo),可以應(yīng)用于校驗(yàn)一致性,也能應(yīng)用于分類精度的分析。由于其有著非常好的適用性,而被醫(yī)學(xué)、人口普查與統(tǒng)計(jì)、遙感等行業(yè)廣泛地使用。通常來(lái)說(shuō),Kappa 系數(shù)變動(dòng)處于0~1 范圍內(nèi),Kappa 數(shù)值大表明更高精度的分類:0.0~0.2 表明極低條件下存在一致性(slight),0.21~0.4 表明存在一般條件近似性(fair),0.41~0.60 表明存在中等一致性(moderate),0.61~0.80 表明存在高度一致性(substantial),0.81~1 表明幾乎完全一致(almost perfect)。Kappa 綜合體現(xiàn)了不同圖像分類的錯(cuò)誤分類、未被分類、正確分類的結(jié)果,可以全面、有效、準(zhǔn)確地表達(dá)算法的優(yōu)勢(shì)與分類精度。
對(duì)廣東某地區(qū)土地資源的分類精度加以研究,采用Ensemble-ELM 分類器、單個(gè)ELM、SVM 分類器、RF 分類器、KNN 分類器的數(shù)據(jù)結(jié)果的精確度分別對(duì)應(yīng)為92.52%、90.46%、85.58%、75.30%和74.35%。Kappa 系數(shù)分別為0.898、0.870、0.825 8、0.664 5 和 0.653 9。不同單個(gè)ELM 算法的應(yīng)用,本次研究采用Ensemble-ELM 分類器可以使分類后的整體精度提高約2.1%,Kappa 系數(shù)可以提高約0.028。水域和植被兩種地物采用單個(gè)ELM 與Ensemble-ELM 分類器,這兩種分類器的精度都可以保證。但是從待測(cè)類別的分類結(jié)果來(lái)分析,采用Ensemble-ELM 分類器具有優(yōu)勢(shì),這種方法可以提升各類待測(cè)地物的生產(chǎn)方精度和使用方精度,對(duì)比結(jié)果表明集成策略的應(yīng)用和ELM 加以結(jié)合,可以提升ELM 性能,應(yīng)用于遙感圖像的數(shù)據(jù)分類具有可靠的結(jié)果,采用Ensemble-ELM 分類器可以滿足SAR 圖像分類相關(guān)標(biāo)準(zhǔn)。另外,結(jié)合廣州市增城區(qū)某區(qū)域識(shí)別出的地物特點(diǎn)與類別,可以看出Ensemble-ELM 分類器可以提高生產(chǎn)者精確度,還可以保證用戶精確度。從各方面數(shù)據(jù)做對(duì)比也可以看出RF 分類器和KNN 分類器精度相對(duì)較差,均只有75%左右。
對(duì)比幾種方法的分類效率,上述對(duì)比實(shí)驗(yàn)均在同一系統(tǒng)上執(zhí)行。Ensemble-ELM 全過(guò)程用時(shí)消耗約為30 s,采用單個(gè)ELM 的時(shí)間消耗約為28 s,SVM 的時(shí)間消耗280 s,RF訓(xùn)練時(shí)間約為120 s,KNN 的時(shí)間消耗約為370 s。Bagging集成處理是對(duì)各類弱分類器采用串行方式加以組合完成訓(xùn)練,訓(xùn)練Ensemble-ELM 需要的時(shí)間會(huì)增加,另外單個(gè)ELM訓(xùn)練的時(shí)間也會(huì)增加,集成模型的應(yīng)用增加了計(jì)算過(guò)程的時(shí)間消耗,但是可以提升分類的穩(wěn)定性。不同于RF、KNN 與SVM,這種算法應(yīng)用于SAR 圖像分類任務(wù)有速度上的優(yōu)勢(shì),可以滿足土地資源分類的實(shí)際需求。
對(duì)采用多通道模式下的分割算法得到的SAR 圖像加以地物方面的分類,可以驗(yàn)證集成ELM 分類器具有的普適性。另外,此類方法具有預(yù)測(cè)作用,計(jì)算效率與單個(gè)ELM、SVM、隨機(jī)森林、KNN 加以對(duì)比,結(jié)果表明,Ensemble-ELM 應(yīng)用于資源分類可以提高預(yù)測(cè)的準(zhǔn)確性,雖然Ensemble-ELM 應(yīng)用于模型分析與預(yù)測(cè)樣本消耗的時(shí)間高于單個(gè)ELM,但綜合來(lái)看,這是一種特別有效的方法,也充分說(shuō)明該方法可以應(yīng)用于本研究區(qū)域之中。另外展望未來(lái),也將會(huì)把該方法應(yīng)用于自然資源監(jiān)測(cè)中,從而提高相應(yīng)工作的效率。