郭恒 張軍 劉安偉
關(guān)鍵詞:最大似然;神經(jīng)網(wǎng)絡(luò);SVM;Kappa系數(shù)
中國分類號:P237 文獻標志碼:A
0引言
隨著近些年遙感技術(shù)領(lǐng)域眾多新技術(shù)的不斷涌現(xiàn),目前該技術(shù)已具備多平臺、大尺度、高分辨率、多波段、多時相、衛(wèi)星重訪周期短等諸多優(yōu)勢,影像攜帶豐富的光譜信息。遙感圖像的分類就是使用基于各類模型算法的計算機模式識別技術(shù)在遙感領(lǐng)域的應用。具體目的是通過先驗知識或?qū)嵉靥た睌?shù)據(jù)與目視解譯的方法建立研究區(qū)不同地物類別及判別標準,通過計算機進行監(jiān)督與非監(jiān)督分類。目前主流較為成熟的分類方法較多,主要有最大似然、神經(jīng)網(wǎng)絡(luò)、支持向量機等分類方法。不論使用哪一種方法,都有其局限性。所以,在實際應用中,要結(jié)合各種分類方法自身的特點及影像的實際情況,提高分類的精度與效率[1]。
1影像分類方法
在基于監(jiān)督分類的影像分類方法中,馬氏距離分類法在考慮像素統(tǒng)計的基礎(chǔ)上,注重各類別中的內(nèi)在變化,相對最小距離分類法更加實用,但相對的計算時間成本要大[2];最小距離分類法是基于圖像像素統(tǒng)計的分類法,該分類方法的優(yōu)勢在于其計算量小,所有像素均被分類。其劣勢在于基于矩陣的計算相對單一,精度不高,存在一定的錯分想象。例如,同類型地物因局部像素差異過大而被錯分[3];平行六面體分類法充分考慮遙感影像各波段的光譜特征,按照光譜DN值作圖像分類處理。對植被的監(jiān)督分類運用該分類方法可以得到較好的分類結(jié)果,但同種地物光譜如果與訓練樣本光譜差異較大,也會存在錯分的現(xiàn)象;最大似然法具有分類效率高,精度較好的優(yōu)勢。但該分類方法受參數(shù)估計限制較大;神經(jīng)元網(wǎng)絡(luò)分類法模擬人腦神經(jīng)反饋機制系統(tǒng)建立一套數(shù)學模型。該分類方法較傳統(tǒng)基于統(tǒng)計的分類方法在分類精度上有明顯的提高,但計算非常耗時,分類運算需要多次迭代才能完成[4];支持向量機分類法也是機器學習中較為經(jīng)典的一種分類法。該方法在訓練樣本較少的前提下,仍可以獲得較好的分類結(jié)果及統(tǒng)計規(guī)律,其缺點是計算時間會隨訓練樣本種類幾何倍增,分類難以實施。
2支持向量機算法分類原理
支持向量機(Support Vector Machine)早期是由Corinna Cortes和Vladimir Vapnik于20世紀90年代提出的經(jīng)典機器學習算法理論[5]。該算法的原理是基于統(tǒng)計學習理論的VC維理論與結(jié)構(gòu)風險最小化原則基礎(chǔ)之上的[6]。在已有的訓練樣本找到一個最優(yōu)的折中點,就需要在所選訓練樣本的學習能力與學習精度之間權(quán)衡,從而得到較好的規(guī)則推廣能力。通過非線性變換,使分類問題轉(zhuǎn)化為高維空間的分類問題,同時在高維空間找到對應的最佳分類面,最終得到一個最優(yōu)分類結(jié)果[7]。在圖像分類中,由低維分類轉(zhuǎn)化為高維分類,可以大幅度降低分類難度。分類算法的復雜性取決于訓練樣本的數(shù)量和質(zhì)量,與訓練樣本中的持向量機有密切關(guān)系。運用非線性變換將低維空間的分類轉(zhuǎn)化為高維空間的分類問題。同時,在高維空間找到對應的最佳分類面是支持向量機的基本思路。在轉(zhuǎn)化過程中,非線性變化的運算較為復雜。這里需要使用訓練樣本間的積運算(x)i,yi,完成空間維度由低到高的變換。內(nèi)積運算也被稱為核函數(shù),其優(yōu)勢在于坐標變換相對容易,它解決了基于維數(shù)變換的分類問題,同時,不增加整個計算過程的復雜性。根據(jù)Hilbert-Schmidt理論,只有滿足前提條件的內(nèi)積函數(shù)才可以進行空間變換,該條件定義為,對于任意K(x,y),g(x)≠0,且∫g(x)2dx<∞,有:
3實驗結(jié)果分析
3.1數(shù)據(jù)處理
研究選用ENVI遙感影像處理軟件,使用Landsat8OLI_TIRS衛(wèi)星數(shù)字產(chǎn)品,影像獲取時間為2018年6月5日,條帶號:129,行編號:36。前期對數(shù)據(jù)進行了輻射定標與大氣校正預處理工作,以還原真實的地表輻射率特征值。裁剪出甘肅省天水市三陽川新區(qū)的334.48km2土地作為研究區(qū)域,并且通過全色影像與多光譜影像的融合,提升影像分辨率至15m。根據(jù)國家標準《土地利用現(xiàn)狀分類》(GB/T21010-2017),結(jié)合研究區(qū)域土地利用實際情況,將訓練樣本劃分為林地、草地、耕地、水域、裸地、建設(shè)用地,前期對影像紋理特征的分析解譯,首先對遙感圖像對應的訓練樣本進行選取與實地踏勘,得到分類樣本27組,驗證樣本31組。在樣本的選取遵循以下兩點準則,一是盡量選擇單一地物類型的像元作為訓練樣本;二是根據(jù)紋理信息與光譜特征,盡可能選取一些具有代表性的地物作為樣本[8]。然后對選取樣本作可分離性分析,系統(tǒng)使用Jeffries-Ma?tusita分離參數(shù)表示樣本的可分離性。矩陣中行與列的焦點表示這兩類地物類型的可分離程度,數(shù)值在0~2.0之間。小于1.8說明地物之間可分離性不理想[9],需要重新調(diào)整訓練樣本;大于1.9的數(shù)值說明相應地物可分離性良好,符合要求[10]。經(jīng)反復實驗與調(diào)整訓練樣本,使訓練樣本的可分離度調(diào)整到最佳狀態(tài),見表1所列。
3.2結(jié)果分析
將研究區(qū)遙感影像7、4、6波段與5、4、3波段進行色彩合成,著重對不同類別的訓練樣本進行有效區(qū)分,可以將不同種地物差異展示出來。分別使用最大似然、神經(jīng)元網(wǎng)絡(luò)及支持向量機等監(jiān)督分類方法對研究影像作分類處理,結(jié)果如圖2所示。通過影像紋理信息及目視解譯判讀結(jié)果,對比發(fā)現(xiàn),平行六面體法分類精度相對較低,在分類結(jié)果中容易出現(xiàn)錯分及邊界與實際情況不符的情況,最大似然、神經(jīng)網(wǎng)絡(luò)、支持向量機分類法在整體分類上具有較好的分類效果。
4分類精度與效率評定
遙感影像分類精度評價因子主要包括:混淆矩陣、Kappa系數(shù)、總體分類精度、錯分誤差、漏分誤差、用戶精度、制圖精度等[11]。研究以總體精度與Kappa系數(shù)作為參考依據(jù)。結(jié)合驗證樣本,經(jīng)數(shù)據(jù)分析,可初步得出以下分類精度評定結(jié)論:
神經(jīng)網(wǎng)絡(luò)與支持向量機的總體分類精度較高,但神經(jīng)網(wǎng)絡(luò)算法耗時較長,見表2所列。在選取的研究區(qū)域及當前的影像分辨率下,SVM分類方法的分類精度與效率綜合表現(xiàn)最佳,計算機分類時間均可在15s內(nèi)完成,但不同分類方法時間消耗差異較大。
5結(jié)論
文章結(jié)合經(jīng)實地踏勘的訓練樣本與驗證樣本,將研究區(qū)影像通過6種常見的分類算法進行依次的影像分類處理??梢缘玫剑夯谘芯繀^(qū)數(shù)據(jù)與尺度,SVM分類算法在時間效率與分類精度綜合表現(xiàn)最佳。通過不同分類算法對實際數(shù)據(jù)處理的橫向?qū)Ρ?,可以對不同分類器進行評定,也可以作為遙感影像解譯評定的參考依據(jù)。由于地表環(huán)境復雜多變,地表實際反射率與地球表觀反射率之間的差異,這些都給影像的分類造成難度,并且每次的實驗結(jié)果與所獲取數(shù)據(jù)的質(zhì)量、實際地物類型、分類復雜度有著密切關(guān)系。如何根據(jù)實際情況,選擇最佳分類器,快速、準確的將圖像進行分類,需要我們對不同質(zhì)量的數(shù)據(jù)進行分類實驗與數(shù)據(jù)分析,還需要我們對不同算法的原理進行更深入地研究。