崔艷榮,鄒斌,3*,韓震,石立堅(jiān),劉森
( 1. 上海海洋大學(xué) 海洋科學(xué)學(xué)院,上海 201306;2. 國家衛(wèi)星海洋應(yīng)用中心,北京 100081;3. 國家海洋局空間海洋遙感與應(yīng)用研究重點(diǎn)實(shí)驗(yàn)室,北京 100081)
目前用于海冰分類識(shí)別和監(jiān)測(cè)的研究,無論是基于光學(xué)海冰圖像還是合成孔徑雷達(dá)(SAR)海冰圖像,多是通過傳統(tǒng)的監(jiān)督和非監(jiān)督算法,應(yīng)用最多的如灰度共生矩陣(GLCM)和支持向量機(jī)(SVM)。Wang 等[1]根據(jù)GLCM 和小波紋理特征將特征空間域和頻率域融合對(duì)海冰圖像進(jìn)行分類研究;Ressel 和Singha[2]首先進(jìn)行特征提取,再輸入到神經(jīng)網(wǎng)絡(luò)分類器中,并通過互信息分析了相關(guān)性和冗余度,進(jìn)行海冰分類;Liu 等[3]基于SVM 算法,將后向散射系數(shù)、GLCM 和海冰密集度三者結(jié)合對(duì)海冰圖像進(jìn)行分類;Zakhvatkina 等[4]使用紋理特征結(jié)合SVM 區(qū)分海冰和開闊水域;Tan 等[5]通過隨機(jī)森林特征選擇方法確定優(yōu)選特征進(jìn)行海冰圖像解譯研究;張明等[6]采用灰度共生矩陣提取特征值,優(yōu)選特征組合,結(jié)合支持向量機(jī)開展海冰類型的分類研究;任莎莎和郎文輝[7]通過高斯濾波后提取海冰圖像灰度值,提出K-GMM 算法進(jìn)行海冰分類;鄭敏薇等[8]利用灰度共生矩陣計(jì)算并獲取圖像紋理,結(jié)合SVM 算法達(dá)到冰水分離的目的;逯躍鋒等[9]運(yùn)用灰度共生矩陣提取紋理特征中能量、對(duì)比度、相關(guān)性和同質(zhì)性的特征值,結(jié)合最小距離分類算法進(jìn)行海冰分類;朱立先等[10]通過灰度共生矩陣獲得影像的紋理特征,利用LibSVM 分類方法對(duì)一年冰和多年冰進(jìn)行訓(xùn)練和分類。以上的研究工作雖然都在原有的工作基礎(chǔ)上做了改進(jìn)并達(dá)到了一定的分類效果,但都需要先對(duì)遙感海冰圖像進(jìn)行大量且復(fù)雜的特征提取工作。面對(duì)大數(shù)據(jù)時(shí)代的今天,處理海量冗雜的海冰數(shù)據(jù),并快速準(zhǔn)確的提供決策支持,以上的基于傳統(tǒng)算法的海冰識(shí)別檢測(cè)方法有些捉襟見肘。
深度學(xué)習(xí)思想的本質(zhì)就是通過在多層神經(jīng)網(wǎng)絡(luò)上運(yùn)用各種算法來訓(xùn)練學(xué)習(xí)圖像特征,其框架下包含多種機(jī)器學(xué)習(xí)算法,其中卷積神經(jīng)網(wǎng)絡(luò)(CNN)是目前該框架研究最深入、應(yīng)用最廣泛的算法。CNN 作為一個(gè)深度學(xué)習(xí)架構(gòu)被提出的最初訴求,是降低對(duì)圖像數(shù)據(jù)預(yù)處理的要求,避免復(fù)雜的特征工程。它可以直接使用圖像的原始像素作為輸入,而不必先使用算法提取特征。它的特征提取和分類訓(xùn)練同時(shí)進(jìn)行,使得訓(xùn)練時(shí)就自動(dòng)提取了最有效的特征,這就減輕了使用傳統(tǒng)算法(如SVM)時(shí)必須要做的大量重復(fù)而煩瑣的數(shù)據(jù)預(yù)處理工作。
目前,CNN 在圖像識(shí)別、語音交互、自然語言處理等領(lǐng)域取得的突破和進(jìn)展有目共睹。CNN 應(yīng)用到衛(wèi)星遙感海冰分類中的研究雖然較少,但也取得一定進(jìn)展。如Wang 等[11]首次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于海冰密集度評(píng)測(cè)中,其精度與海冰分析員手繪圖相比,絕對(duì)平均誤差不超過10%;Chen 等[12]使用全卷積神經(jīng)網(wǎng)絡(luò)(A-ConvNets)對(duì)海冰圖像進(jìn)行分類,其平均準(zhǔn)確率高達(dá)99%,而所采用的全卷積神經(jīng)網(wǎng)絡(luò)只包含卷積層,圖像經(jīng)多次卷積之后尺寸越來越小,分辨率越來越低,需要通過反卷積的方式來恢復(fù)原圖,過程較為復(fù)雜且部分細(xì)節(jié)仍舊無法恢復(fù);Wang 等[13]進(jìn)一步的研究發(fā)現(xiàn),CNN 模型具有識(shí)別地物特征之間細(xì)微差別的能力,能夠更準(zhǔn)確地識(shí)別出新冰,然而該網(wǎng)絡(luò)的輸入要求數(shù)據(jù)經(jīng)標(biāo)準(zhǔn)化處理,其處理結(jié)果直接影響后期模型的表現(xiàn);黃冬梅等[14]將CNN 模型應(yīng)用于海冰密集度評(píng)估和海冰分類實(shí)驗(yàn)中,其模型的總體分類準(zhǔn)確率達(dá)到93%以上,Kappa 系數(shù)為0.8 以上,實(shí)驗(yàn)需要研究區(qū)域?qū)?yīng)的海冰解譯圖作為參考標(biāo)準(zhǔn),另外,需要先制作標(biāo)簽,再將樣本和標(biāo)簽構(gòu)建為one-hot 格式作為模型的輸入。
本文以構(gòu)建更加簡潔有效的網(wǎng)絡(luò)、簡化數(shù)據(jù)集標(biāo)簽制作過程的原則,探索更具有適用性并可用于業(yè)務(wù)化研究的CNN 模型。以渤海海冰遙感監(jiān)測(cè)為例,采用HJ-1A/B 衛(wèi)星數(shù)據(jù)源,開展基于CNN 的渤海海冰遙感分類研究。渤海海冰災(zāi)害嚴(yán)重影響了海上運(yùn)輸,破壞了區(qū)域內(nèi)基礎(chǔ)設(shè)施,阻礙了油氣等資源的開發(fā)與利用,加強(qiáng)海冰災(zāi)害監(jiān)測(cè)非常必要。
卷積神經(jīng)網(wǎng)絡(luò)[15]是一種前饋神經(jīng)網(wǎng)絡(luò),是由多個(gè)陣X(S x×Sy×Sz),經(jīng)K個(gè)大小為Cx×Cy×Sz的卷積核Ck,其中k=1, ···,K。每一個(gè)卷積核都會(huì)以步長P為間隔遍歷矩陣,最后會(huì)得到K幅特征圖,公式如下[13]:模塊組成的可訓(xùn)練結(jié)構(gòu)體,網(wǎng)絡(luò)結(jié)構(gòu)整體呈現(xiàn)出倒三角的形態(tài),緩解了反向傳播算法中容易出現(xiàn)的“梯度消失”現(xiàn)象。其每一個(gè)模塊由3 個(gè)連續(xù)操作單元組成:卷積核、非線性轉(zhuǎn)換層和池化層。一個(gè)CNN 模型通常包含多個(gè)用于提取圖像特征的學(xué)習(xí)模塊和若干全連接層。在卷積過程中,首先輸入一個(gè)樣本矩
式中,hk表示經(jīng)第k個(gè)卷積核卷積后得到的輸出結(jié)果;Mx,My分別為卷積操作之后輸出的特征圖的維度。
圖1 為本研究搭建的CNN 網(wǎng)絡(luò)主要結(jié)構(gòu),包含4 個(gè)卷積層(COV1?COV4),4 個(gè)池化層(POOL1?POOL4),3 個(gè)全連接層(FC1?FC3)。參數(shù)設(shè)置如圖1 所示,所用的輸入圖像為 100×100×3 (其中 100×100表示圖像橫向和縱向尺寸,3 表示圖像通道數(shù)),前兩個(gè)卷積層的過濾器(filter)尺寸為 5×5,后兩個(gè)卷積層的過濾器尺寸為 3×3,所有卷積層的滑動(dòng)橫向和豎向步長都為1,邊緣填充(padding)都設(shè)置為“SAME”。池化層采用最大值池化,池化層的過濾器尺寸全為 2×2,滑動(dòng)橫向和豎向步長為2,邊緣填充設(shè)置為“VALID”。卷積、池化后的圖像尺寸如圖1 所示,由下式得出:
式中,N表示輸出圖像尺寸;W表示輸入圖像尺寸;F表示過濾器的尺寸;S表示步長;P表示邊緣填充的參數(shù)選擇,當(dāng)邊緣填充設(shè)置為“VALID”,輸出圖像尺寸用公式(4)計(jì)算,當(dāng)邊緣填充設(shè)置為“SAME”,輸出圖像尺寸用公式(5)計(jì)算。
另外,在卷積層和池化層之間都加入了激勵(lì)層,通過激活函數(shù)對(duì)卷積層輸出的每一個(gè)特征單元進(jìn)行非線性處理,實(shí)現(xiàn)CNN 非線性目標(biāo)可分類;全連接層放在網(wǎng)絡(luò)的最后,與傳統(tǒng)的全連接神經(jīng)網(wǎng)絡(luò)很相似,接收神經(jīng)元要與輸入層的每一個(gè)神經(jīng)元連接,由此利用模型所提取到的所有特征去訓(xùn)練分類模型,其中第一層全連接層以卷積操作后的特征層(hk)作為輸入,將特征映射表示為一個(gè)向量,并通過權(quán)矩陣W和偏置b變換到輸出空間,計(jì)算公式為
式中,f為激活函數(shù);h為網(wǎng)絡(luò)學(xué)習(xí)后的輸出結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練和學(xué)習(xí)的本質(zhì)就是利用輸入數(shù)據(jù)的特征量調(diào)整、更新網(wǎng)絡(luò)參數(shù)。代價(jià)函數(shù)和激活函數(shù)的選擇是網(wǎng)絡(luò)學(xué)習(xí)、參數(shù)更新、模型優(yōu)化的重要環(huán)節(jié)。
卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練和學(xué)習(xí)的本質(zhì)就是利用輸入數(shù)據(jù)的特征量調(diào)整、更新網(wǎng)絡(luò)參數(shù)。代價(jià)函數(shù)和激活函數(shù)的選擇是網(wǎng)絡(luò)學(xué)習(xí)、參數(shù)更新、模型優(yōu)化的重要環(huán)節(jié)。
神經(jīng)網(wǎng)絡(luò)為優(yōu)化模型,通常采用代價(jià)函數(shù),尋求神經(jīng)網(wǎng)絡(luò)代價(jià)函數(shù)全局最小值是一個(gè)重要而基本的問題。傳統(tǒng)的二次代價(jià)函數(shù)[16]工作原理如下式[17]所示:
式中,C(W,b)表示網(wǎng)絡(luò)的代價(jià)函數(shù),也稱損失函數(shù);W、b分別表示神經(jīng)網(wǎng)絡(luò)的權(quán)值和偏置,網(wǎng)絡(luò)訓(xùn)練就是通過就是不斷更新權(quán)值和偏置參數(shù)來最終達(dá)到學(xué)習(xí)的目的;y(x)表示樣本x的真值;y′(x)表示樣本x的網(wǎng)絡(luò)預(yù)測(cè)結(jié)果;n表示樣本數(shù)量,神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化就是不斷降低預(yù)測(cè)結(jié)果和真值的誤差,使得誤差最小化。結(jié)合公式(6)可看出,網(wǎng)絡(luò)的預(yù)測(cè)值不僅和W、b有關(guān),還與激活函數(shù)f(z)有關(guān)。在網(wǎng)絡(luò)訓(xùn)練中,我們以常見的梯度下降法[18–19]來調(diào)整權(quán)值和偏置。假設(shè)有1 個(gè)樣本,則W、b的推導(dǎo)公式為
可見W和b的梯度與激活函數(shù)的梯度f′(z)呈正比關(guān)系,當(dāng)使用梯度下降法對(duì)權(quán)值參數(shù)進(jìn)行調(diào)整時(shí),隨著在網(wǎng)絡(luò)中逐層傳播,殘差值會(huì)變得越來越小,f′(z)的變化不僅會(huì)影響網(wǎng)絡(luò)收斂速度,還可能引發(fā)“梯度消失”現(xiàn)象,致使底層網(wǎng)絡(luò)難以進(jìn)行有效訓(xùn)練。
為了消除激活函數(shù)梯度對(duì)網(wǎng)絡(luò)權(quán)值和偏置值更新的影響,引入改進(jìn)的交叉熵代價(jià)函數(shù)替換二次代價(jià)函數(shù)。交叉熵最早出自信息論中的信息熵,然后被用到很多地方,包括通信、糾錯(cuò)碼、博弈論、機(jī)器學(xué)習(xí)等。交叉熵代價(jià)函數(shù)為
式中,C(W,b) 表示網(wǎng)絡(luò)的代價(jià)函數(shù);W、b分別表示神經(jīng)網(wǎng)絡(luò)的權(quán)值和偏置;y表示樣本x的真值;h為公式(6)中樣本x的網(wǎng)絡(luò)輸出結(jié)果;n表示樣本數(shù)量。對(duì)公式(10)求偏導(dǎo)得到權(quán)值W和偏置b的計(jì)算公式為
可見,交叉熵代價(jià)函數(shù)中,W、b的梯度與激活函數(shù)的梯度f′(z)沒 有關(guān)系,只與f(z)?y的差值,即網(wǎng)絡(luò)輸出值和真值的誤差成正比,誤差越大,梯度越大,參數(shù)W和b的調(diào)整就越快,網(wǎng)絡(luò)的收斂速度也就越快,有效避免了f′(z)參與參數(shù)更新、影響更新效率的問題。
神經(jīng)網(wǎng)絡(luò)訓(xùn)練的最終目的就是獲取代價(jià)函數(shù)最小時(shí)的權(quán)值和偏置參數(shù),而求取代價(jià)函數(shù)最小化過程中,激活函數(shù)的選擇也起著至關(guān)重要的作用。卷積神經(jīng)網(wǎng)絡(luò)中,假設(shè)不采用激活函數(shù),那么每一層的輸出與上層的輸入都是線性函數(shù)關(guān)系,不管搭建多少層神經(jīng)網(wǎng)絡(luò),輸出都是輸入的線性組合,這樣就局限了卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用范圍。因此在CNN 每個(gè)卷積層和池化層之間通常加入激勵(lì)層,即通過非線性激活函數(shù)對(duì)卷積層輸出的特征進(jìn)行非線性映射處理,使得神經(jīng)網(wǎng)絡(luò)可以任意逼近任何非線性函數(shù),非線性因素的引入,拓展了CNN 模型應(yīng)用到更多非線性分類任務(wù)中的空間。目前常用的激活函數(shù)為Sigmoid 函數(shù),也就是我們常稱的“S”型函數(shù),其導(dǎo)函數(shù)為Deriv. Sigmoid,如圖2 所示。
圖2 Sigmoid 原函數(shù)和導(dǎo)函數(shù)Deriv. Sigmoid[20]Fig. 2 Sigmoid function and Deriv. Sigmoid[20]
由2.2 節(jié)和2.3 節(jié)可知,代價(jià)函數(shù)的收斂和網(wǎng)絡(luò)參數(shù)的調(diào)整與激活函數(shù)及其導(dǎo)數(shù)有關(guān),由圖2 可以看出,Sigmoid 函數(shù)取值區(qū)間為(0,1),收斂速度慢,且容易出現(xiàn)軟飽和,即當(dāng)輸入較大的正數(shù)和負(fù)數(shù)的時(shí)候,梯度都為0,致使神經(jīng)元參數(shù)無法更新;導(dǎo)函數(shù)取值從0 開始很快又趨近于0,所以網(wǎng)絡(luò)在訓(xùn)練過程中容易引發(fā)“梯度消失”問題,影響網(wǎng)絡(luò)的正常訓(xùn)練。
為提高網(wǎng)絡(luò)訓(xùn)練效率和準(zhǔn)確率,文中引入改進(jìn)的激活函數(shù)ReLU 函數(shù),如圖3 所示,當(dāng)輸入為負(fù)數(shù)的時(shí)候,函數(shù)強(qiáng)行置0,為網(wǎng)絡(luò)加入稀疏因素,有效降低了參數(shù)的空間相關(guān)性和依存性;當(dāng)輸入為正數(shù)時(shí),函數(shù)不飽和,且梯度為1,避免了“梯度消失”現(xiàn)象的發(fā)生,同時(shí)網(wǎng)絡(luò)收斂速度快,計(jì)算簡單。
圖3 ReLU 激活函數(shù)[18]Fig. 3 ReLU activation function[18]
實(shí)驗(yàn)選取HJ-1A 和HJ-1B 衛(wèi)星搭載的CCD 相機(jī)獲取的渤海海域2018年1月下旬至2月上旬共8 幅影像為數(shù)據(jù)源。該傳感器共載荷4 個(gè)波段,具體參數(shù)如表1 所示。
表1 CCD 載荷參數(shù)Table 1 CCD parameters
本文選擇B03、B02、B013 個(gè)波段,經(jīng)預(yù)處理后,通過公式(13)將像元DN 值轉(zhuǎn)換為具有物理意義的輻射亮度值,然后組合成真彩色RGB 圖像。
式中,Lλ表示像元輻射亮度值,它包括了物體反射的輻射能量、臨近地物的貢獻(xiàn)值,以及云層的影響;Offset和 Gain分別表示偏移和增益參數(shù)。
通過目視解譯確定冰、水區(qū)域,借助MATLAB 和IDL 二次開發(fā)工具,裁剪、制作冰水樣本集并加上標(biāo)簽,數(shù)據(jù)集共1812 個(gè)樣本,分別包含812 個(gè)海冰,1000 個(gè)海水的影像樣本,以8∶2 的比例分為訓(xùn)練集和驗(yàn)證集用于網(wǎng)絡(luò)的訓(xùn)練和驗(yàn)證。模型測(cè)試部分包括覆蓋渤海區(qū)域的大規(guī)模識(shí)別和隨機(jī)截取一小塊區(qū)域的小范圍識(shí)別。大規(guī)模識(shí)別部分分別在HJ-1B 衛(wèi)星2018年1月29 日?qǐng)D像上選取了尺寸為7824×5205 的 樣 本(圖4),在HJ-1A 衛(wèi) 星2018年2月3 日的圖像上選取了尺寸為8020×5328 的樣本(圖5),并以10×10、20×20、40×40 和80×80 等不同的尺寸制作測(cè)試集進(jìn)行測(cè)試;小范圍測(cè)試則是在圖4 中隨機(jī)截取一塊400×400 的冰水區(qū)域作為數(shù)據(jù)源,也分別以10×10、8×8、5×5 和2×2 等4 種不同尺寸的窗口制作測(cè)試集test_10、test_8、test_5 和test_2,用于模型和參數(shù)測(cè)試。
本實(shí)驗(yàn)所用的神經(jīng)網(wǎng)絡(luò)搭建在TensorFlow 框架上,以Anaconda35.1 的Jupyter Notebook 為運(yùn)行環(huán)境。首先以CNN 模型應(yīng)用的經(jīng)典案例—手寫數(shù)字識(shí)別作為引入分析不同函數(shù)組合對(duì)識(shí)別結(jié)果的影響。試驗(yàn)分為二次代價(jià)函數(shù)與Sigmoid 激活函數(shù)、二次代價(jià)函數(shù)與ReLU 激活函數(shù)、交叉熵代價(jià)函數(shù)與Sigmoid 激活函數(shù)、交叉熵代價(jià)函數(shù)與ReLU 激活函數(shù)共4 個(gè)組合,每個(gè)組合分別進(jìn)行8000、10000、20000次迭代,其實(shí)驗(yàn)結(jié)果如表2 所示。
圖4 HJ-1B 衛(wèi)星圖像樣本Fig. 4 HJ-1B satellite image sample
圖5 HJ-1A 衛(wèi)星圖像樣本Fig. 5 HJ-1A satellite image sample
對(duì)比表2 至表5 可看出,相對(duì)于二次代價(jià)函數(shù),相同迭代次數(shù)和激活函數(shù)組合時(shí)交叉熵代價(jià)函數(shù)的訓(xùn)練精度和驗(yàn)證精度都更高,更準(zhǔn)確;相同迭代次數(shù)和代價(jià)函數(shù)組合時(shí)ReLU 激活函數(shù)比Sigmoid 激活函數(shù)的分類精度更高,網(wǎng)絡(luò)收斂速度更快;整體上看,對(duì)于CNN 模型在手寫數(shù)字識(shí)別案例中,交叉熵代價(jià)函數(shù)與ReLU 激活函數(shù)組合訓(xùn)練的模型性能最好,所取得的分類精度最高,網(wǎng)絡(luò)收斂最快。
表2 交叉熵代價(jià)函數(shù)與ReLU 激活函數(shù)組合Table 2 Combination of cross-entropy cost function andReLU activation function
表3 二次代價(jià)函數(shù)與ReLU 激活函數(shù)組合Table 3 Combination of quadratic cost function and ReLUactivation function
表4 交叉熵代價(jià)函數(shù)與Sigmoid 激活函數(shù)組合Table 4 Combination of cross-entropy cost function andSigmoid activation function
表5 二次代價(jià)函數(shù)與Sigmoid 激活函數(shù)組合Table 5 Combination of quadratic cost function andSigmoid activation function
由3.2 節(jié)手寫數(shù)字識(shí)別案例中的結(jié)果,可看出交叉熵代價(jià)函數(shù)優(yōu)于二次代價(jià)函數(shù),ReLU 激活函數(shù)優(yōu)于Sigmoid 激活函數(shù)。下面在衛(wèi)星遙感海冰影像的分類識(shí)別中,進(jìn)一步驗(yàn)證CNN 模型的最佳函數(shù)組合。首先把制作好的帶標(biāo)簽海冰數(shù)據(jù)集以8∶2 的比例隨機(jī)分為訓(xùn)練集和驗(yàn)證集,每個(gè)訓(xùn)練批次設(shè)置為64 個(gè)樣本,迭代訓(xùn)練,每次迭代都會(huì)更新調(diào)整網(wǎng)絡(luò)參數(shù),迭代50 次后,網(wǎng)絡(luò)權(quán)值和偏置參數(shù)基本穩(wěn)定,故設(shè)置網(wǎng)絡(luò)迭代次數(shù)為50 次。同樣,將試驗(yàn)分為二次代價(jià)函數(shù)與Sigmoid 激活函數(shù)、二次代價(jià)函數(shù)與ReLU 激活函數(shù)、交叉熵代價(jià)函數(shù)與Sigmoid 激活函數(shù)、交叉熵代價(jià)函數(shù)與ReLU 激活函數(shù)共4 個(gè)組合。實(shí)驗(yàn)中發(fā)現(xiàn),由于二次代價(jià)函數(shù)的權(quán)值和偏置與激活函數(shù)的梯度成正比,網(wǎng)絡(luò)訓(xùn)練時(shí),隨著網(wǎng)絡(luò)加深,殘差值越來越小,導(dǎo)致網(wǎng)絡(luò)無法得到有效訓(xùn)練,無法有效進(jìn)行冰、水分離。故而,下文主要展示交叉熵代價(jià)函數(shù)與兩種激活函數(shù)的組合結(jié)果。
由表6 可看出,在未對(duì)其他網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化的情況下,交叉熵代價(jià)函數(shù)與ReLU 激活函數(shù)組合,一次性輸入樣本1812 個(gè),網(wǎng)絡(luò)迭代50 次,訓(xùn)練精度就達(dá)到了99.6%,驗(yàn)證精度達(dá)到98.4%;而對(duì)比交叉熵代價(jià)函數(shù)與Sigmoid 激活函數(shù)組合的模型,其驗(yàn)證精度就高出17.6%??梢?,交叉熵代價(jià)函數(shù)與ReLU 激活函數(shù)組合在渤海海冰圖像分類任務(wù)中精度更高、效果更好、具有更好的適應(yīng)性。
表6 不同代價(jià)函數(shù)和激活函數(shù)組合的海冰圖像分類結(jié)果Table 6 Sea ice image classification results with different cost function and activation function combinations
圖6 和圖7 為通過TensorFlow 框架下的可視化工具TensorBoard 直觀地展示的交叉熵代價(jià)函數(shù)和ReLU 激活函數(shù)組合進(jìn)行渤海海冰圖像分類實(shí)驗(yàn)過程中網(wǎng)絡(luò)訓(xùn)練精度和誤差損失變化情況。由圖可以看出,隨著網(wǎng)絡(luò)訓(xùn)練次數(shù)增加,網(wǎng)絡(luò)訓(xùn)練誤差趨近于0,分類精度趨近于1,說明交叉熵代價(jià)函數(shù)和ReLU激活函數(shù)組合訓(xùn)練的CNN 網(wǎng)絡(luò)收斂速度快,分類效果好。將該訓(xùn)練好的網(wǎng)絡(luò)模型和參數(shù)保存,分別利用test_10、test_8、test_5 和test_2 樣本集進(jìn)行測(cè)試,調(diào)用模型和參數(shù)得到的識(shí)別結(jié)果中,鑒于 8×8窗口制作的樣本,其分類結(jié)果與 10×10窗口制作的樣本分類結(jié)果較為相似,區(qū)分度不高,故本文只展示了10×10、5×5、2×23 種尺寸窗口的分類結(jié)果,如圖8 所示。
圖6 模型訓(xùn)練誤差曲線Fig. 6 Loss curve ofmodel training
圖7 模型訓(xùn)練精度曲線Fig. 7 Accuracy curve ofmodel training
圖8b至圖8d可看出在一定范圍內(nèi)隨著樣本窗口減小,模型識(shí)別結(jié)果更加準(zhǔn)確,且在細(xì)節(jié)上表現(xiàn)更加精準(zhǔn),所以2×2窗口制作的樣本分類測(cè)試結(jié)果最佳;對(duì)比圖8a 和圖8b,可以看出紅色框出區(qū)域肉眼較難察別的部分海冰,被該CNN 模型清晰準(zhǔn)確的區(qū)分出來,黃色框出區(qū)域表示在冰水混合的狀況下,模型較好的區(qū)分海冰和海水,并將冰間水分離出來??梢奀NN 模型具有識(shí)別地物特征之間細(xì)微差別的能力,在衛(wèi)星遙感圖像冰水解譯中也適用,且表現(xiàn)較好。
3.3節(jié)通過對(duì)較小區(qū)域冰水識(shí)別結(jié)果的展示和分析,證明了CNN 網(wǎng)絡(luò)模型在衛(wèi)星遙感海冰圖像分類中具有較好的適用性和可操作性。為了能夠?qū)NN 模型更廣泛、切實(shí)地應(yīng)用到衛(wèi)星遙感海冰影像分類任務(wù)中,本文嘗試將整個(gè)渤海海域作為輸入數(shù)據(jù)集,希望實(shí)現(xiàn)大范圍海域的海冰識(shí)別,能夠?yàn)楹S虮O(jiān)測(cè)、航道監(jiān)測(cè)和航線設(shè)計(jì)提供一些幫助。
對(duì)圖4 數(shù)據(jù)源以 10×10窗口制作樣本406640 個(gè),20×20窗 口制作樣本101660 個(gè),40×40窗口制作樣本25350 個(gè),80×80窗口制作樣本6305 個(gè)。分析發(fā)現(xiàn)窗口 10×10和 20×20所得結(jié)果沒有明顯差異,而數(shù)據(jù)量相差巨大,工作量巨大,故舍棄。本文主要展示其他3 個(gè)窗口尺寸的結(jié)果(圖9)。為了進(jìn)一步驗(yàn)證模型的有效性和適用性,將圖5 作為數(shù)據(jù)源做同樣的操作,其中以 20×20窗 口尺寸獲得106666 個(gè)樣本,40×40窗口獲得26600 個(gè)樣本,80×80窗口獲得6600 個(gè)樣本,模型識(shí)別的結(jié)果如圖10。由圖可見,隨著窗口尺寸的增大,圖像分辨率越來越低,識(shí)別結(jié)果越來越粗糙,但整體上3 種窗口的識(shí)別分離效果都較好,與目視結(jié)果基本一致。并且在圖9a 和圖10a 中黃色框所示的小范圍區(qū)域,模型可較為準(zhǔn)確地區(qū)分冰間水和水間冰,再次驗(yàn)證了CNN 模型在識(shí)別地物特征細(xì)微差別的能力。
在實(shí)際的應(yīng)用中,可根據(jù)不同的任務(wù)需求和研究區(qū)域規(guī)模,調(diào)整樣本采集的窗口尺寸。如研究海冰分布特征,需要研究日尺度海冰面積和覆蓋度變化,則需要較高準(zhǔn)確率的海冰識(shí)別結(jié)果,再如進(jìn)行關(guān)于航道規(guī)劃的研究,需要把握冰情和航線安全狀況,希望得到分辨率較高的信息,這些情景下都可根據(jù)需要選擇20×20及以下的窗口;如果研究長時(shí)間序列海冰演變和海冰外緣線變化,選擇 40×40大小的窗口就可以很好的擬合海冰分界線,提供較為準(zhǔn)確的信息;然而,當(dāng)只需要把握整體海域的結(jié)冰狀況時(shí),可考慮選擇80×80左右的窗口,工作量小,操作簡單,可快速提供大范圍冰情信息。
圖8 模型測(cè)試樣本400×400 數(shù)據(jù)源(a)和2×2(b)、5×5(c)、10×10(d)窗口大小模型識(shí)別結(jié)果Fig. 8 Test sample 400×400 (a), and 2×2 (b)、5×5 (c)、10×10 (d)model recognition resultsa 中亮色為海冰,暗色為海水;b?d 中紫色代表海冰,黃色代表海水The bright represents sea ice, and the dark represents sea water in a;the purple represents sea ice, and the yellow represents sea water in b-d
本文將CNN 模型應(yīng)用于海冰圖像進(jìn)行冰、水分類的初步探索,驗(yàn)證了該網(wǎng)絡(luò)模型在處理衛(wèi)星遙感海冰圖像的可行性,可作為之后將深度學(xué)習(xí)網(wǎng)絡(luò)模型應(yīng)用于海冰研究、海域監(jiān)測(cè)、航道監(jiān)測(cè)等的理論參考。
本文首先通過CNN 模型進(jìn)行手寫數(shù)字識(shí)別實(shí)驗(yàn)討論了代價(jià)函數(shù)與激活函數(shù)組合對(duì)分類結(jié)果的影響。基于遷移學(xué)習(xí)的思想,甄選交叉熵代價(jià)函數(shù)作為目標(biāo)函數(shù)通過分別與Sigmoid 激活函數(shù)和ReLU 激活函數(shù)組合對(duì)渤海海冰圖像進(jìn)行分類識(shí)別,對(duì)比得出交叉熵代價(jià)函數(shù)和ReLU 激活函數(shù)組合分類效果更好,精度更高,對(duì)遙感海冰圖像分類具有更高的適應(yīng)性。從測(cè)試樣本集的識(shí)別結(jié)果發(fā)現(xiàn),當(dāng)分類模型確定時(shí),樣本采集窗口的尺寸也是影響模型識(shí)別結(jié)果的重要因素,在 400×400小范圍識(shí)別實(shí)驗(yàn)中最佳窗口尺寸為2×2,冰水分離效果較好;在整個(gè)渤海海域的識(shí)別實(shí)驗(yàn)中,展示了3 種不同窗口尺寸的識(shí)別結(jié)果,整體上都較好,與目視解譯基本一致。最后又對(duì)不同尺寸在實(shí)際操作中的應(yīng)用進(jìn)行了討論,可根據(jù)任務(wù)需要,研究區(qū)域尺度、遙感圖像分辨率等,相應(yīng)調(diào)整樣本采集的窗口尺寸,以達(dá)到預(yù)期目的。
CNN 網(wǎng)絡(luò)模型特征學(xué)習(xí)能力較強(qiáng),學(xué)習(xí)速度快,且具有較好的可移植性,其無需提前進(jìn)行特征提取,直接進(jìn)行圖像輸入的特性,避免了大量且復(fù)雜的特征提取工作,為之后大規(guī)模進(jìn)行多種冰型分類和不同冰型混合的復(fù)雜分類任務(wù),以及海冰要素反演等研究工作提供一個(gè)新思路。
圖9 HJ-1B 衛(wèi)星圖像20×20(a)、40×40(b)和80×80(c)窗口大小模型識(shí)別結(jié)果Fig. 9 20×20 (a)、40×40 (b)、80×80(c)model recognition results of HJ-1B satellite image紅色曲線表示冰、水分界線The red curve represents the ice-water boundary
圖10 HJ-1A 衛(wèi)星圖像20×20(a)、40×40(b)和80×80(c)窗口大小模型識(shí)別結(jié)果Fig. 10 20×20 (a)、40×40 (b)、80×80(c)model recognition results of HJ-1A satellite image紅色曲線表示冰、水分界線The red curve represents the ice-water boundary