張川,易敏,2,童勤龍,葉發(fā)旺,徐清俊,李泊凇
1 核工業(yè)北京地質(zhì)研究院 遙感信息與圖像分析技術(shù)國家級重點實驗室,北京 100029
2 北京智信遙感地理信息技術(shù)有限公司,北京 100032
高光譜遙感是利用窄且連續(xù)的光譜通道對地物進行連續(xù)遙感成像的技術(shù),其本質(zhì)上改變了傳統(tǒng)的遙感監(jiān)測方式,能夠直接檢測在寬波段遙感影像中無法檢測的物質(zhì)組分。礦物識別是迄今為止高光譜遙感最為成功的應(yīng)用方向之一,特別是對于指示找礦的蝕變礦物,如含鐵礦物、白云母族礦物、綠泥石族礦物和碳酸鹽礦物等[1-6]。在區(qū)域地質(zhì)調(diào)查中,巖性識別亦是一項基礎(chǔ)而又十分重要的工作,對于研究一個地區(qū)的成礦潛力和礦產(chǎn)遠景規(guī)劃具有重要意義。然而,當前高光譜遙感的巖性識別遠不及礦物識別應(yīng)用廣泛,主要有以下方面的原因:1)巖石是多種礦物的自然混合物,然而,巖礦光譜混合機理目前仍不明確;2)巖石的光譜主要體現(xiàn)的是主導(dǎo)礦物的光譜特征或光譜組合特征,故傳統(tǒng)巖石類型分類主要依據(jù)不同端元礦物及其含量差異的三角圖解進行,然而長石、石英等許多造巖礦物在高光譜遙感常用的0.4~2.5μm 波長范圍內(nèi)缺少明顯的診斷性光譜特征;3)盡管熱紅外高光譜能夠識別造巖礦物,但數(shù)據(jù)噪音大且數(shù)據(jù)源較少。上述原因?qū)е赂吖庾V遙感在巖性識別中的應(yīng)用受限。
近年來,機器學(xué)習(xí)越來越多地引入到遙感地質(zhì)勘查中[7-9]。這類方法是數(shù)據(jù)驅(qū)動的,能夠自動學(xué)習(xí)遙感數(shù)據(jù)與所需特征之間的關(guān)系。在機器學(xué)習(xí)領(lǐng)域,深度學(xué)習(xí)是目前最受關(guān)注的技術(shù),它是一種通過深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNNs)進行特征學(xué)習(xí)的方法,一些學(xué)者將深度學(xué)習(xí)引入到高光譜遙感圖像分類中,獲得了超過90 %甚至95 %以上的高分類精度,展示了深度學(xué)習(xí)在高光譜圖像特征挖掘方面的巨大潛力[10-11]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNNs)是深度學(xué)習(xí)的代表算法之一,它是一類包含卷積計算和深層結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),由交替的卷積層和池化層組成,在網(wǎng)絡(luò)的末端通常使用幾個全連接層作為分類器,十分適合處理遙感圖像[12]。尤其是針對傳統(tǒng)方法對高光譜遙感影像“圖譜合一”特征挖掘的不足,近年來發(fā)展了圖(圖像)-譜(光譜)聯(lián)合的CNN 方法,已在多個公開的高光譜影像數(shù)據(jù)集上獲得了較好的地物分類識別效果[13-15]。然而這些公開的高光譜影像數(shù)據(jù)集中的地物類型大多為均勻穩(wěn)定的農(nóng)田、林地、水體以及人工地物,它們與地質(zhì)環(huán)境存在差異,是否適用于巖性識別還需要進一步評估。
因此,本文將引入多種深度CNN 架構(gòu),將其應(yīng)用于高光譜遙感影像的巖性識別,探討其應(yīng)用效果,為高光譜遙感的巖性識別應(yīng)用提供參考。試驗區(qū)為巴丹吉林盆地東部,塔木素鈾礦床的北部地區(qū),近年在這一地區(qū)獲取了大面積的航空高光譜遙感影像數(shù)據(jù),是良好的數(shù)據(jù)源。
試驗區(qū)位于巴丹吉林盆地東部盆山結(jié)合帶,屬于巴丹吉林盆地與巴音戈壁盆地相接地帶,巴音戈壁盆地西部的宗乃山—沙拉扎山構(gòu)造巖漿帶中段。大地構(gòu)造上屬于塔里木板塊、哈薩克斯坦板塊、西伯利亞板塊和華北板塊四大板塊在古生代發(fā)生陸-陸碰撞的結(jié)合部位,具有復(fù)雜多變的地質(zhì)構(gòu)造背景[16]。試驗區(qū)主體位于塔木素特大型砂巖鈾礦的北部,屬于塔木素鈾礦床的蝕源區(qū)宗乃山隆起(圖1a)。受區(qū)域性EW 向走滑斷裂活動影響,形成一系列NE、NW 向次級斷裂。區(qū)內(nèi)巖漿多期次侵入,大面積出露晚古生代侵入巖,包括華力西期和印支期的花崗巖、華力西期的花崗閃長巖和石英閃長巖等(圖1b)。試驗區(qū)北部和東南部除大面積第四系蓋層外,還發(fā)育下白堊統(tǒng)和中下侏羅統(tǒng),前者主要為河流相雜色碎屑巖與沼澤相暗色泥質(zhì)巖,后者下部為礫巖、砂礫巖、粉砂巖夾煤線,上部為火山角礫巖、流紋巖、英安質(zhì)晶屑巖晶粗凝灰?guī)r和粉砂質(zhì)凝灰?guī)r。區(qū)內(nèi)少量石炭系地層發(fā)育,主要分布在試驗區(qū)的北部。受巖漿和熱液活動的影響,區(qū)內(nèi)發(fā)育不同程度的蝕變,主要有絹云母化、高嶺土化和硅化等。
圖1 試驗區(qū)位置和巖性分布圖Fig. 1 Location and lithology distribution map of test area
本研究數(shù)據(jù)源為加拿大ITRES 公司生產(chǎn)的航空高光譜成像儀SASI(Shortwave-infrared Airborne Spectrographic Imager),該儀器為短波紅外光譜區(qū)域的推掃式成像高光譜傳感器。短波紅外是地質(zhì)遙感常用的譜段區(qū)域,光譜范圍涵蓋了多種熱液蝕變礦物的吸收光譜。SASI 對其垂直軌道方向的600 個成像像元同步獲取在950~2 450 nm 波長范圍內(nèi)具有連續(xù)光譜覆蓋的100 個光譜波段。飛行相對高度約為2 000 m,獲取影像的空間分辨率達到2.5 m,獲取的SASI 數(shù)據(jù)的技術(shù)指標如表1 所示。
對于飛行范圍較大的航空高光譜影像采集來說,受飛行時間、外界條件等變化因素影響,獲取不同航帶的輻射信號具有一定的差異,造成航帶間輻射亮度不均一,二向反射分布函數(shù)(Bidirectional Reflectance Distribution Function, BRDF) 校正能消除遙感影像中由于太陽高度角、觀測角與真實角度偏差引起的色差不一致,但由于機載遙感圖像相對星載遙感圖像的分辨率高、視場角大,對光照、環(huán)境等因素更為敏感,造成目前機載環(huán)境的遙感圖像BRDF 校正效果不佳,如圖2 所示。雖然還可以通過一些其他預(yù)處理減弱這些影響,但亦可能影響到地物原始的輻射特征。因此,為避免預(yù)處理過程中引入其他噪聲,對試驗區(qū)的航空高光譜影像僅進行了系統(tǒng)級輻射定標處理、大氣校正和反射光譜重建和BRDF 校正等。大氣校正統(tǒng)一采用6S 輻射傳輸模型,通過計算和反演飛行時的大氣參數(shù),基于大氣輻射傳輸方程進行大氣校正。通過對比校正后的影像像元光譜和野外實測蝕變巖光譜驗證大氣校正的效果。如圖3 所示,為試驗區(qū)絹云母化蝕變巖所在位置的光譜曲線對比圖,絹云母的波譜形態(tài)和Al-OH 診斷性光譜特征基本一致,特征吸收峰波長位置偏移僅1 nm,表明光譜重建效果較好。
圖3 絹云母化蝕變巖光譜曲線圖Fig. 3 Spectral curve of sericitization altered rock
本研究試驗流程包括航空高光譜數(shù)據(jù)預(yù)處理、樣本制作、模型構(gòu)建和模型應(yīng)用等,如圖4 所示。其中,航空高光譜數(shù)據(jù)預(yù)處理在第1.2節(jié)中已經(jīng)敘述。經(jīng)過預(yù)處理后,SASI 高光譜圖像的DN 值被轉(zhuǎn)換為反射率值。最后,對各波段影像質(zhì)量進行檢查,剔除1 400、1 900 和2 400 nm 附近受水汽吸收影響的異常值。剔除的波段包括1 332~1 482 nm 的11 個波段、1 797~2 052 nm 的18 個波段和2 382~2 442 nm的5 個波段,剩余66 個波段。樣本制作主要基于試驗區(qū)地質(zhì)圖結(jié)合野外調(diào)查進行,并按照深度學(xué)習(xí)模型訓(xùn)練的要求進行比例劃分為訓(xùn)練集、驗證集和測試集。模型部分針對高光譜影像“圖譜合一”的特點,重點設(shè)計了1 種基于光譜特征和2 種基于圖-譜聯(lián)合特征的CNN 模型進行對比研究,分別是一維卷積神經(jīng)網(wǎng)絡(luò)(One-dimensional Convolutional Neural Network,
圖4 試驗區(qū)航空高光譜數(shù)據(jù)試驗流程圖Fig. 4 Test flow chart of aerial hyperspectral data in test area
1D CNN)、一維+二維卷積神經(jīng)網(wǎng)絡(luò)(Onedimensional and Two-dimensional Convolutional Neural Network, 1D+2D CNN)和三維卷積神經(jīng)網(wǎng)絡(luò)(Three-dimensional Convolutional Neural Network, 3D CNN)。最后,對結(jié)果進行評價分析。
深度學(xué)習(xí)任務(wù)需要合適的樣本數(shù)據(jù)來挖掘數(shù)據(jù)中的特征信息,并抽象出高級信息映射到輸出。前人經(jīng)驗表明:深度學(xué)習(xí)技術(shù)作為一個黑箱運行,通過大量的輸入和給定的結(jié)果提供穩(wěn)定的處理,訓(xùn)練樣本數(shù)量越多,黑匣子的工作性能越穩(wěn)定[19]。從理論上講,真實數(shù)據(jù)是最可靠的。然而,深度學(xué)習(xí)對樣本數(shù)量的需求較大,并且地面數(shù)據(jù)與航空高光譜數(shù)據(jù)存在顯著的尺度差異。因此,本文利用影像數(shù)據(jù)來構(gòu)建巖性樣本數(shù)據(jù)集。
根據(jù)試驗區(qū)地質(zhì)圖資料及野外調(diào)查,在影像上初步圈定8 類,分別是:印支期花崗巖、華力西晚期花崗巖、華力西晚期花崗閃長巖、華力西中期石英閃長巖、石炭系碎屑巖、中下侏羅統(tǒng)火山凝灰?guī)r、第四系沉積物和絹云母化蝕變巖。為評價模型對不同時期的同類巖性的區(qū)分能力,花崗巖樣本分為印支期和華力西晚期的2 類花崗巖。對初步圈定的樣本區(qū)域,均進行了野外調(diào)查驗證,以保障樣本的可靠性。另外野外調(diào)查發(fā)現(xiàn),下白堊統(tǒng)河流相碎屑巖與第四系沉積物特征基本一致,從影像上看亦如此,故將其歸入第四系類。地質(zhì)圖中沒有的蝕變巖類,通過影像分析結(jié)合野外調(diào)查發(fā)現(xiàn),圖2影像中偏黃綠色的為蝕變巖(以絹云母化為主),基于此對蝕變巖進行初步圈定。采用影像光譜可視化工具,對每類巖性的像元光譜進行查驗,剔除同類樣本中與其他光譜差異較大的點,同步計算各類樣本的平均光譜,如圖5 所示,以構(gòu)建光譜變化相對平穩(wěn)的樣本數(shù)據(jù)。從各類巖性平均光譜反映的特征來看,除絹云母化蝕變巖具有與其他巖性差異較大的光譜特征以外,其他巖性的光譜特征較為相似。因此從理論上來說,為了更好地區(qū)分這些巖性,不能僅從光譜特征挖掘的角度來構(gòu)建模型,而應(yīng)該從圖像-光譜結(jié)合的角度來構(gòu)建模型。為提高模型對每個類別的公平性和性能,從每類樣本隨機抽樣2 萬個點作為數(shù)據(jù)集樣本,再按照7:2:1 的比例劃分為訓(xùn)練集、驗證集和測試集,分別用于模型訓(xùn)練、模型調(diào)參和模型測試。
圖5 每類巖性樣本的平均光譜曲線圖Fig. 5 The average spectral curve of each type of lithology sample
由于3 種CNN 模型的結(jié)構(gòu)不同,在數(shù)據(jù)的輸入方面存在差異,1D CNN 輸入為像素光譜,1D+2D CNN 輸入為像素光譜和圖像的空間信息,3D CNN 輸入為高光譜數(shù)據(jù)立方體。因此,在樣本數(shù)據(jù)集制作方面,1D CNN 在高光譜數(shù)據(jù)進行歸一化之后,選取光譜曲線作為輸入;1D+2D CNN 在1D CNN 的樣本數(shù)據(jù)集基礎(chǔ)上,增加了每個樣本點周圍的空間信息,以歸一化的高光譜數(shù)據(jù)進行主成分分析后的第一主成分表示,范圍依據(jù)經(jīng)驗設(shè)為像素周圍30×30[20];3D CNN 是以樣本點為中心,取30×30的立方體。
深度神經(jīng)網(wǎng)絡(luò)模型基于目前流行的PyTorch 深度學(xué)習(xí)框架進行設(shè)計、訓(xùn)練與構(gòu)建。本研究重點測試和對比基于光譜特征的1D CNN、基于圖-譜特征的1D+2D CNN 和基于圖-譜特征的3D CNN 的巖性識別效果。
1D CNN 通過多個交替的一維卷積層和池化層提取特征,最后使用全連接層進行分類。1D CNN 將像素的光譜曲線作為一維向量輸入,利用相應(yīng)的一維卷積結(jié)構(gòu)來提取高光譜影像的光譜信息特征,結(jié)構(gòu)如圖6 所示,卷積層采用的激活函數(shù)為ReLU,與其他激活函數(shù)如sigmoid、tanh 函數(shù)相比,ReLU 函數(shù)具有良好的稀疏性和較小的計算量,既避免了梯度消失,又加快了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的速度,是目前深度學(xué)習(xí)中主流的激活函數(shù)[21]。
圖6 基于光譜特征提取的1D CNN 結(jié)構(gòu)圖Fig.6 The 1D CNN structure based on spectral feature extraction
1D+2D CNN 通過增加一系列交替的2D 卷積層和池化層來提取圖像的空間特征,并與1D卷積層提取特征進行融合,最后,使用全連接層進行分類。用于提取圖-譜聯(lián)合特征的1D+2D CNN 的結(jié)構(gòu)如圖7 所示,在光譜分支上,采用了上述相同的一維卷積模型的結(jié)構(gòu)對光譜特征進行提取;空間信息分支上利用二維卷積層、激活函數(shù)以及池化層的堆疊提取圖像特征。卷積層采用的激活函數(shù)為ReLU,池化層為常用的最大池化。提取獲得圖像特征和光譜特征后,將圖像特征重構(gòu)成一維張量,再采用Concate 融合法將圖像特征與光譜特征進行連接,并使用全連接層對聯(lián)合圖-譜特征進行分類。
圖7 基于圖-譜特征提取的1D+2D CNN 結(jié)構(gòu)圖Fig. 7 The 1D and 2D CNN structure based on image and spectral feature extraction
3D CNN 在結(jié)構(gòu)的組成上,分為基本的三維卷積塊、光譜殘差塊、空間殘差塊和分類輸出層,結(jié)構(gòu)如圖8 所示。三維卷積塊由三維卷積層、激活函數(shù)和歸一化層組成,如圖9a 所示。光譜殘差塊和空間殘差塊在結(jié)構(gòu)上類似,由兩個三維卷積塊堆疊而成,輸入X 經(jīng)過兩個三維卷積塊后與輸入相加,再通過一個激活函數(shù),如圖9b 所示。分類輸出層包含一個池化層與全連接層。
圖8 基于圖-譜特征提取的3D CNN 結(jié)構(gòu)圖Fig. 8 The 3D CNN structure based on image and spectral feature extraction
圖9 三維卷積塊和殘差塊結(jié)構(gòu)示意圖Fig. 9 The structure of 3D convolution block and residual block
光譜殘差塊和空間殘差塊用同一個結(jié)構(gòu),主要區(qū)別在于核大小。光譜殘差塊中的三維卷積層通過(1,1,7)的核進行光譜維度的信息提取,保持空間大小不變??臻g殘差塊中的三維卷積層通過(3,3,1)的核進行空間維度的信息提取,保持光譜維度不變。整體結(jié)構(gòu)上由淺入深,逐步增強光譜與空間的特征表示。兩部分特征學(xué)習(xí)模塊通過殘差連接構(gòu)建深層網(wǎng)絡(luò),提高了模型的表示能力。
上述神經(jīng)網(wǎng)絡(luò)均使用當前流行的深度學(xué)習(xí)框架PyTorch 進行搭建和訓(xùn)練,損失函數(shù)均使用CNNs 中最常用的交叉熵損失函數(shù)進行計算[22]。模型訓(xùn)練使用SGD 優(yōu)化器,batch size 設(shè)置為256。為了提高模型訓(xùn)練的穩(wěn)定性和效率,在初始訓(xùn)練階段采用了學(xué)習(xí)率warmup 策略[23]。具體而言,在訓(xùn)練的初始幾個周期(epoch),學(xué)習(xí)率從一個較小的值逐漸增加到預(yù)定的最大值。這一策略的引入旨在減少模型訓(xùn)練初期由于學(xué)習(xí)率過高而導(dǎo)致的不穩(wěn)定性。學(xué)習(xí)率的初始值設(shè)定為Lrstart,在預(yù)定的Nwarmup周期內(nèi),學(xué)習(xí)率線性增加至Lrmax。因此,第t個周期的學(xué)習(xí)率可由公式(1)得出:
在完成warmup 階段后,為了實現(xiàn)更加精細的模型優(yōu)化,還采用了學(xué)習(xí)率的線性遞減策略[23]。具體來說,從第Nwarmup+1 個周期開始,學(xué)習(xí)率從Lrmax開始逐漸減小,直至訓(xùn)練結(jié)束。這種遞減策略有助于在訓(xùn)練的后期訓(xùn)練階段更細致地調(diào)整模型參數(shù),從而避免過擬合,并提高模型的泛化能力。根據(jù)公式(2)得出從第t個周期的學(xué)習(xí)率Lrt:
式(2)中:Ntotal—總訓(xùn)練周期;Lrend—結(jié)束時學(xué)習(xí)率。在本研究中,Ntotal—200;Nwarmup—10;Lrstart—0.000 01;Lrmax—0.000 1;Lrend—0.000 000 1。
模型訓(xùn)練獲得收斂之后,使用測試集評估模型的泛化性能,完成整個深度卷積神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過程。最后,采用多個評價指標對模型的測試精度進行評估。本文采用的指標包括總體精度、生產(chǎn)者精度、平均精度和Kappa系數(shù),它們都是遙感分類模型的重要評價指標[24-25]。表2展示了不同的CNN模型在試驗區(qū)巖性樣本集上的測試精度評價指標的計算結(jié)果。三個CNN模型的總體精度和平均精度均在80 %以上,其中,3D CNN 模型的總體精度和平均精度最高,均大于90 %,1D+2D CNN的精度優(yōu)于1D CNN,Kappa 系數(shù)亦表現(xiàn)為3D CNN>1D+2D CNN> 1D CNN,表明聯(lián)合圖-譜特征的提取方法優(yōu)于僅考慮光譜特征的提取方法。
表2 卷積神經(jīng)網(wǎng)絡(luò)模型測試精度表Table 2 Test accuracy of the CNN models
利用混淆矩陣方法計算各個樣本類別的生產(chǎn)者精度,各CNN 模型的混淆矩陣如圖10 所示?;煜仃囍械拿恳涣斜硎疽粋€預(yù)測類別,每一列之和表示該類別預(yù)測的數(shù)據(jù)點總數(shù)。每一行代表真實的數(shù)據(jù)類別,每一行的總和代表該類別中數(shù)據(jù)實例的數(shù)量?;诨煜仃?,可以計算出每個類別的正確和錯誤分類比例。表3 是根據(jù)混淆矩陣計算的各CNN 模型在測試集上各個類別的生產(chǎn)者精度。
表3 卷積神經(jīng)網(wǎng)絡(luò)模型生產(chǎn)者精度表Table 3 Producer’s accuracy of the CNN models
圖10 模型測試混淆矩陣Fig. 10 The confusion matrix of the models for the test set
從模型在測試集上的表現(xiàn)來看,聯(lián)合圖-譜特征的1D+2D CNN 和3D CNN 在各類別的精度上均優(yōu)于僅考慮光譜特征的1D CNN。3D CNN在中下侏羅統(tǒng)火山凝灰?guī)r、華力西晚期花崗閃長巖、華力西中期石英閃長巖、石炭系碎屑巖和華力西晚期花崗巖的精度上優(yōu)于1D+2D CNN;1D+2D CNN 在印支期花崗巖、絹云母化蝕變巖、第四系沉積物的精度上優(yōu)于3D CNN。可見引入高光譜圖像的空間特征對于提高巖性識別模型精度是有意義的,但具體以哪種方式進行圖-譜聯(lián)合還有待進一步的評價分析。
作為構(gòu)建CNN 模型的最終目的,為了更好地評估其在高光譜遙感巖性識別中的實際效果,將訓(xùn)練好的各個CNN 模型用于試驗區(qū)SASI航空高光譜影像進行巖性識別,并將識別結(jié)果通過模型進行輸出。最后,通過ArcGIS 軟件平臺對輸出結(jié)果進行分類和可視化制圖,實現(xiàn)巖性識別與分類。圖11 展示了分別使用1D CNN、1D+2D CNN 和3D CNN 模型對試驗區(qū)SASI 航空高光譜影像進行巖性分類識別的結(jié)果圖及與參考地質(zhì)圖的對比,各圖幅的地理范圍與圖2 完全一致。
圖11 試驗區(qū)巖性識別結(jié)果與參考地質(zhì)圖的對比圖Fig. 11 Comparison of identified lithology results to the reference geological map in the test area
根據(jù)各深度CNN 模型在試驗區(qū)SASI 航空高光譜影像上的巖性識別結(jié)果與參考地質(zhì)圖的對比情況,總體上看,1D CNN 模型和1D+2D CNN 模型的巖性識別結(jié)果(圖11a、b)有較為明顯的、與航空高光譜飛行方向一致的EW 向條帶效應(yīng),使得試驗區(qū)的巖性識別成圖效果受到顯著的影響,而3D CNN 模型的巖性識別結(jié)果(圖11c)的條帶效應(yīng)明顯減弱了許多。由于航空高光譜影像采集受飛行時間、外界條件等變化因素影響,獲取不同航帶的輻射信號差異造成了航帶間輻射亮度的不均一屬于正?,F(xiàn)象,也是航空影像獲取中較為常見的,這導(dǎo)致航帶之間色差成為多航帶大區(qū)域高光譜巖性填圖的技術(shù)難點[26]。因此,鑒于試驗結(jié)果中的3D CNN 模型在克服條帶效應(yīng)方面的顯著效果,在航空影像的處理和信息識別方面具有更好的應(yīng)用前景。
在巖性的識別方面,相對而言,3D CNN 模型的巖性識別結(jié)果與參考地質(zhì)圖的匹配程度最佳,具有最好的視覺效果;而1D CNN 模型的識別結(jié)果與參考地質(zhì)圖的匹配程度最差。對不同巖性來說,首先,對絹云母化蝕變巖的識別,三種模型識別的范圍與圖2 中黃綠色巖石發(fā)育區(qū)域基本一致,這是因為絹云母化蝕變巖具有較為明顯的診斷性光譜特征(圖3),因此,無論是基于光譜的CNN 模型和基于圖-譜聯(lián)合的CNN 模型,均能夠較好地學(xué)習(xí)并提取絹云母化蝕變巖的特征。然而,對于參考地質(zhì)圖中的其他巖性,它們在1.0~2.5μm 波長范圍內(nèi)的診斷性特征不明確,且光譜較為相似(圖5),因此在不同模型結(jié)果中的差異體現(xiàn)得較為明顯。試驗區(qū)西南部是巖性最復(fù)雜的區(qū)域,涉及印支期花崗巖、華力西晚期花崗閃長巖、華力西中期石英閃長巖等多種巖性,如圖11 所示,1D CNN 模型和1D+2D CNN 模型將印支期花崗巖和華力西晚期花崗閃長巖大量混淆,華力西晚期花崗閃長巖和華力西中期石英閃長巖的混淆程度亦較大,相對而言,3D CNN 模型盡管有所混淆,但混淆程度較小,與參考地質(zhì)圖的巖性分布大體上一致。在試驗區(qū)北部,1D CNN 模型和1D+2D CNN 模型將部分第四系沉積物識別為石炭系碎屑巖,尤其是1D CNN 大量錯分,而3D CNN 對于該地段的第四系沉積物和石炭系碎屑巖的區(qū)分效果較好。在試驗區(qū)東南部,對于大面積第四系沉積物中的中下侏羅統(tǒng)火山凝灰?guī)r的識別,三種模型均有所反映,受條帶效應(yīng)的影響,1D CNN 模型和1D+2D CNN 模型將部分第四系沉積物識別為火山凝灰?guī)r,1D CNN模型錯分相對更為嚴重,對東南角的一片火山凝灰?guī)r,各模型均未識別。在試驗區(qū)東部,涉及華力西晚期花崗巖、華力西晚期花崗閃長巖的區(qū)分,從識別結(jié)果來看,只有3D CNN 模型獲得了較好的區(qū)分效果。
因此,3D CNN 模型無論是對試驗區(qū)航空高光譜影像條帶效應(yīng)的克服方面,還是對各類巖性的區(qū)分識別方面,均獲得了最佳的應(yīng)用效果,這與各模型的測試精度計算結(jié)果具有較好的一致性。相比之下,1D CNN 模型對各類巖性的混淆度還要甚于1D+2D CNN 模型,可見,在高光譜遙感常用的反射光譜段,僅依靠光譜特征進行巖性的區(qū)分誤差較大,圖-譜結(jié)合是高光譜遙感巖性識別的正確思路。
以巴音戈壁盆地西部的塔木素鈾礦床北部區(qū)域為試驗區(qū),以巖性識別為應(yīng)用目的,基于SASI 航空高光譜數(shù)據(jù)進行了多種深度CNN模型的試驗應(yīng)用及效果評價,主要結(jié)論如下:
1)通過對8 類巖石進行樣本構(gòu)建,分別基于光譜特征的1D CNN、基于圖-譜聯(lián)合特征的1D+2D CNN 和3D CNN 三種深度CNN 進行模型訓(xùn)練、構(gòu)建與測試,結(jié)果表明:3D CNN 模型具有最高的測試精度;
2)通過對三種深度CNN 模型進行巖性分類識別和評價,結(jié)果表明:與其他兩種模型相比,3D CNN 模型對各類巖石的區(qū)分和識別與真實參考具有最佳的匹配度,因此,引入高光譜圖像的空間特征進行圖-譜特征的聯(lián)合挖掘,對于高光譜遙感圖像識別能力具有明顯的提升效果;
3)3D CNN 模型能夠較好地克服多航帶拼接后的航空高光譜影像條帶效應(yīng),對大面積航空影像處理具有較好的應(yīng)用前景。
本研究主要針對巖石大類進行了分類識別,如何對巖性進一步細分還需結(jié)合光譜特征、紋理特征等進行更深入的特征分析和挖掘,這也是未來主要的研究方向。