王逸宸,柳林濤,許厚澤
(1.中國科學(xué)院 測量與地球物理研究所,湖北 武漢 430077; 2.中國科學(xué)院 大地測量與地球動力學(xué)國家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430077; 3.中國科學(xué)院大學(xué) 地球與行星科學(xué)學(xué)院,北京 100049)
作為機(jī)器學(xué)習(xí)的基本方法之一,神經(jīng)網(wǎng)絡(luò)自產(chǎn)生以來經(jīng)歷了從興起到相對沉寂再到繁榮的發(fā)展過程。近十年來,隨著計(jì)算機(jī)計(jì)算能力的迅猛提升,尤其是GPU加速計(jì)算及云計(jì)算等技術(shù)的迅速發(fā)展,以深度神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù)成為工業(yè)界及科學(xué)計(jì)算領(lǐng)域最有效的技術(shù)之一,在許多應(yīng)用中實(shí)現(xiàn)了超過傳統(tǒng)方法的效果,并成為人工智能技術(shù)的根基之一。
在地球物理反演及解釋領(lǐng)域,機(jī)器學(xué)習(xí)是與遺傳算法、貝葉斯反演等方法同為重要的非線性計(jì)算方法[1]。在重力方面,除使用非神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法如隨機(jī)森林方法解決地球物理問題之外[2-3],基于BP神經(jīng)網(wǎng)絡(luò)出現(xiàn)了不少反演算法[4-6],充分證明了機(jī)器學(xué)習(xí)對地球物理反演問題的有效性。徑向基函數(shù)網(wǎng)絡(luò)可在約束條件下解決反演問題,相較于BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度更快,泛化能力更高[7-8]。模塊神經(jīng)網(wǎng)絡(luò)(MNN,modular neural network)應(yīng)用于異常體的識別和模式分類,效果良好[9-11]。Osman等提出強(qiáng)制神經(jīng)網(wǎng)絡(luò)(FNN,forced neural network)解決二維剖面重力異常體識別問題[12]。數(shù)據(jù)處理方面,任強(qiáng)強(qiáng)等[13]用小波神經(jīng)網(wǎng)絡(luò)預(yù)測重力觀測盲區(qū),比克里金法更適應(yīng)復(fù)雜情況。
機(jī)器學(xué)習(xí)的本質(zhì)是表示學(xué)習(xí)[14],即將一個數(shù)學(xué)或物理模型表示為另一種形式,針對學(xué)習(xí)對象形成更高級的抽象或另一種角度的表示。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)仍存在各種不足[15],如泛化不足或過擬合的存在。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,近年來出現(xiàn)了各種高級結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)[16],如適用于處理時序模型的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,recurrent neural network)及適用于生成特定領(lǐng)域模型的生成對抗神經(jīng)網(wǎng)絡(luò)(GAN,generative adversarial network),在相關(guān)領(lǐng)域已取得非常成功的應(yīng)用。而卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolutional neural network)尤適于處理具空間特性的模型,如二維圖像[17]。卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)在圖像處理和識別領(lǐng)域已經(jīng)成為最重要的技術(shù)手段。
卷積神經(jīng)網(wǎng)絡(luò)模型的最初模型是LeNet[18],受神經(jīng)科學(xué)中對貓的視覺系統(tǒng)研究的啟發(fā),將“感受野”特性引入到神經(jīng)網(wǎng)絡(luò)中,構(gòu)造卷積層[19]。由于訓(xùn)練困難,該方法一直處于沉寂。直到近年來GPU計(jì)算技術(shù)的實(shí)用化,新出現(xiàn)的AlexNet將卷積網(wǎng)絡(luò)深度顯著[20]增加,在圖像識別比賽中取得優(yōu)異成績。隨后,深度更大的深度卷積神經(jīng)網(wǎng)絡(luò)模型不斷刷新準(zhǔn)確率記錄[21-22]。深度殘差網(wǎng)絡(luò)(DRN, deep residual network)可有效應(yīng)對訓(xùn)練中梯度爆炸或消失的現(xiàn)象[23]。目前,卷積神經(jīng)網(wǎng)絡(luò)具有訓(xùn)練速度快[24],準(zhǔn)確率高的特點(diǎn)。
筆者利用卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的圖像識別特性,將重力觀測等值線圖看做二維圖像,建立密度異常體的參數(shù)模型,利用深度學(xué)習(xí)識別異常體在三維空間的參數(shù)。在模型試驗(yàn)中訓(xùn)練和測試樣本,并將學(xué)習(xí)得到的卷積神經(jīng)網(wǎng)絡(luò)遷移到實(shí)測數(shù)據(jù)下驗(yàn)證方法的有效性。
卷積神經(jīng)網(wǎng)絡(luò)最初的設(shè)計(jì)理念是直接識別圖像中的具象對象,如人臉,動物和日常物體等。但它并不是僅能識別具象對象,比如可用卷積神經(jīng)網(wǎng)絡(luò)識別人臉的年齡和性別[25],或識別圖像中的高度抽象概念,比如攝影圖像中的景深等[26]。基于這些特性,卷積神經(jīng)網(wǎng)絡(luò)有可能從重力等值圖中識別重力異常體的深度和大小等參數(shù)。
圖1是一個用于圖像分類的典型卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。除了具備通用神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)(輸入層inputs, 輸出層outputs, 隱層hidden cells)之外,還具備由卷積神經(jīng)元或池化神經(jīng)元構(gòu)成的卷積層(convolution or pool)。在通用的神經(jīng)網(wǎng)絡(luò)中,隱層又稱為全連接層,隱層中每一個神經(jīng)元都與前一層的所有神經(jīng)元連接。一個隱層與其前一層之間的神經(jīng)元權(quán)值的關(guān)系可表達(dá)為
y=wx+b,
(1)
其中:y是隱層神經(jīng)元輸出,x是輸入,w、b分別為兩層神經(jīng)元之間的連接權(quán)組成的矩陣及每個神經(jīng)元的閾值,兩層之間的關(guān)系為數(shù)學(xué)意義上的線性關(guān)系。訓(xùn)練過程即通過反向傳播算法確定w、b的值,需要訓(xùn)練的參數(shù)與兩層神經(jīng)元數(shù)量的乘積成正比,參數(shù)數(shù)量巨大。而卷積神經(jīng)網(wǎng)絡(luò)的卷積層使用卷積核對圖像實(shí)施卷積運(yùn)算
Y=w?X,
(2)
其中:?表示二維卷積運(yùn)算,此處w是特定尺寸的卷積核,此時將輸入和輸出圖像看做矩陣X、Y。該卷積核在輸入圖像上滑動,與在卷積核范圍內(nèi)位置對應(yīng)的像素相乘并求和,得到位于卷積核中心位置的輸出圖像像素值。每一層卷積層一般引入多個卷積核,用以提取不同的局部圖像特征,故輸入一個圖像,將得到多個相同尺寸的圖像,稱為特征圖。在卷積層中,圖像的局部像素共享同一個卷積核,相當(dāng)于神經(jīng)元共享同一個權(quán)值。這樣不僅減少了權(quán)值參數(shù)數(shù)量,還能提取二維(乃至三維)的圖像特征,共享權(quán)值的卷積層是卷積神經(jīng)網(wǎng)絡(luò)的獨(dú)特優(yōu)勢。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 The structure of the CNN
在卷積層組內(nèi),除卷積層本身,還存在池化層,池化層的作用是將卷積得到的每個特征圖降采樣為尺寸更小的特征圖,減少參數(shù),同時提取到更高階的圖像特征。一般一個卷積層后緊接一個池化層。
卷積層位于隱層前面,最后一個卷積層(或池化層)的二維輸出被展平為一維向量,饋入到隱層中,此后的網(wǎng)絡(luò)結(jié)構(gòu)即為一個普通的前饋神經(jīng)網(wǎng)絡(luò)。
基于深度學(xué)習(xí)識別重力異常體,需要解決二個難點(diǎn)。第一個難點(diǎn)是如何獲得訓(xùn)練數(shù)據(jù),在理想狀態(tài)下,應(yīng)當(dāng)學(xué)習(xí)所有可能存在的重力異常體復(fù)雜形態(tài)及其重力響應(yīng),這在目前條件下不能實(shí)現(xiàn),因?yàn)殡y以獲得足夠數(shù)量已被精確建模的異常體樣本。即使獲得了大量異常體樣本,需要對這些不規(guī)則異常體進(jìn)行精確的正演,獲得重力響應(yīng)作為樣本標(biāo)簽,這需要借助高精度建模正演,將耗費(fèi)大量計(jì)算成本。第二個難點(diǎn)是如何參數(shù)化異常體幾何形態(tài),異常體形態(tài)復(fù)雜多變,目前沒有使用參數(shù)少同時精準(zhǔn)的幾何描述方法,在深度學(xué)習(xí)識別任務(wù)中,需用更具普遍性的參數(shù)來描述其幾何性質(zhì)。
基于這兩個難點(diǎn),筆者采用深度和線度參數(shù)化異常體,可以同時解決訓(xùn)練樣本獲得和復(fù)雜形態(tài)異常體參數(shù)化這兩個難點(diǎn)。不能用簡單幾何體準(zhǔn)確參數(shù)化實(shí)際異常體幾何形態(tài),但整體大小是簡單幾何體與復(fù)雜幾何體共有的性質(zhì)。簡單幾何體的深度和線度容易計(jì)算得到,可用簡單幾何體建立具有深度和線度的訓(xùn)練異常體樣本集。這樣就將訓(xùn)練集異常體與待識別的異常體的幾何性質(zhì)通過線度聯(lián)系起來。同時簡單幾何體可快速用解析正演公式計(jì)算重力,不需通過高精度建模正演,有效解決建立大量訓(xùn)練樣本集的問題。
同時,深度和線度具有重要應(yīng)用價值,深度即異常體幾何中心的深度,垂向分辨是重力勘探相比于地震等方法的弱勢所在,本文旨在借助深度學(xué)習(xí)技術(shù)提高垂向分辨。線度描述異常體整體大小,可以直接導(dǎo)出體積,與在地質(zhì)解釋中重要的地質(zhì)體規(guī)模有直接關(guān)系。另外,在體積信息的約束下,可進(jìn)一步用其他方法展開反演解釋工作,將有效降低解釋的不確定性。
基于上述討論,我們用六面體建立訓(xùn)練集異常體模型,該六面體在3個坐標(biāo)方向上各有延伸長度lx、ly、lz,且中心埋深為d。待識別的參數(shù)為d以及表征描述異常體整體大小的線度l。六面體線度計(jì)算方式為
(3)
特別指出,卷積神經(jīng)網(wǎng)絡(luò)識別圖像具有平移不變性,即同一對象出現(xiàn)在圖像內(nèi)不同位置,其識別結(jié)果是一致的。同時異常體的水平中心位置與重力等值線圖像中心峰值位置存在充分的相關(guān)性,可用更為簡單的傳統(tǒng)算法確定異常體水平中心位置,故異常體水平中心位置的識別不在本文研究范圍之內(nèi)。同時,識別場源深度和線度無需已知異常或場源的水平中心位置。
同樣形體的異常體,在密度不同時,其重力響應(yīng)幅度不同。為提高識別的有效性,筆者采取固定密度的策略。在訓(xùn)練中,參與訓(xùn)練的異常體樣本密度均固定為單位密度,即1 g/cm3。設(shè)學(xué)習(xí)到的神經(jīng)網(wǎng)絡(luò)模型中密度與重力響應(yīng)包含如下關(guān)系,
GL(1,V)=g,
(4)
其中:GL為學(xué)習(xí)到的神經(jīng)網(wǎng)絡(luò)模型中包含的異常體與重力響應(yīng)的關(guān)系泛函,1為單位密度,V代表特定形體的重力異常體。在應(yīng)用中,若能先驗(yàn)取得密度信息,假設(shè)待識別異常體密度為ρ,該異常體在用單位密度異常體學(xué)習(xí)到的網(wǎng)絡(luò)模型中應(yīng)有的重力響應(yīng)為g,待識別重力為g′,根據(jù)密度均勻異常體的重力響應(yīng)特性,應(yīng)有
(5)
只需將待識別重力整體除以先驗(yàn)密度送入模型識別即可。即使先驗(yàn)密度未知,也可以通過假定先驗(yàn)密度,得到不同的識別結(jié)果,以供進(jìn)一步挑選。
進(jìn)入訓(xùn)練階段。首先,在一定坐標(biāo)范圍內(nèi),隨機(jī)生成大量不同深度和尺寸的六面體訓(xùn)練樣本,將他們密度設(shè)置為單位密度,正演計(jì)算得到各自的重力等值線圖。這些樣本的重力二維數(shù)據(jù)即為網(wǎng)絡(luò)的輸入樣本。
接著,為得到訓(xùn)練樣本的標(biāo)簽,提取六面體樣本的中心埋深和線度,仿照卷積神經(jīng)網(wǎng)絡(luò)圖像識別的做法,將每個樣本的埋深和線度劃入一定范圍內(nèi)的數(shù)值區(qū)間,標(biāo)簽向量為數(shù)值區(qū)間的分段數(shù),埋深或線度所處的區(qū)間其值為1,其余為0,相當(dāng)于標(biāo)記了樣本參數(shù)處于某個數(shù)值區(qū)間的概率。這些概率向量即為樣本的標(biāo)簽。
最后,將輸入樣本和標(biāo)簽送入設(shè)計(jì)的網(wǎng)絡(luò)模型實(shí)施訓(xùn)練,最終將待識別模型的重力輸入學(xué)習(xí)好的網(wǎng)絡(luò),即可輸出識別到的參數(shù)。對于觀測數(shù)據(jù)存在多個異常的情況,需將各個異常分離出,各自送入卷積神經(jīng)網(wǎng)絡(luò)識別。對于相互無疊加或輕微疊加的異常,可直接將異常切出。對于相互疊加嚴(yán)重的異常,則需要通過相關(guān)方法先分離。
在訓(xùn)練過程中,用損失函數(shù)定義網(wǎng)絡(luò)輸出與樣本標(biāo)簽的差異,最小化損失函數(shù),從而優(yōu)化網(wǎng)絡(luò)模型。筆者采用卷積神經(jīng)網(wǎng)絡(luò)常用的信息交叉熵函數(shù)作為損失函數(shù),并用RMSProp優(yōu)化算法進(jìn)行訓(xùn)練。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)優(yōu)化不屬本文研究內(nèi)容,在此不贅述,可參考相關(guān)文獻(xiàn)[15, 16]。
重力二維測網(wǎng)中的每個測點(diǎn)相當(dāng)于重力等值線圖中的每個像素。綜合考慮到神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度,網(wǎng)絡(luò)結(jié)構(gòu)深度以及學(xué)習(xí)重力數(shù)據(jù)的精度,參考用于圖像識別的卷積神經(jīng)網(wǎng)絡(luò),本文設(shè)計(jì)如圖2結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)識別重力異常體。
重力異常體的中心埋深和線度,既可用同一個卷積神經(jīng)網(wǎng)絡(luò)同時識別,也可用兩個神經(jīng)網(wǎng)絡(luò)各自識別。為避免兩個參數(shù)的相互制約,提高準(zhǔn)確性,本文將二者分開訓(xùn)練和識別。兩個網(wǎng)絡(luò)的結(jié)構(gòu)和訓(xùn)練方法完全相同,下面統(tǒng)一介紹網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練方法。
設(shè)計(jì)高性能的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),要領(lǐng)在于恰當(dāng)?shù)纳疃群蛷V度。根據(jù)近年來研究者們在圖像識別領(lǐng)域的實(shí)踐經(jīng)驗(yàn),要提高泛化能力,網(wǎng)絡(luò)深度比寬度優(yōu)先。因此,筆者設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)也優(yōu)先疊加網(wǎng)絡(luò)層數(shù),而不設(shè)置過多卷積特征圖,以提高訓(xùn)練速度。
p=(p(y1),p(y2),…,p(y8)),
(6)
y=(y1,y2,…,y8),
(7)
yi=100.0·i,
(8)
(9)
(10)
圖2 用于識別重力異常體的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 The structure of CNN used to identify the gravity anomaly bodies
其中:y為中心埋深或線度的區(qū)間向量,其每個分量對應(yīng)異常體參數(shù)中心埋深或線度值的劃分區(qū)間。p的分量為中心埋深或線度處于某區(qū)間的概率,概率之和為1。在物理空間內(nèi),考慮到重力勘探中常見的異常體情況,筆者設(shè)置生成訓(xùn)練集異常體的深度和線度都在(100 m,800 m)范圍內(nèi)。在實(shí)際工作中,需要綜合考慮訓(xùn)練計(jì)算成本和待訓(xùn)練及待識別的異常體參數(shù)情況設(shè)置輸出區(qū)間,根據(jù)式(6)~(10)可知區(qū)間單元長度是該網(wǎng)絡(luò)輸出的參數(shù)期望的最小值,故必須不大于待訓(xùn)練和待識別參數(shù)的最小值。理論上,對于任意訓(xùn)練集及測試集,可將輸出區(qū)間劃分無限密,但這樣大大增加網(wǎng)絡(luò)參數(shù)量,增加訓(xùn)練耗時,并可能降低收斂性。根據(jù)深度學(xué)習(xí)領(lǐng)域工作者目前取得的經(jīng)驗(yàn),在網(wǎng)絡(luò)達(dá)到一定規(guī)模后,繼續(xù)增加網(wǎng)絡(luò)寬度,識別精度不會進(jìn)一步提高。綜合考慮到輸出層的神經(jīng)元數(shù)量及參數(shù)范圍,我們將深度或線度區(qū)間(0,800 m)設(shè)置為8個100 m的區(qū)間,根據(jù)式(6)~(10),此時網(wǎng)絡(luò)輸出識別參數(shù)期望最小值和最大值為100、800 m,足以識別所有參數(shù)。
文中使用tensorflow深度學(xué)習(xí)計(jì)算框架實(shí)現(xiàn)上述卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。接著在物理空間范圍內(nèi)隨機(jī)生成了1 000個六面體異常體模型,正演其重力異常為輸入樣本集,并提取其中心埋深和線度,生成樣本標(biāo)簽向量集,進(jìn)行訓(xùn)練。
在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,數(shù)據(jù)規(guī)模往往很大。因此,不同于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)每個樣本送入網(wǎng)絡(luò)后訓(xùn)練一次,而是將樣本分批(batch)送入網(wǎng)絡(luò)。每批內(nèi)含有若干個樣本,訓(xùn)練時,這若干個二維樣本在網(wǎng)絡(luò)內(nèi)合成三維張量,同時輸出由一維變?yōu)槎S,計(jì)算每個樣本的損失函數(shù)值,并對同一批內(nèi)所有損失函數(shù)值取平均損失函數(shù),作為網(wǎng)絡(luò)優(yōu)化的標(biāo)準(zhǔn)。每當(dāng)所有樣本都遍歷過一次,稱為完成一輪(epoch)訓(xùn)練。需要連續(xù)進(jìn)行若干輪次訓(xùn)練以使網(wǎng)絡(luò)達(dá)到優(yōu)化。深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練一般用高性能顯卡實(shí)施,同一批內(nèi)每個輸入樣本在網(wǎng)絡(luò)中的輸出和過程數(shù)據(jù)在同一時刻存在顯存中,往往占用大量顯存。因此,最佳批大小設(shè)置應(yīng)剛好占滿顯存而不發(fā)生顯存溢出,設(shè)置太小將虛置顯存資源,設(shè)置太大訓(xùn)練將無法繼續(xù),需要根據(jù)采用的計(jì)算機(jī)和網(wǎng)絡(luò)規(guī)模測試而定。
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,學(xué)習(xí)率是網(wǎng)絡(luò)參數(shù)更新的步長,設(shè)置合適的學(xué)習(xí)率有利于提高訓(xùn)練收斂性。學(xué)習(xí)率是小于1的無量綱參數(shù),對于不同任務(wù)及數(shù)據(jù)集其取值水平不同。需通過數(shù)次測試觀察損失函數(shù)收斂曲線確定。若損失函數(shù)值下降緩慢,可增大學(xué)習(xí)率。若損失函數(shù)值持續(xù)跳躍甚至發(fā)散,說明學(xué)習(xí)率太大,需減小學(xué)習(xí)率直至損失函數(shù)值平滑下降。
同時,深層神經(jīng)網(wǎng)絡(luò)對問題表達(dá)能力強(qiáng),也存在負(fù)面效應(yīng),即過擬合現(xiàn)象。隨著訓(xùn)練進(jìn)行,網(wǎng)絡(luò)可能將數(shù)據(jù)中不需要的特性也學(xué)習(xí)到,在識別時造成誤判。處理過擬合現(xiàn)象有許多方法,筆者采取簡單有效的dropout方法,即在優(yōu)化的過程中隨機(jī)丟棄一些神經(jīng)元,不更新其網(wǎng)絡(luò)權(quán)值。
將1000個樣本批大小設(shè)置為10,兩個網(wǎng)絡(luò)各經(jīng)過約100輪訓(xùn)練,如圖3a、3b分別為識別深度和線度的卷積神經(jīng)網(wǎng)絡(luò)損失函數(shù)變化曲線,各耗時300 s,損失函數(shù)收斂,停止訓(xùn)練。
a—識別深度;b—識別線度a—for depth identification;b—for size identification圖3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練損失函數(shù)Fig.3 The loss of CNN during training
為評估卷積神經(jīng)網(wǎng)絡(luò)模型的識別準(zhǔn)確性,設(shè)計(jì)4個不同深度和形態(tài)的異常體,編號為a、b、c、d。如圖4,先建立4個長方體,其中心深度和長、寬、高分別為 (300 m,200 m,200 m,200 m)、(600 m,200 m,200 m,200 m)、(400 m,200 m,400 m,200 m)和(400 m,200 m,200 m,400 m),接著對長方體隨機(jī)擾動建模使之接近實(shí)際異常體,形成測試異常體。異常體a與b對比可測試識別不同深度異常體的能力,c與d對比可測試識別形狀相似而不同姿態(tài)的異常體的能力。對應(yīng)的線度l由式(3)計(jì)算分別為200、200、252、252 m。設(shè)置密度都為1 g/cm3。并對正演的重力數(shù)據(jù)添加標(biāo)準(zhǔn)差為異常均值5%的高斯噪聲,重力正演值如圖5a~d,與圖4a~d相對應(yīng)。
圖4 用于測試神經(jīng)網(wǎng)絡(luò)的異常體Fig.4 The gravity anomaly bodies used in CNN model
a—模型a;b—模型b;c—模型c; d—模型da—body a;b—body b;c—body c;d—body d圖5 測試異常體的重力Fig.5 The gravity contour map of testing bodies
表1 測試異常體識別結(jié)果Table 1 The identified parameters of testing bodies
為驗(yàn)證方法在實(shí)際重力數(shù)據(jù)中的識別效果,利用澳大利亞Kauring地區(qū)某重力試驗(yàn)場航空重力實(shí)測數(shù)據(jù)進(jìn)行測試。數(shù)據(jù)已經(jīng)過地形改正,選取測區(qū)內(nèi)主要重力異常,將數(shù)據(jù)重采樣為適合卷積神經(jīng)網(wǎng)絡(luò)輸入的格式進(jìn)行識別。圖6為該重力異常測量數(shù)據(jù)。該套數(shù)據(jù)空中測網(wǎng)高度為65.0 m,因此識別出的中心深度為重力異常體距測網(wǎng)的鉛垂距離,減去測網(wǎng)高度為異常體中心深度。根據(jù)前人研究資料[27-29],該異常體剩余密度約為2.4 g/cm3,在輸入神經(jīng)網(wǎng)絡(luò)前按照式(5)對重力數(shù)據(jù)進(jìn)行預(yù)處理。
用圖3中所訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)對該異常體進(jìn)行識別,表2為本文與前人用不同方法得到的對比結(jié)果。本文識別出該異常體中心埋深為421.6 m,線度為148.8 m。排除最早等效源方法[27]的粗略識別結(jié)果,與二例用重力密度反演方法得到的結(jié)果相符[28-29],異常體的中心埋深和線度都符合良好。可見,所訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)具有對實(shí)際數(shù)據(jù)的泛化能力,能有效識別實(shí)際重力異常體的埋深和大小。
圖6 Kauring試驗(yàn)場的重力異常Fig.6 The measured main gravity anomaly in Kauring testing ground
表2 Kauring測區(qū)異常體識別結(jié)果與前人對比Table 2 Comparison with known results of main gravity anomaly bodies in Kauring
本文將深度學(xué)習(xí)技術(shù)與重力異常體識別相結(jié)合,用圖像識別領(lǐng)域廣泛應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)識別重力異常二維數(shù)據(jù)的異常體。采用隨機(jī)建模和重力正演生成訓(xùn)練所需的樣本。卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練快速。相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)僅識別埋深,卷積神經(jīng)網(wǎng)絡(luò)同時可識別表征異常體大小的線度。在測試模型中識別異常體中心埋深和線度參數(shù),對于不同深度和姿態(tài)的異常體,準(zhǔn)確性良好,且可識別不同姿態(tài)的異常體。同時對重力觀測噪聲不敏感。當(dāng)異常體響應(yīng)為弱重力信號時,識別準(zhǔn)確度有所下降,仍在有效范圍內(nèi)。在實(shí)測重力異常識別中,識別結(jié)果與前人用密度反演得到的異常體參數(shù)相符。說明訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)具有良好的泛化能力,可識別實(shí)測重力異常體。同時應(yīng)注意到,卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練耗時較一般的高精度反演算法少,不需密集的重力測網(wǎng),而能達(dá)到同等的異常體揭示效果,這使之能夠成為重力異常解釋有力的新方法。
本文使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較傳統(tǒng)神經(jīng)網(wǎng)絡(luò)復(fù)雜,但在深度神經(jīng)網(wǎng)絡(luò)的角度上仍屬于簡單結(jié)構(gòu)。在重力異常體識別任務(wù)上,深層神經(jīng)網(wǎng)絡(luò)的性能仍有巨大潛力可挖掘,更深的網(wǎng)絡(luò),更復(fù)雜的結(jié)構(gòu),都將進(jìn)一步提高識別的準(zhǔn)確性。同時,卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練存在耗時,而一旦訓(xùn)練好,識別不存在耗時,可能成為未來實(shí)時觀測重力解釋的備選技術(shù)。最后,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)若用在重力梯度等信息更豐富的重力數(shù)據(jù)中,將進(jìn)一步釋放其解讀空間重力數(shù)據(jù)的能力,是值得研究的方向。