袁傳新,賈東寧?,周生輝
1) 中國海洋大學(xué)信息科學(xué)與工程學(xué)院,青島 266000 2) 青島海洋科學(xué)與技術(shù)試點國家實驗室高性能科學(xué)計算與系統(tǒng)仿真平臺,青島266000
富鈷結(jié)殼是繼大洋多金屬結(jié)核之后發(fā)現(xiàn)的又一深海固體礦產(chǎn)資源,堆積在海底巖石和巖屑表面,主要由氫氧化物和鐵錳氧化物組成.結(jié)殼除了鈷元素外,還富含稀土元素和其他的許多金屬,例如鐵、鎂、鎳、銅、鋅等,具有非常高的開采價值[1].富鈷結(jié)殼的形成和其他礦產(chǎn)資源一樣,是非常緩慢的自然生成過程,每100萬年只能產(chǎn)生1至6 mm的結(jié)殼.礦床主要分布于碳酸鹽補(bǔ)償深度(CCD)以上、最低含氧層以下水深 500~3500 m的平頂海山、海臺頂部和斜坡的表面[2-4].海洋里有諸多海山,僅僅在太平洋區(qū)域廣義海山有約50000多座,高度大于1000 m的海山就有約8000多座[5].富鈷結(jié)殼礦床有非常高的經(jīng)濟(jì)價值,估計潛在資源量達(dá)10億噸[6].富鈷結(jié)殼是海洋中典型的水成成因的礦產(chǎn)資源,由于形成于古海洋和古沉積環(huán)境,除了資源本身的經(jīng)濟(jì)價值,富鈷結(jié)殼還記錄了海洋和氣候的演化歷史,具有非常高的環(huán)境研究價值[7].正是由于具有巨大的經(jīng)濟(jì)價值和環(huán)境價值,鈷結(jié)殼資源一直是海洋調(diào)查的重點.我國富鈷結(jié)殼資源的調(diào)查開展的比較晚,90年代末才系統(tǒng)的開展起來,投入巨資開展了若干綜合航次調(diào)查,至今20多年的時間也僅僅調(diào)查了幾十座海山.1997~2002年的航次主要是選擇靶區(qū)的偵察性調(diào)查,使用多波束、淺剖、重磁、海底攝像和溫鹽探儀(CTD)等的環(huán)境勘測和使用抓斗、拖網(wǎng)等的地質(zhì)取樣調(diào)查.2002年以后的航次對部分調(diào)查過的海山進(jìn)行加密采樣,調(diào)查方法增加了可視抓斗、可視淺剖等[7].無論是初始偵察點的選擇還是之后對整個礦區(qū)的圈定,都需要對大范圍的諸多海域進(jìn)行大規(guī)模的海山結(jié)殼資源調(diào)查.科考船需要對未知的區(qū)域進(jìn)行隨機(jī)靶點調(diào)查,且對于確定的結(jié)殼礦區(qū)的邊界的界定還需要進(jìn)行大量的勘察工作,這些都將耗費大量的人力、物力和時間.
科考船對不同海域多年的普查工作積累了大量的寶貴資料和數(shù)據(jù),并且這些數(shù)據(jù)正在以指數(shù)級的形式增長.如何把這些數(shù)據(jù)合理的運(yùn)用起來,促進(jìn)海洋地質(zhì)的研究進(jìn)展,成為了科研工作者關(guān)注的熱點問題.作為大數(shù)據(jù)分析和處理的重要技術(shù)手段,機(jī)器學(xué)習(xí)方法在找礦領(lǐng)域也得到了廣泛應(yīng)用.研究發(fā)現(xiàn),地形是結(jié)殼富集的一個重要因素,富鈷結(jié)殼富集區(qū)具有坡度、平整度等明顯的地形特征.隨著遙感等技術(shù)的進(jìn)步,海拔高度的獲取更加精確,利用密集采點的海拔高度矩陣作為區(qū)域地形特征,具有較高的區(qū)分度.機(jī)器學(xué)習(xí)的分支深度學(xué)習(xí)善于處理多維數(shù)據(jù)錯綜復(fù)雜的關(guān)系,運(yùn)用大量的輸入和輸出得出映射關(guān)系[8].其中卷積神經(jīng)網(wǎng)絡(luò)從復(fù)雜數(shù)據(jù)中提取特征表現(xiàn)突出,在諸多領(lǐng)域被廣泛應(yīng)用,特別是圖像分類領(lǐng)域取得了非常好的效果[9].卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與數(shù)值矩陣能夠更好吻合,自動完成特征提取,其權(quán)重共享機(jī)制可以降低網(wǎng)絡(luò)復(fù)雜性,適合本文基于數(shù)值矩陣的地形特征區(qū)分類找礦任務(wù).
本文從結(jié)殼礦區(qū)的地形特征出發(fā),利用卷積神經(jīng)網(wǎng)絡(luò)對大量的數(shù)值矩陣訓(xùn)練學(xué)習(xí)得到預(yù)測模型,對礦區(qū)靶點進(jìn)行預(yù)測.另外,對本文方法的應(yīng)用及后序研究工作進(jìn)行了展望.
自1959年國內(nèi)就開始出現(xiàn)了找礦靶區(qū)的相關(guān)研究,隨著研究的深入,出現(xiàn)越來越多與“找礦靶區(qū)”相關(guān)的關(guān)鍵詞[10].找礦使用的方法一般有經(jīng)驗類比法、綜合信息法和數(shù)學(xué)模型法等,逐漸從經(jīng)驗找礦向理論和科學(xué)找礦過渡.如,劉泉清等提出利用經(jīng)驗法和化學(xué)普查相結(jié)合的方法[11],楊恒書等創(chuàng)用濃度級次值特征對比模型和相近率線性模型[12],中國科學(xué)院地質(zhì)與地球物理研究所總結(jié)提出“三場異常互相約束”預(yù)測新理論[13],張慶華等提出物探、化探與遙感相結(jié)合的方法[14].隨著科學(xué)技術(shù)的發(fā)展與研究的不斷深入,諸多新技術(shù)、新方法被應(yīng)用到找礦中來.智能找礦方法是在地質(zhì)類比法和模型法應(yīng)用的基礎(chǔ)上,結(jié)合計算機(jī)技術(shù),將已有的專家經(jīng)驗和一定的礦床模型輸入計算機(jī),建立起預(yù)測模型系統(tǒng),將研究區(qū)的有關(guān)資料輸入,在此基礎(chǔ)上進(jìn)行評判.如,王世稱主導(dǎo)的綜合信息礦產(chǎn)預(yù)測系統(tǒng)[15],趙鵬大的大比例尺礦床統(tǒng)計預(yù)測專家系統(tǒng)[16]等.深度學(xué)習(xí)和機(jī)器學(xué)習(xí)迅猛發(fā)展,硬件技術(shù)的進(jìn)步,簡潔的python語言、完善的深度學(xué)習(xí)框架Tensorflow以及基于Theano/Tensorflow更簡單易上手的高階框架Keras,推動了智能找礦發(fā)展.已有許多學(xué)者投入到機(jī)器學(xué)習(xí)與找礦以及成礦預(yù)測的研究中來,如徐述騰和周永章以吉林夾皮溝金礦和河北石湖金礦的黃鐵礦、黃銅礦等為例,設(shè)計了Unet卷積神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了鏡下礦石礦物識別分類[17];劉艷鵬等通過卷積神經(jīng)網(wǎng)絡(luò)算法挖掘Pb分布特征與礦體地下就位空間的耦合相關(guān)性進(jìn)行礦產(chǎn)資源預(yù)測[18],肖壯等提出基于深度學(xué)習(xí)的礦區(qū)韌性剪切帶找礦研究[19]等.然而,大部分研究是以陸地礦為基礎(chǔ)的,海洋底部礦區(qū)的找礦工作要復(fù)雜許多,迫切需要在找礦靶區(qū)的選取方面進(jìn)行改進(jìn),增加成功找到礦區(qū)的可能性,減少時間和人力、物力成本.
結(jié)殼的形成及其豐度變化受控于諸多因素,經(jīng)緯度、區(qū)域地質(zhì)構(gòu)造、水深、地形和水文等都會對結(jié)殼的生長產(chǎn)生重要影響[20].例如,海山經(jīng)緯度位置決定了海山洋流速度以及流向,進(jìn)而決定了結(jié)殼的附著程度、豐度以及類型;大量的研究成果以及統(tǒng)計數(shù)據(jù)表明,水深影響結(jié)殼的生長和富集,結(jié)殼大部分分布在水深1000~3000 m范圍內(nèi);結(jié)殼的產(chǎn)生來源于海水中的微生物和鈣質(zhì)粒子,水文環(huán)境也是一個重要因素.研究認(rèn)為,結(jié)殼分布與海山的地形特征具有一定的關(guān)系,控制作用效果也比較明顯[21].結(jié)殼產(chǎn)生于各大洋區(qū)的水下高地,海山和島嶼斜坡是主要富集區(qū),海山對結(jié)殼成礦具有重要意義.三大洋中,太平洋海山富鈷結(jié)殼礦點的分布比例占到了73.3%.在空間上,海山山頂區(qū)一般為微結(jié)核發(fā)育區(qū),在海山的局部高地會有結(jié)殼生長成礦[22].海山分為尖頂海山和平頂海山兩大類,尖頂海山山頂、邊緣、上部斜坡及中部斜坡區(qū)山脊部位最容易成礦,平頂海山邊緣和除陡崖外的上部斜坡區(qū)成礦率也較高[23].
圖1表征了本文數(shù)值矩陣反應(yīng)的地形特征,橫縱坐標(biāo)表示各海拔取值點相對于第一個點的水平方向距離d1和d2,豎坐標(biāo)軸表示各取點海拔高度h,均以米為單位.從形態(tài)學(xué)上講,海山的形態(tài)要素主要包括海山坡度、海山表面平整度[24],因此要考慮的因素主要有坡度和海山微地貌特征.地形坡度太小,海水中的物質(zhì)不容易沉積;在地形坡度較大的地方,結(jié)殼生長過程中容易塌落[25].坡度較大和坡度較小都不利于結(jié)殼的形成.根據(jù)礦物質(zhì)沉積理論,顆粒最容易在凸起的部分聚集,山坡上的裸露巖石成為結(jié)殼生長有利位置.對本文獲得的數(shù)值矩陣計算坡度值得表1,坡度大部分處在8°~12°范圍內(nèi),坡度較陡的地形較少.
圖1 局部海山地形Fig.1 Local seamount terrain
表1 地形坡度統(tǒng)計Table 1 Topographic slope statistics
分析認(rèn)為,富鈷結(jié)殼在一定范圍內(nèi)的坡度和平整度的海山區(qū)域容易生長富集,具備明顯的分類特征,可以作為找礦靶點的依據(jù).運(yùn)用容易獲得的海拔高度矩陣作為地形特征,并采集大量的正負(fù)樣本,使用在分類問題上表現(xiàn)優(yōu)異的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行二分類,進(jìn)而成為富鈷結(jié)殼礦區(qū)和結(jié)殼富集海山選定的參考依據(jù),具有現(xiàn)實意義.
2.2.1 數(shù)據(jù)標(biāo)準(zhǔn)化
數(shù)據(jù)標(biāo)準(zhǔn)化(歸一化)的目標(biāo)是突出主要特征的作用,弱化次要特征的影響.富鈷結(jié)殼在不同海拔高度位置均有站點,地形矩陣數(shù)值分布在-4000~-800 m之間,跟前文提及富鈷結(jié)殼主要分布在1000~3000 m范圍內(nèi)基本一致.不同的矩陣數(shù)值的平均高度差別很大,而需要考慮的主要因素是整個矩陣反應(yīng)的地形特征,高度數(shù)值的大小屬于次要因素,因此要處理高度之間的差別.
常用的兩種數(shù)據(jù)標(biāo)準(zhǔn)化的方法是min-max和Z-cores.min-max標(biāo)準(zhǔn)化對原始數(shù)據(jù)進(jìn)行變換,把結(jié)果值范圍映射到0~1之間,函數(shù)為(1),min和max分別為最小值和最大值.Z-cores標(biāo)準(zhǔn)化處理數(shù)據(jù)使之符合標(biāo)準(zhǔn)正態(tài)分布,函數(shù)為公式(2),μ和σ分別為樣本均值和方差.本文對min-max標(biāo)準(zhǔn)化方法做了改變,首先計算所有矩陣的max與min之差,取差值的最大值MAX,然后將公式(1)中分母部分替換為MAX,函數(shù)為公式(3),目的在于防止崎嶇地形與平緩地形混淆.
2.2.2 插值算法
雙線性插值算法根據(jù)插值點最接近的4個點的像素值進(jìn)行計算.設(shè)(i+u,j+v)為坐標(biāo)變換后浮點坐標(biāo),f(i,j)為坐標(biāo)(i,j)位置的像素值,f(i+u,j+v)即為坐標(biāo)變換后的像素值,其中i、j為整數(shù)部分,u、v為小數(shù)部分[25].則這個像素值可由公式(4)得出.該算法保證了插值曲線的平滑性,彌補(bǔ)了最近鄰算法的不足,是插值效果和運(yùn)算速度相對較優(yōu)的算法,也是使用最廣泛的.
本文的數(shù)值矩陣代表的是礦區(qū)地形,每一個數(shù)值都有空間位置關(guān)系,相當(dāng)于圖像中的像素點.因此,與特征提取和支持向量機(jī)(SVM)、隨機(jī)森林等傳統(tǒng)統(tǒng)計方法結(jié)合相比,使用更適合圖像處理的卷積神經(jīng)網(wǎng)絡(luò).卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)深層神經(jīng)網(wǎng)絡(luò)相比,可以明顯降低模型規(guī)模,并且識別性能最好,泛化能力最強(qiáng)[26].
針對數(shù)據(jù)集特性,搭建了適合本文區(qū)分類找礦研究的Conv-3模型.圖2給出了Conv-3模型的結(jié)構(gòu)圖,該卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)共包含7層:一個輸入層,三個卷積層C1、C2和C3,兩個全連接層F4和F5,一個輸出層.在該模型中,輸入層的輸入為50×50的數(shù)值矩陣,卷積層均使用16個5×5的卷積核,全連接層分別使用2048和128個神經(jīng)元,輸出層使用softmax函數(shù)進(jìn)行分類.
VGGNet16是一種深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過不斷深化網(wǎng)絡(luò)結(jié)構(gòu)提高性能[27],在此結(jié)構(gòu)中卷積層均使用3×3的卷積核,池化層使用的是Maxpooling.為了滿足實驗要求,本文使用插值算法對輸入的數(shù)值矩陣進(jìn)行擴(kuò)充,修改兩層全連接層神經(jīng)元個數(shù)為2048、512,又分別采用(1)更改池化層為Max-pooling和(2)更改卷積層卷積核為3×3進(jìn)行對比實驗.
本文使用已知的富鈷結(jié)殼站點的坐標(biāo)和未知區(qū)域坐標(biāo)數(shù)據(jù)提取了網(wǎng)格型數(shù)值矩陣,對數(shù)據(jù)進(jìn)行調(diào)整后,分別使用Conv-3、VGGNet 16和兩個修改后的VGGNet 16結(jié)構(gòu)進(jìn)行對比實驗.
正樣本原始數(shù)據(jù)來源于國際海底管理局(ISA)的富鈷結(jié)殼主量元素標(biāo)準(zhǔn)數(shù)據(jù)集,由國家海洋科學(xué)數(shù)據(jù)共享服務(wù)平臺提供.數(shù)據(jù)量共計1203站,3286個樣品,空間范圍覆蓋全球大部分海域(-180°~180°E,-64.18°~56.17°N).剔除一些坐標(biāo)分布較密集區(qū)域的坐標(biāo),實際使用1100個站點用來作為提取數(shù)值矩陣正樣本的基準(zhǔn)數(shù)據(jù).調(diào)用Google Earth軟件的API,在全球以100 km為步長提取共計12萬坐標(biāo)以及海拔高度信息,從中隨機(jī)均勻選取15200個海拔高度在-4000~-800 m之間的坐標(biāo)信息作為原始數(shù)據(jù)的負(fù)樣本的基準(zhǔn)坐標(biāo)數(shù)據(jù).在負(fù)樣本中有一定的存在噪聲的可能性(即可能為富鈷結(jié)殼礦區(qū)),因為可能性非常小,可以認(rèn)為有較高的可信度.
正負(fù)樣本基準(zhǔn)地理坐標(biāo)信息被存儲為26份文本,分布于26臺計算機(jī)上.在每一臺電腦上運(yùn)行Google Earth和在Visual Studio上基于C++的數(shù)據(jù)提取程序.程序自動讀取文本文件的每一個坐標(biāo)(A,B),以(A,B)為中心點,以C為步長的度數(shù)表示,在 0.8~1 km2范圍內(nèi)從經(jīng)度A-25×C到A+25×C、緯度B-25×C到B+25×C調(diào)用Google Earth軟件的API提取50×50的海拔高度數(shù)值矩陣.
本文最終獲得了共計16200個存儲海拔高度數(shù)值矩陣的文本,其中正樣本1100個,負(fù)樣本15200個.因為正樣本數(shù)據(jù)量過小,而地型特征具有旋轉(zhuǎn)、翻轉(zhuǎn)的不變性,利用這些特性將正樣本的數(shù)據(jù)擴(kuò)充為原來的8倍,得到8000個正樣本,最終使用正負(fù)樣本共計24000個地形數(shù)據(jù).
圖2 Conv-3 結(jié)構(gòu)圖Fig.2 Conv-3 schematic
對于正負(fù)樣本的數(shù)據(jù),使用文件名作為標(biāo)簽的標(biāo)注,在程序中使用OS模塊讀取文件名,將正負(fù)樣本分別標(biāo)注為1和0.使用Numpy數(shù)值計算庫以矩陣的形式讀取每一個文本,對矩陣的每一個數(shù)值x1,更新數(shù)值x1= (x1-min)/MAX,更新后的數(shù)據(jù)如圖3所示.
圖3 處理后的數(shù)據(jù)示例Fig.3 Example terrain of processed data
此種做法針對本文實驗數(shù)據(jù)存在兩點優(yōu)點,一是如前文所述,計算所有矩陣最大值與最小值差值,取最大差值MAX為分母,解決了使用原始方法平地和崎嶇地形分不開問題;二是取得每一個矩陣的最大值max1和最小值min1,使用MAX和(max1-min1)的最大值Max為分母,防止對于新數(shù)據(jù)處理后出現(xiàn)矩陣大于1的情況.如圖4所示,橙色表示使用min-max方法數(shù)據(jù)標(biāo)準(zhǔn)化的結(jié)果,任何矩陣都被拉伸至范圍0~1,會混淆平地和陡坡,影響各矩陣相對坡度特征;藍(lán)色表示使用統(tǒng)一參數(shù)MAX標(biāo)準(zhǔn)化的結(jié)果,保留了各矩陣原有的相對坡度特征不變.
另外,VGGnet 16要求數(shù)值矩陣的大小至少為48×48,且必須為3通道.為了網(wǎng)絡(luò)模型的要求,并保證原始矩陣反應(yīng)的地形特征不變,在進(jìn)行對比實驗時本文使用雙線性插值將數(shù)值矩陣擴(kuò)大為112×112,使用opencv的cvtColor函數(shù)將單通道數(shù)值矩陣轉(zhuǎn)換為3通道.
圖4 同一陡坡矩陣的兩種標(biāo)準(zhǔn)化結(jié)果Fig.4 Example of processed data
本文算法的實現(xiàn)基于python語言,使用Numpy數(shù)值計算庫和Opencv計算機(jī)視覺庫進(jìn)行數(shù)據(jù)讀入和預(yù)處理,基于深度學(xué)習(xí)高階API Keras搭建了4種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實驗結(jié)果的展示使用python的Matplotlib模塊.
對24000個地形矩陣數(shù)值矩陣進(jìn)行區(qū)分類,19200個作為訓(xùn)練集,4800個作為測試集,其中訓(xùn)練集劃分20%作為驗證集.本文使用多種網(wǎng)絡(luò)結(jié)構(gòu)對訓(xùn)練集進(jìn)行訓(xùn)練,并對幾種取得較好結(jié)果的模型效果圖進(jìn)行展示.
從圖5來看,左圖訓(xùn)練集和驗證集的Loss值逐漸下降,右圖訓(xùn)練集和驗證機(jī)Accuracy逐漸上升,且兩圖曲線均呈收斂態(tài)勢,說明Conv-3訓(xùn)練模型對已有數(shù)據(jù)是有效的.從Loss曲線可以看出在訓(xùn)練到65輪后驗證集Loss開始高于訓(xùn)練集Loss且差值有擴(kuò)大的趨勢,產(chǎn)生過擬合,說明在65輪時模型取得最好效果,此時準(zhǔn)確率為0.8246,Loss為0.415.
圖5 Conv-3的損失曲線(a)和準(zhǔn)確率(b)Fig.5 Conv-3 loss (a) and accuracy (b)
圖6、圖7和圖8是使用VGGNet 16及其變式運(yùn)用控制變量法進(jìn)行的對比實驗.和前面的Conv-3模型的結(jié)果一樣,三種模型在訓(xùn)練集和驗證集的Loss曲線和Accuracy曲線均收斂,充分證明了本文獲取的地形特征數(shù)值矩陣數(shù)據(jù)集是可訓(xùn)練的.另外,圖6和圖7可以得出,VGGNet 16使用5×5和使用3×3的卷積核相比在模型準(zhǔn)確率上更高,且收斂性更好.由圖7和圖8可以得出,在本文的研究中圖8使用的Mean-pooling和圖7使用Max-pooling相比,準(zhǔn)確率上有所提高,模型的收斂和穩(wěn)定性也較好.
使用訓(xùn)練得到的4種模型,在4800個測試集上進(jìn)行預(yù)測,表2是預(yù)測得到的準(zhǔn)確率的結(jié)果.可以得出,4種模型可靠性都比較高,使用VGGNet 16(5×5,Mean-pooling)上的準(zhǔn)確率為 0.8346,分類效果最好.
圖6 VGGNet 16 損失曲線(a)和準(zhǔn)確率(b)Fig.6 VGGNet 16 loss (a) and accuracy (b)
圖7 VGGNet 16(5×5,Max-pooling)損失曲線(a)和準(zhǔn)確率(b)Fig.7 VGGNet 16 (5×5, Max-pooling) loss (a) and accuracy (b)
圖8 VGGNet 16(5×5,Mean-pooling)損失曲線(a)和準(zhǔn)確率(b)Fig.8 VGGNet 16 (5×5, Mean-pooling) loss (a) and accuracy (b)
表2 實驗結(jié)果Table 2 Results of experiments
從實驗結(jié)果可以得到:本文從富鈷結(jié)殼礦區(qū)地形特征出發(fā),利用卷積神經(jīng)網(wǎng)絡(luò)對海拔數(shù)值矩陣訓(xùn)練得到預(yù)測模型.相對于已有的數(shù)據(jù),對找礦靶點進(jìn)行預(yù)測是可行的.
(1)傳統(tǒng)的預(yù)測方法通過一定的規(guī)則集合將專家觀點、地質(zhì)背景、成礦類型等因素綜合考慮,影響找礦預(yù)測成果的最大因素是找礦者的先驗知識.以富鈷結(jié)殼礦區(qū)地形特征為出發(fā)點,運(yùn)用目前非常熱門的卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)特征,進(jìn)行結(jié)殼礦區(qū)預(yù)測的初步研究,VGGNet 16(5×5,Meanpooling)在本文的富鈷結(jié)殼地形數(shù)據(jù)集中實現(xiàn)較好的預(yù)測效果.
(2)通過實驗結(jié)果可以得出,利用地形特征進(jìn)行富鈷結(jié)殼礦區(qū)進(jìn)行找礦靶點預(yù)測切實可行,在準(zhǔn)確率方面仍有提升空間.
(3)富鈷結(jié)殼礦區(qū)分布受諸多因素影響.相信在不久的將來,隨著數(shù)據(jù)量和精度的增加以及更深入的研究,可以把更多的影響因素放入深度學(xué)習(xí)模型當(dāng)中,得到更精確的預(yù)測,可以普遍應(yīng)用于勘探找礦生產(chǎn)環(huán)境中.