余先川,任雅麗,初曉鳳,徐金東,劉石華,李鴻鎮(zhèn),張 潔
(1.北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100875;2.廣東省地勘局722地質(zhì)大隊(duì),廣東 汕頭 440500)
礦產(chǎn)預(yù)測(cè)是在科學(xué)預(yù)測(cè)的理論指導(dǎo)下,通過(guò)分析成礦地質(zhì)條件,深入研究礦產(chǎn)與礦化信息,總結(jié)成礦規(guī)律,預(yù)測(cè)成礦區(qū)域(趙鵬大,2012)。礦床具有經(jīng)濟(jì)上的緊缺性、地質(zhì)上的特異性,人們對(duì)地質(zhì)結(jié)構(gòu)的認(rèn)識(shí)有限,找尋礦床是一項(xiàng)非常復(fù)雜且具挑戰(zhàn)性的工作。Allis于1957年開創(chuàng)了礦產(chǎn)預(yù)測(cè)的先河(李隨民等,2007),將數(shù)學(xué)方法引入到礦產(chǎn)資源預(yù)測(cè)。20世紀(jì)60年代,傳統(tǒng)的數(shù)理統(tǒng)計(jì)方法被引入到礦產(chǎn)預(yù)測(cè)領(lǐng)域 (Harris,1997;Agterberg et al,1970)。20世紀(jì)70年代末,國(guó)際上采用了“礦產(chǎn)資源評(píng)價(jià)中計(jì)算機(jī)應(yīng)用標(biāo)準(zhǔn)”,推出了6種標(biāo)準(zhǔn)的礦產(chǎn)資源定量評(píng)價(jià)方法,礦產(chǎn)資源定量評(píng)價(jià)進(jìn)入一個(gè)新的階段。隨著礦產(chǎn)預(yù)測(cè)難度的增 加及技術(shù)的發(fā)展,GIS被有效地運(yùn)用在礦產(chǎn)預(yù)測(cè)中。此后,美國(guó)學(xué)者提出的“三步式”礦產(chǎn)資源評(píng)價(jià)方法,已成為較完善的礦產(chǎn)資源評(píng)價(jià)體系(Singer,1997)。
我國(guó)學(xué)者在礦產(chǎn)預(yù)測(cè)領(lǐng)域也做出了突出貢獻(xiàn),礦產(chǎn)預(yù)測(cè)理論、方法日趨成熟。我國(guó)對(duì)礦床預(yù)測(cè)的研究始于趙鵬大院士(2002)的“地質(zhì)異常致礦理論”和“三聯(lián)式”5P地質(zhì)異常定量評(píng)價(jià)方法;王世稱(2000)從地質(zhì)、物探、化探、遙感、礦產(chǎn)資料信息綜合出發(fā),強(qiáng)調(diào)礦產(chǎn)定量預(yù)測(cè)與其他預(yù)測(cè)相結(jié)合,獨(dú)創(chuàng)了綜合信息礦產(chǎn)資源評(píng)價(jià)方法;以成秋明(2001)為代表的學(xué)者在礦床的分形模擬、多重分形與空間統(tǒng)計(jì)、多重分型異常分析及有關(guān)奇異性的研究成果具有重要的理論及實(shí)際意義;余先川(2011)的非線性空間信息統(tǒng)計(jì)分析、空間獨(dú)立成分分析等。近年興起的集計(jì)算機(jī)科學(xué)、數(shù)學(xué)、神經(jīng)學(xué)等學(xué)科為一體的綜交叉學(xué)科,人工神經(jīng)網(wǎng)絡(luò)在礦產(chǎn)預(yù)測(cè)中也取得了一定的成果。
隨著經(jīng)濟(jì)的快速發(fā)展,對(duì)礦產(chǎn)資源的需求量越來(lái)越大,亟需研究新的經(jīng)濟(jì)高效的礦產(chǎn)預(yù)測(cè)方法。礦產(chǎn)數(shù)據(jù)具有非負(fù)性、數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜等特點(diǎn),而非負(fù)矩陣分解(NMF)加入了非負(fù)約束條件,有數(shù)據(jù)降維的功能,可很好地處理大規(guī)模數(shù)據(jù),且NMF具有分解形式簡(jiǎn)單、結(jié)果可解釋性強(qiáng)、數(shù)據(jù)量低等優(yōu)點(diǎn),故NMF處理礦產(chǎn)數(shù)據(jù)具有先天的優(yōu)勢(shì)。Guillamet等(2001)提出的加權(quán)非負(fù)矩陣分解(WNMF)是根據(jù)變量相關(guān)程度決定加權(quán)矩陣,分解的基向量包含重要變量信息,同時(shí)包含其他相關(guān)變量信息,有利于提高礦產(chǎn)資源預(yù)測(cè)精度。為此,筆者將WNMF引入到礦產(chǎn)預(yù)測(cè)的領(lǐng)域,通過(guò)R型聚類分析,結(jié)合顯著性分析,將變量分為不同的群,將經(jīng)過(guò)預(yù)處理之后的數(shù)據(jù)進(jìn)行加權(quán)非負(fù)矩陣分解。實(shí)驗(yàn)以廣東省新寮崠銅多金屬礦區(qū)數(shù)據(jù)為例,運(yùn)用基于WNMF的方法進(jìn)行礦產(chǎn)預(yù)測(cè):對(duì)分解得到的基向量進(jìn)行回歸分析,討論了基向量的意義,通過(guò)基向量預(yù)測(cè)圈定異常,得到明顯的異常區(qū)域,論證了WNMF的有效性。
非負(fù)矩陣分解理論是在矩陣分解過(guò)程中加入非負(fù)約束條件的一種分解方法。非負(fù)矩陣分解可描述如下:對(duì)于任意原始矩V,非負(fù)矩陣分解算法能夠分解得到非負(fù)矩陣W、H,使得V=WH,從而達(dá)到將1個(gè)非負(fù)的矩陣分解得到2個(gè)非負(fù)矩陣的乘積。矩陣V的列向量可以理解為基向量的線性組合,其中矩陣W的每列為基向量,矩陣H為權(quán)重系數(shù)矩陣。非負(fù)矩陣分解理論的數(shù)學(xué)模型為:已知原始非負(fù)矩陣V,分解得到合適的非負(fù)矩陣W和H,使得:
矩陣W是數(shù)據(jù)矩陣V線性逼近的一組基,而H則是樣本集的投影系數(shù)。通常情況下,如果能夠找到較好的基向量組,就可以用較少數(shù)據(jù)表示海量數(shù)據(jù),能夠得到數(shù)據(jù)潛在的關(guān)系,獲得較好的逼近效果。
礦產(chǎn)預(yù)測(cè)中,可以對(duì)研究的變量賦予較大的權(quán)值,對(duì)相關(guān)性小的變量賦以較小的權(quán)值。權(quán)重矩陣為Q,Q中的每個(gè)元素代表元素所占的權(quán)值。目標(biāo)函數(shù)基于似然函數(shù),加權(quán)非負(fù)矩陣分解目標(biāo)函數(shù)、迭代規(guī)則如下。目標(biāo)函數(shù)為:
迭代規(guī)則定義為:
經(jīng)過(guò)加權(quán)非矩陣分解,分解的基向量更能代表研究的重要變量信息,同時(shí)包含其他相關(guān)變量的信息,實(shí)驗(yàn)結(jié)果更利于應(yīng)用于礦產(chǎn)預(yù)測(cè)的領(lǐng)域,提高礦產(chǎn)資源預(yù)測(cè)精度。
回歸分析是研究因變量與自變量依賴關(guān)系的一種統(tǒng)計(jì)方法?;貧w分析要求因變量y滿足正態(tài)分布。因變量y對(duì)自變量x的依賴關(guān)系用數(shù)學(xué)模型表示:
(1)回歸方程的建立,對(duì)回歸的顯著性進(jìn)行檢驗(yàn),評(píng)價(jià)回歸效果;
(2)變量的貢獻(xiàn),即對(duì)回歸效果的影響;
第Ⅱ簇包含了Nb,Y,La,Th, U元素組合,與F2因子一致。主要富集在了研究區(qū)中部肉紅色中細(xì)粒鉀長(zhǎng)花崗巖中,反映了中酸性巖分布特征以及中酸性巖漿巖有關(guān)的稀有元素的礦化因子的地球化學(xué)背景特征。
(3)根據(jù)回歸效果,選擇最優(yōu)回歸方程;
(4)根據(jù)回歸方程進(jìn)行預(yù)測(cè)。
回歸效果的優(yōu)劣,通過(guò)因變量的總離差平方和被回歸估計(jì)值^y估計(jì)程度來(lái)衡量。y的離差平方和如下:
研究區(qū)為廣東新寮崠銅多金屬礦區(qū),調(diào)查區(qū)內(nèi)分布地層較為單一,地層和巖漿巖自老到新分別如下。
下侏羅紀(jì)長(zhǎng)埔組:主要有2個(gè)巖性段,上段是泥質(zhì)砂巖、粉砂質(zhì)泥巖夾長(zhǎng)石石英砂巖(),下段是粉砂巖、泥質(zhì)粉砂巖夾長(zhǎng)石石英砂巖質(zhì)頁(yè)巖)。
礦區(qū)的侵入巖主要分為燕山三期、四期、五期侵入巖、此外還有時(shí)代不明的輝綠巖和英安玢巖。燕山三期侵入巖的巖性是黑云母花崗巖),燕山四期侵入巖的巖性是石英閃長(zhǎng)巖)、燕山五期侵入巖的巖性是花崗閃長(zhǎng)巖)。
第四系蓮下組是礫石、礫砂及巖質(zhì)黏土(Ql)。
礦區(qū)內(nèi)以斷裂構(gòu)造為主,其走向是北東向斷裂和南北向斷裂。
新寮崠銅多金屬工作區(qū)位于廣東省揭陽(yáng)市揭東縣龍尾鎮(zhèn)北西方向3.8 km處。廣東地勘局722地質(zhì)隊(duì)在此做了大比例尺的礦產(chǎn)勘查工作,完成化探次生暈采樣 1 327 個(gè),分析了 Au、Pb、Mo、Sn、Cu、Ag、Zn、Cr、Ti、Ni、As、Sb、Bi、W、Be 共 15 個(gè)元素;坑探揭露探槽8條,共1 765.18 m3;鉆孔4個(gè),分別是ZK2-1,孔深 111.98 m;ZK5-1,孔深 150.80 m;ZK5-2,孔深 119.00 m;ZK4-1,孔深116.00 m。
如圖1所示,藍(lán)色邊框?yàn)閷?shí)際勘測(cè)區(qū)域,便于分析,實(shí)驗(yàn)中采用紅色邊框區(qū)域數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)V(1 066×15),其中1 066為樣本個(gè)數(shù),15為元素個(gè)數(shù)。數(shù)據(jù)分析了 Cu、Pb、Zn、Sn、Ag、Mo 計(jì)6 種元素,數(shù)據(jù)格式如表1。
首先對(duì)原始的15類元素進(jìn)行R型聚類分析,連接點(diǎn)對(duì),根據(jù)相關(guān)系數(shù)得到R型聚類分析譜系圖(圖2),進(jìn)行相關(guān)聚類后可將原始化探數(shù)據(jù)分3類分析處理。Pb、Ag、Zn 3個(gè)元素相關(guān)性較大,將其分為第一類。第二類:As、Sb、Au、Sn、Cu、W。第三類:Cr、Ni、Ti?;谙嚓P(guān)聚類分析結(jié)果及實(shí)際勘測(cè)區(qū)域分析元素,選擇 As、Sb、Au、Sn、Cu、W 6 種元素進(jìn)行NMF分解分析。
圖1 廣東省新寮崠銅多金屬礦區(qū)地形地質(zhì)圖
表1 樣品分析結(jié)果表
圖2 基向量回歸效果圖
實(shí)驗(yàn)中采用的權(quán)重系數(shù)矩陣Q=[0.04 0.04 0.04 0.8 0.04 0.04],其中權(quán)重之和為1。取r=2,進(jìn)行加權(quán)NMF分解。第二基向量呈正態(tài)分布,對(duì)其進(jìn)行回歸分析,回歸效果顯著(圖3),所以可以用第二基向量進(jìn)行Cu礦產(chǎn)預(yù)測(cè)。
在圖2中,默認(rèn)的置信度水平alpha為0.05,Coeff.分別對(duì)應(yīng)變量回歸方程的系數(shù),t-stat為t-檢驗(yàn)顯著性值,p-val為與顯著性相關(guān)的值,Intercept為回歸方程的截距,R-square為復(fù)相關(guān)系數(shù),越大越好。如圖3所示,回歸效果有效,回歸方程式為:
通過(guò)回歸方程式可見,基向量為原變量的組合信息,所以可以利用基向量進(jìn)行組合異常的圈定,進(jìn)而進(jìn)行礦產(chǎn)預(yù)測(cè)。
運(yùn)用基向量進(jìn)行Cu礦產(chǎn)預(yù)測(cè),繪制等高線,加載地質(zhì)底圖做為基面圖,繪制Cu的礦產(chǎn)預(yù)測(cè)分布圖(圖4a)。
圖3 廣東省新寮崠銅多金屬礦區(qū)Cu原始分布圖及勘測(cè)區(qū)Cu原始數(shù)據(jù)
圖4 廣東省新寮崠銅多金屬礦區(qū)區(qū)域預(yù)測(cè)及實(shí)際勘測(cè)區(qū)預(yù)測(cè)
通過(guò)對(duì)比圖3a、4a發(fā)現(xiàn),經(jīng)過(guò)NMF分解的基向量預(yù)測(cè)更為精準(zhǔn),異常區(qū)域較為明顯(等值線密集區(qū)域),能夠較好的消除單點(diǎn)值引起的異常。為了驗(yàn)證礦產(chǎn)預(yù)測(cè)的有效性,實(shí)際勘測(cè)區(qū)域的預(yù)測(cè)圖如圖4b所示??辈閰^(qū)域ZK4-1(ZK4-1-1—ZK4-1-24)Cu元素質(zhì)量分?jǐn)?shù)平均值高達(dá)2 247 g/t。基向量預(yù)測(cè)結(jié)果ZK4-1異常更加明顯,預(yù)測(cè)效果更好。
提出了一種新穎的基于WNMF的礦產(chǎn)預(yù)測(cè)方法,通過(guò)R型聚類分析變量間的相關(guān)性,對(duì)相關(guān)性高的聚類結(jié)果進(jìn)行加權(quán)非負(fù)矩陣分解。選用廣東新寮崠銅多金屬礦區(qū)數(shù)據(jù)為研究對(duì)象,以WNMF分解得到的基向量進(jìn)行預(yù)測(cè),作分布圖,對(duì)比實(shí)際勘測(cè)區(qū)鉆孔、探槽數(shù)據(jù),基于WNMF的礦產(chǎn)預(yù)測(cè)方法對(duì)實(shí)驗(yàn)區(qū)取得了較好的預(yù)測(cè)效果。
成秋明.2001.多重分形與地質(zhì)統(tǒng)計(jì)學(xué)方法用于勘查地球化學(xué)異??臻g結(jié)構(gòu)和奇異性分析[J].地球科學(xué):中國(guó)地質(zhì)大學(xué)學(xué)報(bào),26(2):161-168.
李隨民,姚書振,周宗桂.2007.礦產(chǎn)資源定量預(yù)測(cè)的研究現(xiàn)狀[J].地質(zhì)找礦論從,22(1):9-12.
王世稱.2002.綜合信息礦產(chǎn)預(yù)測(cè)理論與方法[M].北京:科學(xué)出版社.
余先川,胡丹.2011.盲源分離理論與應(yīng)用[M].北京:科學(xué)出版社.
趙鵬大.2002.“三聯(lián)式”資源定量預(yù)測(cè)與評(píng)價(jià)——數(shù)字找礦理論與實(shí)踐探討[J].地球科學(xué):中國(guó)地質(zhì)大學(xué)學(xué)報(bào),27(5):482-489.
趙鵬大.2006.礦產(chǎn)勘查理論與方法[M].武漢:中國(guó)地質(zhì)大學(xué)出版社.
AGTERBERG F P.1970.Multivariate prediction equations in geology[J].Journal of the International Association for Mathematical Geology,2(3):319 -324.
GUILLAMET D,BRESSAN M,VIRTIA J.2001.A weighted non-negative matrix factorization for local representation[C]//Computer Vision and Pattern Recognition:Proceedings of the 2001 IEEE Computer Society Conference.Los Alamitos,California,USA:IEEE.1:942 -947.
HARRIS D V.1997.礦產(chǎn)資源評(píng)價(jià)——過(guò)去、現(xiàn)在的看法和對(duì)未來(lái)趨勢(shì)的展望[G]//文世澂,譯.礦產(chǎn)資源評(píng)價(jià)和礦業(yè)經(jīng)濟(jì)分析方法與實(shí)踐:地質(zhì)礦產(chǎn)信息研究成果(70).北京:中國(guó)地質(zhì)礦產(chǎn)信息研究院,1-11.
SINGER D A.1997.未發(fā)現(xiàn)礦產(chǎn)資源三階段定量評(píng)價(jià)的基本原理[G]//張莓,譯.礦產(chǎn)資源評(píng)價(jià)和礦業(yè)經(jīng)濟(jì)分析方法與實(shí)踐:地質(zhì)礦產(chǎn)信息研究成果(70).北京:中國(guó)地質(zhì)礦產(chǎn)信息研究院,12-22.