郭廣慧 ,鐘世華,* ,李三忠 ,豐成友 ,戴黎明 ,索艷慧 ,劉嘉情 ,牛警徽 ,黃宇 ,薛梓萌
(1. 中國海洋大學,深海圈層與地球系統(tǒng)教育部前沿科學中心,山東 青島 266100;2. 中國海洋大學,海底科學與探測技術教育部重點實驗室,山東 青島 266100;3. 中國海洋大學海洋地球科學學院,山東 青島 266100;4. 青島海洋科學與技術國家實驗室,海洋礦產資源評價與探測技術功能實驗室,山東 青島 266100;5. 中國地質科學院勘探技術研究所,河北 廊坊 065000)
花崗巖是大陸地殼的最重要組成部分,也是Cu、Fe、Pb、Zn、W和Sn等許多金屬礦產的重要來源(吳福元等,2007;王孝磊,2017;劉鵬等,2020)。因此,與花崗巖有關的研究一直是地質學家特別是礦床學家關注的焦點(Chappell et al.,1974;Pizarro et al.,2020;高利娥等,2021;Wade et al.,2022;牛警徽等,2023;Zhong et al.,2023a)。然而,具有成礦潛力的花崗巖僅占地球中已知花崗巖的極小一部分,而大多數(shù)地表出露的花崗巖并不能成礦。隨著全球對金屬礦產資源需求的不斷增加,如何快速且準確識別花崗巖成礦潛力已經成為礦床學領域研究的熱點(Richards et al.,2017;Pizarro et al.,2020;Zhong et al.,2021a;Zhu et al.,2022)。近年來,得益于成礦理論的發(fā)展和測試技術的提升,人們對花崗質成礦巖漿的特征及成因機制已取得了長足的認識,建立了大量識別成礦巖體的地球化學勘查指標及閾值(Zhong et al.,2019;Ballard et al.,2002)。其中,依據(jù)鋯石成分識別花崗巖成礦潛力已成為當前最常用的手段之一(Zhong et al.,2021a)。這是由于鋯石在花崗巖類巖石中廣泛存在,并且形成后的地球化學成分幾乎不受后期熱液活動的影響(Shumlyanskyy et al., 2017),因而能真實反映巖漿源區(qū)特征,記錄熔體在分異過程中的地球化學行為,從而對解譯巖漿-熱液系統(tǒng)演化歷史具有十分重要的作用(Dempster et al.,2003;Hanchar et al.,2007;Dilles et al.,2015;Grimes et al.,2015)。此外,巖漿氧逸度、含水量以及結晶分異程度對巖漿成礦起著關鍵控制作用,前人研究發(fā)現(xiàn)鋯石的Ce4+/Ce3+、Ce/Ce*、Eu/Eu*、Ce/Nd等特征可以很好地揭示以上這些信息(Ballard et al.,2002;Chelle-Michou et al.,2014;Zhong et al.,2019),這為從鋯石角度識別巖體成礦能力奠定了理論基礎。
隨著研究的深入,人們發(fā)現(xiàn)許多地球化學指標并不具有普適性(Loader et al.,2017;Chiaradia,2020),這限制了基于鋯石成分建立的找礦勘查方法的應用,也引發(fā)了關于礦床成因的爭論(Du et al.,2020;Lee et al.,2020;Massimo et al.,2022)。以斑巖Cu礦床為例,鋯石的Ce4+/Ce3+、Ce/Ce*、和Ce/Nd與巖漿氧逸度具有正相關性。由于斑巖Cu礦床通常被認為與高氧逸度巖漿有關,因而絕大多數(shù)研究認為這些比值越高,越有利于形成斑巖Cu礦化(Ballard et al.,2002;Chelle-Michou et al.,2014)。然而,近年來發(fā)現(xiàn)的一些還原型斑巖Cu礦床表明,成礦巖體有時也可以具有較低的氧逸度(Cao et al.,2014;Zhong et al.,2019;申萍等,2020),這導致在運用這些比值識別還原型斑巖Cu礦時會造成誤判。此外,在以往研究中,前人大都是根據(jù)對成礦巖體的“已知認識”從而提出成礦巖體的判別方法,但考慮到成礦過程的復雜性,許多反映巖漿成礦能力的地球化學信息可能均尚未被揭露。換句話說,許多鋯石微量元素與巖漿成礦能力之間可能存在著密切聯(lián)系,對找礦勘查和認識礦床成因同樣具有指示意義,但是由于在傳統(tǒng)研究中沒有發(fā)現(xiàn)這些內在聯(lián)系,致使目前地球化學數(shù)據(jù)庫中大量可以指示巖漿成礦能力的信息被忽視。此外,僅基于少數(shù)巖漿特征建立的地球化學勘查方法也容易受到其他因素干擾,引發(fā)誤判。因此,為了更準確的識別花崗巖成礦潛力,需要借助新方法,挖掘一些在以往研究中可能被忽視的地球化學信息,提高成礦巖體識別時的準確性。
為此,筆者以東昆侖祁漫塔格成礦帶為例,借助大數(shù)據(jù)和機器學習方法,通過對來自該成礦帶斑巖—矽卡巖Cu—Fe—Pb—Zn礦床成礦巖體和全球非成礦巖體的鋯石數(shù)據(jù)開展機器學習訓練,挖掘一些新的能夠反映巖漿成礦能力的地球化學指標。在此基礎上,筆者構建了一系列基于機器學習的巖漿成礦潛力地球化學判別圖解。將研究結果應用于東昆侖祁漫塔格地區(qū)找礦勘查,將有助于提高成礦預測準確性和找礦效率,降低人力、物力成本,從而更好的服務新一輪找礦突破戰(zhàn)略行動。
東昆侖造山帶是位于青藏高原北部的一條巨型構造巖漿巖帶,其東西長約為1 500 km,可以與岡底斯山脈相媲美(Zhong et al.,2018a;Zhong et al.,2021a)。該造山帶北起柴達木盆地南緣,南至巴顏喀拉—松潘甘孜板塊,東起秦嶺—大別造山帶,西至阿爾金造山帶,并以烏圖美仁鄉(xiāng)為界大致可以分為東西兩段(鐘世華,2018)。東昆侖造山帶經歷了4個造山旋回,分別是前寒武紀、早古生代、晚古生代—早中生代和晚中生代—新生代旋回(Yu et al.,2020;Zhong et al.,2021b)。這些構造旋回記錄了原特提斯洋、古特提斯洋以及新特提斯洋的形成、擴張和消亡過程(Zhong et al.,2021a)。除晚中生代—新生代旋回外,其他各個造山旋回都伴隨著大量的巖漿活動,其中以晚古生代和早中生代(特別是三疊紀)的巖漿活動最為強烈(Zhong et al.,2021a)。祁漫塔格成礦帶位于東昆侖造山帶的東段,東西長約550 km,東起烏圖美仁鄉(xiāng)一帶,西至阿爾金斷裂,北與柴達木盆地相鄰,西南與庫木庫里盆地相接(Zhong et al.,2018b)。祁漫塔格成礦帶巖漿-構造活動頻繁,成礦地質條件優(yōu)越,是中國三疊紀金屬礦產最重要的分布區(qū)之一(毛景文等,2012;鐘世華等,2017a,2017b,2017c)。
祁漫塔格地區(qū)出露地層時代跨度大、分布零散,且大都經歷了不同程度的后期改造(鐘世華等,2017b)(圖1)。研究表明,中元古界長城系小廟組和狼牙山組、奧陶系灘間山群以及石炭系締敖蘇組和大干溝組與區(qū)域上矽卡巖礦化關系密切,是主要的賦礦地層(豐成友等,2010;2011;高永寶,2013)。長城系小廟組主要為片巖和大理巖等,與區(qū)域上鎢錫礦化關系密切(高永寶等,2012);薊縣系狼牙山組主要由碎屑巖及碳酸鹽巖組成,夾少量火山巖(Zhong et al.,2017;Zhong et al.,2018b);灘間山群又被稱為祁漫塔格群,為一套海相火山—沉積組合(張曉飛等,2012);大干溝組和締敖蘇組巖性較為類似,均是一套主要由灰?guī)r組成的碎屑巖-碳酸鹽建造(豐成友等,2012)。區(qū)內構造活動強烈,褶皺以軸向NWW向的復式背向斜構造為主,NWW、NW和近EW向斷裂組成了主體構造骨架;不同級別和序次的斷裂構造交匯聚合部位,往往是成巖成礦的有利部位,而NE和SN向斷裂大多為成礦后構造(鐘世華等,2017c)。祁漫塔格地區(qū)巖漿巖分布十分廣泛,時代橫跨前寒武紀到早中生代,巖性復雜多樣,但以志留紀—泥盆紀(435~370 Ma)和中晚三疊世—早侏羅世花崗巖(245~196 Ma)最為發(fā)育(Zhong et al.,2021b),主要形成于該地區(qū)早古生代旋回和晚生代—早中生代旋回的(后)碰撞階段(Zhong et al.,2021a)?;浴詭r僅在該地區(qū)呈零星分布,以輝綠巖脈最為常見(鐘世華等,2017b)。
圖1 祁漫塔格地質圖(據(jù)Zhong et al.,2021b修改)Fig. 1 Geological map of Qimantagh
祁漫塔格成礦帶是近幾年查明的有較大找礦遠景的斑巖—矽卡巖型Cu-Mo—Fe—Pb—Zn多金屬成礦帶(毛景文等,2012),代表性礦床有維寶、尕林格、虎頭崖、野馬泉、卡爾卻卡、四角羊和肯德可克等。來自輝鉬礦Re—Os和熱液白云母Ar—Ar等的定年結果證實,這些礦床的形成大都與三疊紀花崗巖類巖體的就位有關(豐成友等,2011;田承盛等,2013;于淼等,2015;姚磊等,2015;Xia et al.,2015)。不過,近年來隨著勘查和研究工作的深入,在祁漫塔格許多Cu—Fe—Pb—Zn多金屬礦區(qū)發(fā)現(xiàn)含礦化的泥盆紀花崗巖,證實在該地區(qū)存在兩期斑巖—矽卡巖多金屬礦化(Zhong et al.,2021a)。除這些與花崗巖類有關的礦床外,與基性—超基性巖有關的銅鎳硫化物礦床是該地區(qū)另一種重要的礦床類型,以夏日哈木超大型銅鎳硫化物礦床為代表(Liu et al.,2018)。
文中使用的成礦巖體鋯石數(shù)據(jù)均來自祁漫塔格成礦帶斑巖—矽卡巖礦床,包括矽卡巖Cu—Pb—Zn礦床、矽卡巖Fe礦床、矽卡巖Pb—Zn礦床以及斑巖Cu礦床。祁漫塔格成礦帶雖然發(fā)育許多斑巖Mo礦床,這是目前尚未有來自這些礦床的鋯石數(shù)據(jù)。此外,筆者也沒有考慮來自白干湖等W—Sn礦床的鋯石數(shù)據(jù),一方面是由于來自這類礦床的鋯石數(shù)據(jù)也很少,另一方面是由于W—Sn礦床的成因與Cu—Fe—Pb—Zn礦床有較大區(qū)別,成礦巖體的許多地球化學特征(如氧逸度)顯著不同(另文討論)。對于非成礦巖體的鋯石數(shù)據(jù),筆者則使用 Zou等(2022)匯編的數(shù)據(jù)庫。使用這一數(shù)據(jù)庫的好處是,它包含了國內外的非成礦巖體鋯石數(shù)據(jù),因此將使結果更具有代表性。具體的鋯石數(shù)據(jù)來源見表1。
表1 文中使用的鋯石微量元素數(shù)據(jù)來源統(tǒng)計表Tab. 1 Data sources of zircon trace elements used in this study
對每一條鋯石數(shù)據(jù), 筆者收集了21種特征用于后續(xù)機器學習訓練,包括15種稀土元素(La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu和Y)、Ti、Hf、Th、U以及Eu/Eu*和Ce/Ce*。其中,Eu/Eu*=(下標N代表球粒隕石均一化),Ce/Ce*則根據(jù)Zhong 等(2019)提出的方法計算獲得。選擇這些元素用于機器學習模型訓練,是因為這些特征在文獻中幾乎均有報道,從而確保文中可以充分利用文獻中已發(fā)表的數(shù)據(jù)。由于使用含有缺失特征的數(shù)據(jù)會導致機器學習訓練結果出現(xiàn)偏差(Chawla,2002),必須確保用于機器學習訓練的數(shù)據(jù)庫中每條訓練數(shù)據(jù)均報道了上面提及的21種特征。為了避免引入新的誤差,除稀土元素外,含有缺失值的數(shù)據(jù)需要刪除;對缺失部分稀土元素的數(shù)據(jù),文中將采用文獻中的通用做法進行處理,即缺失的稀土元素可由其相鄰的2個稀土元素經內插法獲得。此外,許多輕稀土富集的鋯石是由于包裹體混染等導致的,文中使用Zou等(2022)提出的La<0.1×10—6篩選出干凈的巖漿鋯石數(shù)據(jù)。文中共收集了723條鋯石微量元素數(shù)據(jù),其中包括343條來自成礦巖體的鋯石數(shù)據(jù)和380條來自非成礦巖體的鋯石數(shù)據(jù)。
筆者匯編了鋯石微量元素數(shù)據(jù)庫的統(tǒng)計學特征(表2,圖2)。來自成礦巖體的鋯石Ti含量變化范圍大,為0.02×10—6~41 919.34×10—6;La、Ce、Pr含量變化范圍小,分別為0.01×10—6~0.10×10—6、2.12×10—6~60.09×10—6和0.01×10—6~1.16×10—6;Nd和Sm含量變化范圍也較小,分別為0.13×10—6~14.04×10—6和0.25×10—6~25.14×10—6。來自成礦巖體的鋯石Eu含量變化也較小,為0.02×10—6~7.44×10—6。成礦巖體的鋯石的重稀土元素變化范圍普遍較大,通常跨越2個數(shù)量級。其中,Gd值為1.37×10—6~238.00×10—6,Tb值為1.93×10—6~114.74×10—6,Dy值為0.63×10—6~34.61×10—6,Ho值為10.47×10—6~403.30×10—6,Er值為4.40×10—6~147.61×10—6,Tm值為24.00×10—6~702.98×10—6,Yb值為5.53×10—6~146.39×10—6,Lu值為60.20×10—6~1 317.17×10—6,Y值為15.21×10—6~279.95×10—6。相對于稀土元素,成礦巖體的鋯石Hf、U、Th變化范圍也較大,分別為6 422.50×10—6~13 873.25×10—6,56.35×10—6~2 249.59×10—6以及17.93×10—6~1 716.13×10—6;Eu/Eu*值為0.03~0.77,Ce/Ce*值為57.52~6 997.36。
表2 兩種類型鋯石的成分特征統(tǒng)計表(10-6)Tab. 2 The compositional characteristics of the two types of zircon compiled in this paper (10-6)
圖2 文中用于訓練的兩種類型鋯石的21種特征箱狀圖Fig. 2 Box illustrations of the 21 features of the two types of zircon used for training in this paper
與成礦巖體的鋯石相比,來自非成礦巖體的鋯石Ti含量明顯減小,平均值為17.02×10—6。La含量平均值為0.04×10—6,與成礦巖體的鋯石相比略低;Ce和Eu含量與成礦巖體的鋯石相似,平均值為19.31×10—6和0.95×10—6;Pr、Nd、Sm等3種輕稀土元素含量較成礦巖體的鋯石高(表2),其平均值分別為0.15×10—6、2.55×10—6和5.36×10—6。非成礦巖體的鋯石的Gd、Tb含量較成礦巖體的鋯石小,其平均值分別為29.39×10—6和10.30×10—6;Dy、Ho、Er、Tm、Yb、Lu、Y含量與成礦巖體的鋯石有明顯差異,平均值分別126.92×10—6、48.02×10—6、218.29×10—6、47.57×10—6、468.36×10—6、84.07×10—6和1 429.95×10—6。來自非成礦巖體的鋯石的Hf、Th、U含量與成礦巖體的鋯石較為相近,其平均值為11 348.72×10—6、465.07×10—6、284.17×10—6;與Eu、Ce特征一致,非成礦巖體的鋯石Eu/Eu*和Ce/Ce*含量明顯低于成礦巖體的鋯石(表2)。綜上所述,成礦巖體和非成礦巖體的鋯石微量元素在分布范圍上雖然存在不同程度的重合,但是也表現(xiàn)出不同的變化趨勢,從而表明利用這些元素開展花崗巖成礦潛力評價在理論上是可行的。
機器學習模型目前已被廣泛用于解決地球科學中的分類問題(Bergen et al.,2019)。在這些方法中,支持向量機(Support Vector Machine,簡稱SVM)是當前使用最多、最有效的方法之一(Petrelli et al.,2016;Petrelli et al.,2020)。支持向量機是由Vapnik等人于1995年提出(Cortes et al.,1995),原理是尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,能夠使超平面兩側的空白區(qū)域最大化(顧亞祥等,2011)。支持向量機是通過最大化分類超平面到最近樣本點的距離來選擇決策邊界(圖3)。相對于其他機器學習模型(如神經網(wǎng)絡),支持向量機不需要對數(shù)據(jù)進行復雜的特征轉換和處理,這使得我們的模型變得更加簡單和高效。此外,支持向量機即使在樣本較少的情況下,也能取得較好的分類效果,這使得支持向量機在面臨小樣本場景時成為一種有吸引力的選擇(程學旗等,2014)。
圖3 支持向量機模型原理圖Fig. 3 Support Vector Machine model schematic
根據(jù)排列組合規(guī)則可知,選擇21個鋯石特征中任意兩個作為端元,共可以構建210個二元圖解。不難預測,大部分圖解將無法有效區(qū)分成礦巖體和非成礦巖體,因此無需對所有二元圖解的決策邊界進行計算(王瑀等,2022)。為此,筆者首先利用支持向量機算法和全部21個鋯石特征,訓練得到一個基于21個鋯石特征的支持向量機模型;然后,利用機器學習解釋性算法——SHAP(SHapley Additive exPlanations),獲得對分類結果影響最大的5個特征;最后,再以它們中任意2個特征作為端元計算二元圖解的決策邊界即可。SHAP模型由Lundberg等于2017年提出,其主要思想來自于組合博弈論中的Shapley值,用于解決機器學習的“黑匣子”問題。SHAP方法以SHAP值來計算各個特征重要性以及對預測結果的貢獻。
為定量評估模型的表現(xiàn),訓練前筆者將數(shù)據(jù)集拆分為訓練集和測試集,并確保每個數(shù)據(jù)集中各類別的數(shù)據(jù)比例相同,這樣可以使模型在訓練和測試過程中對各個類別的樣本都有足夠的學習和評估機會,避免類別不平衡導致的偏差(Zhong et al.,2023b)。具體地,文中將數(shù)據(jù)集(n=723)按8∶2的比例隨機分為訓練集(n=578)和測試集(n=145)。訓練過程中,對訓練集采用5倍交叉驗證評估模型表現(xiàn),并根據(jù)模型得分尋找最優(yōu)參數(shù)。最后,利用模型表現(xiàn)最優(yōu)時的參數(shù),計算獲得測試集的準確率,用于評估模型的最終表現(xiàn)。
圖4展示了將21個鋯石特征全部作為訓練輸入特征時,得到的支持向量機模型的SHAP值結果。某一特征在圖中的位置越靠上,表示該特征對輸出結果的影響越大??梢钥闯?,利用支持向量機模型識別來自成礦巖體和非成礦巖體的鋯石時,對輸出結果影響最大的5個特征是Gd、Dy、Yb、Y和Tm,其次是Lu、Er、Tb、Ho和Eu/Eu*。相比于以上10個元素,Eu、Sm、Nd、La、Ti和Pr對輸出結果的影響程度較低,而對成礦潛力判別最不重要的5個元素是Th、U、Ce、Ce/Ce*和Hf。
圖4 支持向量機模型的SHAP值圖Fig. 4 SVM method based SHAP plot
在圖4中還可以看出各個特征對模型預測的影響。對于每一個特征,顏色越紅,代表特征值越大,顏色越藍,代表特征值越小。此外,SHAP值為正,意味著該特征變量對模型的預測值有一個正向的影響,即該特征變量越有可能導致被預測成為成礦巖體;SHAP值為負,意味著該特征變量對模型的預測值有一個負向的影響,即該特征變量越有可能導致被預測成為非成礦巖體。不難發(fā)現(xiàn),Gd、Dy、Yb、Y和Er表現(xiàn)出類似的規(guī)律,均是值越低,越有可能導致預測結果是成礦巖體。Tm則正好與之相反,表現(xiàn)為值越高,越有可能導致預測結果是非成礦巖體。Lu、Tb、Ho、Eu/Eu*和Eu表現(xiàn)出與Tm類似的特征。其余元素(如Hf),其SHAP值集中在0附近,意味著其對結果沒有明顯的影響。
Gd、Dy、Yb、Y和Tm對支持向量機訓練模型的輸出結果影響最大,因此文中使用以上5個鋯石特征進行了二元圖解構建。選擇5個特征中任意2個作為端元,共可構建10個二元圖解,結果見圖5。在圖5中,不但顯示了計算獲得的支持向量機模型的決策邊界及對應的準確率,還顯示文中匯編的(亦即訓練使用的)所有鋯石數(shù)據(jù)??梢钥闯?,10個二元圖解在區(qū)分成礦巖體和非成礦巖體時的準確率均很高,為0.99~1。此外,視覺審查也可以發(fā)現(xiàn),在每一個二元圖解中,來自成礦巖體和非成礦巖體的鋯石幾乎均很好的落入了決策邊界兩側對應的區(qū)域。
此外,從10個二元圖解可以看出,來自成礦巖體的鋯石通常表現(xiàn)為Gd、Dy、Yb和Y值比較低,而Tm值則比較高;來自成礦巖體的鋯石則正好與之相反,它們的Tm趨向于低值而其余4個特征趨向于高值。這些規(guī)律與SHAP值的結果是完全一致的(圖4)。以上這些結果共同表明,文中構建的10個二元圖解能夠有效地區(qū)分來自成礦巖體和非成礦巖體的鋯石。
文中利用支持向量機模型,選取Gd、Dy、Yb、Y和Tm等5個鋯石微量元素特征構建了10個用來識別成礦巖體和非成礦巖體的決策邊界圖(即二元判別圖解)。綜合模型的準確率(0.99~1)和決策邊界圖的視覺審查,可以看出10個二元圖解可以很好的將成礦巖體和非成礦巖體區(qū)分開來。為了進一步證明文中新提出的二元圖解有效,圖6展示了來自祁漫塔格成礦帶成礦巖體和非成礦巖體的鋯石在以往提出的鋯石Eu/Eu*~Ce/Ce*圖解上的分布情況??梢钥闯觯M管總體上成礦巖體呈現(xiàn)出更高的鋯石Eu/Eu*和Ce/Ce*含量,但是成礦巖體和非成礦巖體鋯石的成分范圍存在明顯重疊,顯示傳統(tǒng)方法難以有效區(qū)分祁漫塔格成礦帶斑巖系統(tǒng)的成礦巖體和非成礦巖體。
圖6 祁漫塔格成礦帶成礦巖體和非成礦巖體的鋯石Eu/Eu*-Ce/Ce*圖解Fig. 6 Zircon Eu/Eu* vs. Ce/Ce* diagram from mineralized and barren rocks from the Qimantagh metallogenic belt
然而,以上獲得的決策邊界圖的準確率可能被高估,這在許多研究中已被提及(韓亞楠等,2022;Nathwani et al.,2022)。這是由于在模型訓練時,筆者通常會隨機抽取數(shù)據(jù)庫的一部分數(shù)據(jù)用于訓練,而將剩余的數(shù)據(jù)用于測試。然而,這些用于測試的數(shù)據(jù)與訓練數(shù)據(jù)必然存在一部分來自相同數(shù)據(jù)源,從而導致基于測試集獲得的模型評價指標得分明顯偏高。為了真實反映機器學習模型的準確率,文中引入獨立驗證,即用在訓練數(shù)據(jù)庫中沒有涉及的36條來自祁漫塔格斑巖Cu礦的鋯石數(shù)據(jù)進一步檢驗新提出的10個二元判別圖解。從圖7中可以明顯看出,這些鋯石數(shù)據(jù)全部落入了10個二元圖解的成礦巖體區(qū)域。該結果進一步證明文中構建的10個二元判別圖解在成礦潛力預測時具有良好的穩(wěn)定性和有效性。
文中研究結果表明,充分利用好鋯石大數(shù)據(jù)和機器學習,將可以為祁漫塔格成礦帶與花崗巖類有關礦床的找礦勘查提供理論指導,大大減少傳統(tǒng)找礦勘查的人力、物力和時間成本,提高找礦效率。這對運用其他副礦物成分開展花崗巖成礦潛力評價、指導找礦勘查也具有重要指導意義。不過,在應用文中提出的鋯石二元判別圖解時,為了獲得可靠的分類結果,需要注意其應用的范圍和前提條件。此外,當前的研究仍存在一些不足,為了進一步提高判別圖解的準確性,并充分挖掘鋯石在花崗巖成礦潛力判別中的作用,未來還需要在多個方面加強研究。
(1)需要加強對熱液、變質和巖漿成因鋯石的研究。只有巖漿成因的鋯石才能用于判別花崗巖成礦潛力。一些來自熱液礦床的鋯石可能遭受了熱液或變質事件的影響,導致許多鋯石事實上并不能用于花崗巖成礦潛力評價。然而,如何區(qū)分巖漿鋯石、熱液鋯石和變質鋯石還存在很大的爭議。此外,即便對于巖漿成因鋯石,由于包裹體的存在,也會導致分析獲得的鋯石數(shù)據(jù)存在異常。如果將文中提出的二元判別圖解用于非巖漿成因或受包裹體混染的鋯石,可能會導致嚴重的誤判。因此,在未來的研究中,為了提高對成礦巖體判別的準確性,需要進一步加強對熱液、變質和巖漿成因鋯石特征的研究。
(2)需要加強對來自更多礦床類型以及祁漫塔格以外地區(qū)成礦花崗巖中鋯石的研究。文中所搜集的成礦巖體鋯石數(shù)據(jù)全部來自東昆侖祁漫塔格地區(qū),通過筆者的訓練結果可以看到,新提出的二元判別圖解在應用于祁漫塔格地區(qū)時表現(xiàn)優(yōu)異。但是,機器學習方法依賴于可靠的、充分的訓練數(shù)據(jù),筆者所收集的數(shù)據(jù)來源較單一,并且數(shù)據(jù)量有限,這些因素都可能會影響模型的性能和可靠性。因此,文中獲得的二元圖解主要適用于祁漫塔格成礦帶及其周邊地區(qū)斑巖-矽卡巖Cu-Fe-Pb-Zn礦床的找礦勘查,不能應用于其他類型礦床的成礦巖體識別(如矽卡巖W-Sn礦)。此外,若將這些圖解應用于其他地區(qū)花崗巖成礦潛力評價時需要謹慎,必須結合其他地質、地球物理和地球化學資料綜合評判。在未來的研究中,為了提高基于機器學習方法建立的二元圖解的應用范圍,需要充分收集來自其他地區(qū)以及其他礦床類型的鋯石數(shù)據(jù),將其應用于機器學習模型訓練。
(3)需要提醒的是不能單純依靠一個圖解就判斷花崗巖能否成礦,而必須綜合考慮所有二元圖解。文中提出的10個二元判別圖解可以正確的判別大部分花崗巖的成礦潛力,且獨立驗證結果進一步表明了這一結論。但是不能忽視的是,在自然界中,單一的地球化學元素,極易受到外界干擾,所以使用單一的二元圖解可能會導致誤判。為降低誤判風險,建議聯(lián)合使用本文提出的10個二元判別圖解,從而提高結果的準確性和可靠性。
(1)利用匯編的來自祁漫塔格成礦帶斑巖-矽卡巖Cu-Fe-Pb-Zn多金屬礦床成礦巖體和全球非成礦巖體的鋯石微量元素數(shù)據(jù),借助支持向量機算法和機器學習解釋性算法,挖掘能夠反映巖漿成礦能力的鋯石微量元素特征,并在此基礎上構建花崗巖成礦潛力判別圖解。
(2)模型訓練結果顯示,在21個常見的鋯石微量元素特征中,Gd、Dy、Yb、Y、Tm等5種元素特征對識別巖漿成礦能力最為重要;在此基礎上,文中新提出了10個基于鋯石成分的二元判別圖解,它們在識別成礦巖體和非成礦巖體時的準確率均接近1。
(3)研究表明,利用機器學習方法和地質大數(shù)據(jù),可以挖掘傳統(tǒng)研究方法難以發(fā)現(xiàn)的新的地球化學指標和圖解,這對深入認識礦床成因、指導找礦勘查具有重要意義。