劉潤虎
(神東煤炭集團大柳塔煤礦,陜西 榆林 719315)
傳統(tǒng)簡單粗獷的勘探和開采方法已經(jīng)不能滿足新形勢的要求。從礦業(yè)開發(fā)公司的需求開始,迫切需要一種新的有效的礦業(yè)勘探和開發(fā)方法。在激烈競爭的礦業(yè)環(huán)境中,更加重視數(shù)據(jù)挖掘技術在礦山勘探和開采中的應用。國家所需的礦產(chǎn)資源無論是數(shù)量還是種類都大大增加,促進了中國礦業(yè)公司的快速發(fā)展。在礦業(yè)公司快速發(fā)展的過程中,如何提高礦山的生產(chǎn)效率和改善礦山生產(chǎn)環(huán)境的安全性能是當前各勘采公司重點研究的課題。在解決礦山安全問題的過程中,礦業(yè)公司引進了大量先進設備和技術人才,不僅提高了礦山的生產(chǎn)效率,而且有效減少了煤礦安全事故的發(fā)生。但是,對于他們來說,引進先進的設備和技術人才還不夠,需要有一種數(shù)據(jù)技術作為強有力的分析手段。
首先,數(shù)據(jù)挖掘技術在礦勘探業(yè)是一個新的概念。數(shù)據(jù)挖掘技術的基礎和核心是從大量數(shù)據(jù)資源中挖掘關鍵有效數(shù)據(jù),從而為決策提供準確的數(shù)據(jù)基礎。數(shù)據(jù)挖掘技術基本上是數(shù)據(jù)分析技術或數(shù)據(jù)庫管理技術。它具有廣泛的應用范圍,并且可以在幾乎任何行業(yè)的不同層次上應用,我們專注于數(shù)據(jù)挖掘技術在采礦勘探和開采中的應用。挖掘勘探和挖掘過程會生成大量物理數(shù)據(jù),這些數(shù)據(jù)包括來自采礦各個方面的數(shù)據(jù),包括地質(zhì),蓄水,礦山巖性特征等。這些數(shù)據(jù)構成了一個巨大的采礦勘探數(shù)據(jù)庫,這對礦山勘探和采前安全性評估計算很有用,以便制定各種勘探和采礦計劃的依據(jù)。嚴格的采礦勘探和采礦決策過程應基于這個龐大的數(shù)據(jù)庫,但是如何在該數(shù)據(jù)庫的海量信息中找到最重要的數(shù)據(jù),或者如何在此數(shù)據(jù)管理中找到最有效的管理,這也可以確保高效,準確的決策。數(shù)據(jù)挖掘技術實際上是為滿足這些環(huán)境要求而生產(chǎn)的,尤其是礦山勘探和采礦應用。例如,在礦山勘探項目的過程中,難以做出正確的決定,因為各種勘探數(shù)據(jù)非常復雜,決策者難以一一分析和計數(shù)這些數(shù)據(jù)。對于采礦勘探和采礦人員而言,執(zhí)行此類數(shù)據(jù)分析也是一項艱巨的任務,如果某些關鍵數(shù)據(jù)未正確識別,或是收集到的數(shù)據(jù)不夠準確導致整個勘探和采礦計劃失效甚至出現(xiàn)安全問題,導致重大的人員和經(jīng)濟損失。在這種情況下,使用數(shù)據(jù)挖掘技術是一個很好的選擇,借助數(shù)據(jù)挖掘技術,可以從這些海量數(shù)據(jù)中找到關鍵數(shù)據(jù)。決策者可以根據(jù)這些關鍵數(shù)據(jù)做出決策,也可以根據(jù)這些關鍵數(shù)據(jù)創(chuàng)建完整的勘探和開采計劃。
信息收集:根據(jù)確定的數(shù)據(jù)分析對象,匯總數(shù)據(jù)分析所需的特征信息,然后選擇適當?shù)男畔⑹占椒ǎ⑹占男畔⒋鎯υ跀?shù)據(jù)庫中。對于大數(shù)據(jù),選擇合適的數(shù)據(jù)倉庫進行數(shù)據(jù)存儲和管理至關重要。數(shù)據(jù)集成:邏輯上或物理上集中來自不同來源,格式和特征的數(shù)據(jù),以為公司提供全面的數(shù)據(jù)交換。數(shù)據(jù)規(guī)范:即使是少量數(shù)據(jù),大多數(shù)數(shù)據(jù)挖掘算法也需要很長時間才能運行,并且在挖掘業(yè)務運營數(shù)據(jù)時,數(shù)據(jù)量通常非常大??梢允褂脭?shù)據(jù)縮減技術來獲取數(shù)據(jù)集的規(guī)范表示,該數(shù)據(jù)集雖然要小得多,但仍接近保持原始數(shù)據(jù)的完整性,并且可以將數(shù)據(jù)挖掘后的數(shù)據(jù)挖掘出來,規(guī)格與之前的結果相同或幾乎相同。數(shù)據(jù)清理:數(shù)據(jù)庫中的某些缺少屬性值造成數(shù)據(jù)不完整和不一致,因此,必須進行數(shù)據(jù)清理以在數(shù)據(jù)倉庫中存儲完整,正確和一致的數(shù)據(jù)信息。數(shù)據(jù)轉換:通過無縫的數(shù)據(jù)聚合,泛化和標準化,將數(shù)據(jù)轉換為適合數(shù)據(jù)挖掘的格式[1]。對于某些實數(shù)數(shù)據(jù),通過分層概念和數(shù)據(jù)離散化轉換數(shù)據(jù)也是重要的一步。數(shù)據(jù)挖掘過程:根據(jù)數(shù)據(jù)倉庫中的數(shù)據(jù)信息,選擇適當?shù)姆治龉ぞ?,應用統(tǒng)計方法,基于案例的推理,決策樹,基于規(guī)則的推理,遺傳算法來處理信息并獲得有用的信息分析。模型評估:從業(yè)務角度來看,行業(yè)專家驗證數(shù)據(jù)挖掘結果的準確性。
遺傳算法:遺傳算法是一種基于自然生物學選擇和遺傳機制的隨機搜索算法。具有隱式并行性,與其他模型的輕松集成以及遺傳算法的其他特性使它可用于數(shù)據(jù)挖掘。國外基于遺傳算法的數(shù)據(jù)挖掘工具,利用該工具對兩次空難的實際數(shù)據(jù)庫進行了數(shù)據(jù)挖掘?qū)嶒?,結果表明,遺傳算法是一種有效的方法用于數(shù)據(jù)信息挖掘。遺傳算法的應用還體現(xiàn)在與神經(jīng)網(wǎng)絡,近似集成等技術的結合中。例如,遺傳算法用于優(yōu)化神經(jīng)網(wǎng)絡的結構,并在不增加錯誤率的情況下刪除了冗余連接和隱藏驅(qū)動器,利用遺傳算法對神經(jīng)網(wǎng)絡進行訓練,然后從網(wǎng)絡中提取規(guī)則。然而,遺傳算法的算法較為復雜,尚未解決局部極小值的早期收斂問題。決策樹方法:決策樹是預測建模中常用的算法,可以通過有意對大量數(shù)據(jù)進行分類來找到有價值的潛在信息。它的主要優(yōu)點是描述簡單,排序速度快,特別適合于大規(guī)模數(shù)據(jù)處理。最早,最有影響力的決策樹方法是quinlan 提出的眾所周知的基于信息的id3算法。它的主要問題是非增量學習算法;決策樹id3 是單變量決策樹,很難表達復雜的概念。同性之間的關系不夠重視。針對上述問題,出現(xiàn)了許多改進的算法。統(tǒng)計分析方法:在數(shù)據(jù)庫字段項目之間具有兩種關系:可以由函數(shù)公式表示的確定性功能關系和不能由公式的公式表示關聯(lián)關系函數(shù),但仍然是相關的確定性關系。可以使用統(tǒng)計方法進行分析,即使用統(tǒng)計原理來分析數(shù)據(jù)庫中的信息。常用統(tǒng)計量在大量數(shù)據(jù)中查找最大值,最小值,和,平均值等,回歸分析使用回歸方程式表示變量之間的定量關系,相關分析使用相關系數(shù)進行度量變量之間的相關性,差異分析從樣本統(tǒng)計值確定通用參數(shù)之間是否存在差異等。
(1)建立數(shù)據(jù)模型。在數(shù)據(jù)挖掘技術的采礦勘探和應用過程中,要做的第一件事是對采礦勘探準備和采礦過程中的各種數(shù)據(jù)進行統(tǒng)計匯總,然后根據(jù)數(shù)據(jù)挖掘技術的數(shù)據(jù)處理方法將這些數(shù)據(jù)構建為采礦數(shù)據(jù)模型,該模型成為整個礦山勘探和開發(fā)的重要指南。在數(shù)據(jù)模型中,可以找到來自采礦勘探和采礦過程的關鍵數(shù)據(jù),例如地質(zhì)結構,水流走向,土質(zhì)和巖石特性。還可以分析和處理這些關鍵數(shù)據(jù),并對其他挖掘數(shù)據(jù)模型以找到相關數(shù)據(jù)并進行模型預測。這個預測也是采礦勘探和采礦中非常重要的部分,挖掘數(shù)據(jù)模型的構建不僅必不可少,而且對于勘探團隊來說是迫切需要的。必須總結過去采礦勘探和采礦過程中生成的數(shù)據(jù),建立相應的數(shù)據(jù)模型,并為主要礦山建立相應的模型,將這些挖掘數(shù)據(jù)模型組合到資源數(shù)據(jù)庫中進行分析和管理可以為將來的挖掘探索和開發(fā)提供重要的數(shù)據(jù)庫,尤其是在數(shù)據(jù)模型預測方面,這些數(shù)據(jù)模型起著重要作用[2]。例如,礦床的結構和礦物的相關特性,對這些數(shù)據(jù)的分析和預測主要依靠歷史勘探和采礦數(shù)據(jù)。分析這些數(shù)據(jù)的最直觀,有效和準確的方法是建立該數(shù)據(jù)模型。從某種意義上講,可以說采礦數(shù)據(jù)模型的質(zhì)量與采礦勘探和采礦業(yè)務直接相關。
(2)優(yōu)化并利用數(shù)據(jù)挖掘技術指導勘采。在礦山勘探和開采中的重要應用角色是優(yōu)化目標并指導勘探和采礦工作,這也是數(shù)據(jù)挖掘技術在礦山勘探和采礦應用中的價值的體現(xiàn)。數(shù)據(jù)挖掘技術可以為礦山勘探和開采過程提供關鍵的數(shù)據(jù)指導。該數(shù)據(jù)指南嵌入在很多方面,并在整個礦山勘探和采礦過程中實施。因為礦山勘探和開采中的數(shù)據(jù)不是靜態(tài)的,而是隨著時間的變化而動態(tài)變化的,例如天氣,水流量和其他變化因素,并且隨著勘探和開采過程中變動。采礦中,一些新的地質(zhì)數(shù)據(jù)會不斷更新。在這類數(shù)據(jù)的動態(tài)變化中,如果按照既定的勘探和開采計劃進行勘探和開采工作,無疑是跟不上節(jié)奏,引入岔路。因此,使用數(shù)據(jù)挖掘技術來優(yōu)化整個勘探和采礦過程尤為重要。同樣,在此優(yōu)化過程中,動態(tài)數(shù)據(jù)模型可以發(fā)揮非常重要的作用。數(shù)據(jù)挖掘技術最優(yōu)化和指導礦物勘探與開采過程最重要的是如何充分利用現(xiàn)有的礦山數(shù)據(jù)庫。該數(shù)據(jù)庫的數(shù)據(jù)源是在礦物勘探和開采過程中獲得的,并且正在逐步跟隨變化因素通過計算機采集并不斷更新實時狀態(tài),該數(shù)據(jù)庫也來自其他相關礦山的數(shù)據(jù)庫。使用數(shù)據(jù)挖掘技術來管理和分析這些數(shù)據(jù)庫并制定最佳目標計劃,對于確保順利進行礦山勘探和開采具有重要作用。
作為一種全新的數(shù)據(jù)管理和分析技術,數(shù)據(jù)挖掘技術已廣泛應用于金融,審計和其他高度依賴數(shù)據(jù)的行業(yè),但它仍然是礦產(chǎn)勘探領域的新興者。礦山勘探與開發(fā)是傳統(tǒng)的資源領域,缺乏對數(shù)據(jù)挖掘技術的重視是阻礙數(shù)據(jù)挖掘技術在勘探與開發(fā)中應用的最重要因素。從一些調(diào)查數(shù)據(jù)中我們還可以知道,在當前的中國采礦和礦物勘探領域中,數(shù)據(jù)挖掘技術的應用鳳毛麟角。主要原因是人們沒有認識到數(shù)據(jù)挖掘技術在礦物勘探和采礦領域帶來的應用價值,沒有足夠的關注。為了提高礦物勘探和采礦中的數(shù)據(jù)挖掘技術的應用,采礦和礦物勘探公司必須自覺地增加對新技術的了解和關注。這項新技術絕不僅僅指機械設備中的新技術,作為一種高效的數(shù)據(jù)管理和分析新技術,數(shù)據(jù)挖掘技術可以在采礦勘探和采礦數(shù)據(jù)管理中發(fā)揮至關重要的作用,并且對于確保對勘探的順利進行至關重要。礦業(yè)勘探和開采公司應建立獨立的數(shù)據(jù)管理部門,促進數(shù)據(jù)挖掘技術的應用,并與相應的由專職人員組成的部門一起確保數(shù)據(jù)挖掘技術的實施,制定數(shù)據(jù)挖掘技術導向計劃。決策者還必須仔細采用數(shù)據(jù)挖掘技術提供的數(shù)據(jù)建議,以做出正確的決策。
在現(xiàn)代勘探和采礦中,多種學科和技術的應用被集成在一起,不僅是設備中的新技術,還包括數(shù)據(jù)挖掘等其他方面的新技術。礦山勘探和開采是另一個將進行大量數(shù)據(jù)分析工作的領域。這些數(shù)據(jù)管理和分析工作將極大地影響礦山勘探和采礦工程的運營。另一方面,在我國采礦資源日益緊張的情況下,數(shù)據(jù)挖掘技術的應用對于確保高效合理的開采和保護采礦資源也具有重要意義。盡管中國當前的采礦勘探和采礦領域?qū)?shù)據(jù)挖掘技術還沒有給予足夠的重視,但在不久的將來,這種現(xiàn)象肯定會得到改善,數(shù)據(jù)挖掘技術也將在勘探和采礦中得到更廣泛的應用。