張躍飛 郝偉濤 徐慶勛 張高杰
(河南省地質(zhì)礦產(chǎn)勘查開(kāi)發(fā)局測(cè)繪地理信息院,河南 鄭州 450006)
地質(zhì)測(cè)量是工程建設(shè)、地圖繪制、野外實(shí)測(cè)、礦山開(kāi)采、區(qū)域地質(zhì)調(diào)查等工作的基礎(chǔ)工作,主要用于收集工作區(qū)域內(nèi)的地質(zhì)資料,以圖和數(shù)據(jù)相結(jié)合的方式,將工作區(qū)域內(nèi)露出于地表的地質(zhì)特征展現(xiàn)在平面圖上,為各種地質(zhì)工作提供資料。這一過(guò)程的實(shí)現(xiàn),是因?yàn)榈刭|(zhì)測(cè)量數(shù)據(jù)在時(shí)間域、空間域和時(shí)空域上表現(xiàn)不同尺度過(guò)程之間的“級(jí)序”特征,也稱(chēng)為多尺度特征。因此,通過(guò)地質(zhì)測(cè)量數(shù)據(jù)中的多尺度特征,可以揭示地質(zhì)的結(jié)構(gòu)特征和地質(zhì)運(yùn)動(dòng)機(jī)理[1]。
基于此,國(guó)內(nèi)外眾多學(xué)者十分重視地質(zhì)測(cè)量數(shù)據(jù)中多尺度特征提取,將地理數(shù)據(jù)多尺度特征分為時(shí)間域、空間域和時(shí)空域三類(lèi),依據(jù)多尺度特征類(lèi)別,研究出頻譜分析、自適應(yīng)濾波、二維EMD、三維SSA、異譜分析、雙向分解模型、EOF、SOB、高階SVD、CCA、ICA、可選最小二乘法等方法,提取地理測(cè)量數(shù)據(jù)特征。在國(guó)內(nèi)外研究基礎(chǔ)上,相關(guān)學(xué)者提出了以下觀點(diǎn):文獻(xiàn)[2]采用邊緣直方圖灰度差平方和SSGD兩種方法,簡(jiǎn)化圖像平面特征點(diǎn)維度,提高圖像像素級(jí),實(shí)現(xiàn)多尺度邊緣光流特征提取;文獻(xiàn)[3]設(shè)計(jì)了一種信息熵計(jì)算方法采集軸承聲發(fā)射信號(hào),通過(guò)分解多尺度特征的方式,實(shí)現(xiàn)多尺度特征提??;文獻(xiàn)[4]采用模糊集方法獲取圖像等效形態(tài)尺寸特征,根據(jù)分形維數(shù)提取圖像等效形態(tài)尺寸特征;文獻(xiàn)[5]采用VMD分解方式獲取機(jī)械振動(dòng)信號(hào)不同頻率尺度特征,通過(guò)獨(dú)立分量正交化提取多尺度非線性動(dòng)力學(xué)特征參數(shù)。然而,將上述研究成果應(yīng)用在復(fù)雜地質(zhì)測(cè)量中多尺度特征提取時(shí),提取的復(fù)雜地質(zhì)測(cè)量多尺度特征穩(wěn)健性差,為此本文提出復(fù)雜地質(zhì)測(cè)量中多尺度特征提取方法研究。
復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)描述的是測(cè)量區(qū)域地質(zhì)發(fā)生演變的過(guò)程。其中,涉及地質(zhì)的演變趨勢(shì)、特征和時(shí)間的變化,屬于地質(zhì)動(dòng)態(tài)變化的表征。因此,復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)前后存在顯式或隱式的相關(guān)性,具有周期性和趨勢(shì)變化規(guī)律。所以,其受到地質(zhì)空間要素的影響,存在三種表現(xiàn)形式,分別為:?jiǎn)我粫r(shí)間序列、多維時(shí)間序列和空間離散時(shí)間連續(xù)序列。
當(dāng)復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)按照時(shí)間變化、次序排列時(shí),則表現(xiàn)出單一時(shí)間序列特征;當(dāng)復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)存在多個(gè)指標(biāo),按照時(shí)間變化排序時(shí),則表現(xiàn)出多維時(shí)間序列特征;當(dāng)復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)屬于測(cè)量空間上任意一個(gè)點(diǎn)位的測(cè)量數(shù)據(jù),且測(cè)量數(shù)據(jù)在該點(diǎn)位上呈現(xiàn)出連續(xù)、在空間上不連續(xù)變化時(shí),則表現(xiàn)出空間離散時(shí)間連續(xù)序列。
以上復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)三種表現(xiàn)形式,依據(jù)概率論和隨機(jī)過(guò)程建立復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)模型,并對(duì)模型進(jìn)行分解處理,為數(shù)據(jù)中多尺度關(guān)系處理做鋪墊。
由于復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)中包含了地質(zhì)基本、潛在和隨機(jī)變化特征,所以這些變化可以體現(xiàn)出地質(zhì)多尺度波動(dòng)特征。然而,復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)模型受時(shí)間演化影響,數(shù)據(jù)中不同要素存在多個(gè)尺度的變動(dòng)。因此需要多尺度分解數(shù)據(jù),獲取地質(zhì)多尺度波動(dòng)特征。其特征獲取過(guò)程(如圖1所示):
圖1 復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)分解過(guò)程
由圖1可知,A為復(fù)雜地質(zhì)測(cè)量數(shù)據(jù);γ和κ均為分解算子;J為數(shù)據(jù)多尺度分解層數(shù);j為多尺度分解第j層;γ′和κ′為γ和κ的對(duì)偶算子。
由圖1可知的復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)分解過(guò)程,將其分解因素劃分為四部分,得到的分解重構(gòu)復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)序列表現(xiàn)形式,如式(1)所示:
式(1)中,φ(0)(t)為剩余隨機(jī)序列;Q(0)(t)為趨勢(shì)項(xiàng);λ(0)(t)為白噪聲數(shù)據(jù)序列;T(0)(t)為周期項(xiàng)。
從式(1)中可以看出復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)多尺度特征中Q(0)(t)和T(0)(t)具有重要意義,而其他數(shù)據(jù)與其存在相互作用、相位、耦合等關(guān)系,為此,對(duì)數(shù)據(jù)多尺度特征關(guān)系進(jìn)行處理。
根據(jù)圖1所示的復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)分解過(guò)程,分解得到的復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)多尺度波動(dòng)特征要素間關(guān)系交織、趨于復(fù)雜。為此,依據(jù)數(shù)據(jù)Beamlet處理復(fù)雜地質(zhì)測(cè)量中多尺度特征關(guān)系,得到三種測(cè)量數(shù)據(jù)多尺度特征關(guān)系處理結(jié)果,結(jié)合測(cè)量數(shù)據(jù)分解過(guò)程,得到地質(zhì)多尺度波動(dòng)特征,即可提取復(fù)雜地質(zhì)測(cè)量中多尺度特征。
根據(jù)圖1所示的復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)分解過(guò)程,得到地質(zhì)多尺度波動(dòng)特征,以及確定的多尺度特征關(guān)系,可以直接提取復(fù)雜地質(zhì)測(cè)量中多尺度特征。其多尺度特征提取過(guò)程如下:先生成尺度空間,降低地質(zhì)測(cè)量數(shù)據(jù)多尺度特征維度;再篩選特征極值點(diǎn),作為多尺度特征提取關(guān)鍵點(diǎn);最后在每個(gè)關(guān)鍵點(diǎn)相應(yīng)層的鄰域內(nèi),提取復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)多尺度特征。
此次研究采用高斯尺度空間的構(gòu)造方法,構(gòu)造如圖2所示的尺度空間。將尺度空間分為N個(gè)Octaves編程語(yǔ)言層,而每個(gè)Octaves編程語(yǔ)言層中包含了M個(gè)Intervals層(間隔層)。此時(shí),降維處理的復(fù)雜地質(zhì)特征數(shù)據(jù),位于圖2中Octaves 1層中的Intervals 1層。
圖2 尺度空間降維圖
按照?qǐng)D2所示的尺度空間完成數(shù)據(jù)降維后,計(jì)算數(shù)據(jù)多尺度特征極值點(diǎn)Omax,其計(jì)算式如式(2)所示:
式(2)中,σ為尺度空間濾波參數(shù);?12為混合偏導(dǎo)數(shù);?2為空間垂直方向的偏導(dǎo)數(shù);?1為空間水平方向的偏導(dǎo)數(shù)。當(dāng)式(2)式計(jì)算得到的Omax值小于設(shè)定的閾值ε時(shí),則不屬于關(guān)鍵點(diǎn);反之,則屬于關(guān)鍵點(diǎn)。此時(shí),需要計(jì)算關(guān)鍵點(diǎn)位置并求解,提取復(fù)雜地質(zhì)測(cè)量中多尺度特征x。
此次研究,通過(guò)建立復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)模型,分解數(shù)據(jù)多尺度特征,處理特征關(guān)系,實(shí)現(xiàn)復(fù)雜地質(zhì)測(cè)量中多尺度特征提取。
選擇基于量子熵的特征提取方法和自適應(yīng)特征提取方法作為此次實(shí)驗(yàn)的對(duì)比方法,將地理系統(tǒng)采集得到的復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)作為此次實(shí)驗(yàn)研究對(duì)象,驗(yàn)證此次研究的復(fù)雜地質(zhì)測(cè)量中多尺度特征提取方法,提取復(fù)雜地質(zhì)測(cè)量中多尺度特征穩(wěn)健性。
此次實(shí)驗(yàn)選擇的三組多尺度特征提取方法,均處于Matlab2012仿真環(huán)境下運(yùn)行,在運(yùn)行的過(guò)程中使用Matlab2012自帶函數(shù)控制實(shí)驗(yàn)進(jìn)行過(guò)程。
此次實(shí)驗(yàn)選擇的地質(zhì)測(cè)量數(shù)據(jù),來(lái)自于MSGIS(地質(zhì)測(cè)量空間信息系統(tǒng)),由點(diǎn)、線、面三種基本元素構(gòu)成,形成地質(zhì)空間信息,描述地質(zhì)表面特征。
采用三組多尺度特征提取方法,并將特征提取結(jié)果與其實(shí)際地質(zhì)測(cè)量多尺度特征進(jìn)行對(duì)比,判斷三組多尺度特征提取方法與實(shí)際地質(zhì)測(cè)量多尺度特征逼近情況,以此驗(yàn)證提取方法的穩(wěn)健性。
2.2.1 特征提取穩(wěn)健性對(duì)比
基于量子熵的特征提取方法和自適應(yīng)特征提取方法,提取到的地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征,與實(shí)際地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征存在較大的上下波動(dòng)誤差,表明兩組方法提取地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征穩(wěn)健性差。然而研究方法提取到的地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征,與實(shí)際地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征極為接近,基本不存在波動(dòng)誤差,表明研究方法提取地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征穩(wěn)健性良好。
2.2.2 均勻噪聲干擾下特征提取穩(wěn)健性對(duì)比
在前一組實(shí)驗(yàn)基礎(chǔ)上,針對(duì)地質(zhì)測(cè)量數(shù)據(jù)增添0.1、5和10倍的標(biāo)準(zhǔn)差的均勻噪聲后,再次提取地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征,其特征提取結(jié)果與其實(shí)際特征逼近情況(如圖3所示):
圖3 均勻噪聲干擾下特征提取穩(wěn)健性對(duì)比圖
由圖3可知:隨著噪聲倍數(shù)的增加,三組方法提取到的特征穩(wěn)健性,均出現(xiàn)不同程度的降低。當(dāng)標(biāo)準(zhǔn)差的均勻噪聲達(dá)到10倍時(shí),基于量子熵的特征提取方法和自適應(yīng)特征提取方法,提取到的地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征初始和結(jié)束趨勢(shì),與實(shí)際地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征初始和結(jié)束趨勢(shì)已經(jīng)完全不一致,受到標(biāo)準(zhǔn)差的均勻噪聲干擾嚴(yán)重;然而研究方法取到的地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)征,雖然與實(shí)際地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征過(guò)程存在差異,但是提取到的地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征初始和結(jié)束趨勢(shì),與實(shí)際地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征初始和結(jié)束趨勢(shì)仍然完全一致。由此可見(jiàn),此次研究方法,受到標(biāo)準(zhǔn)差的均勻噪聲影響較小,提取地質(zhì)測(cè)量數(shù)據(jù)長(zhǎng)期趨勢(shì)特征穩(wěn)健性較優(yōu)。
此次研究根據(jù)復(fù)雜地質(zhì)測(cè)量中多尺度特征的時(shí)間域、空間域、時(shí)空域等特點(diǎn),建立復(fù)雜地質(zhì)測(cè)量數(shù)據(jù)模型,通過(guò)多尺度特征之間的相互關(guān)系,提取復(fù)雜地質(zhì)測(cè)量中多尺度特征,增強(qiáng)特征提取的穩(wěn)健性。但是此次研究仍然存在一定的不足,在今后的研究中,還需深入研究復(fù)雜地質(zhì)測(cè)量中多尺度特征提取的便捷性,增強(qiáng)多尺度特征提取的自動(dòng)化程度。