王東升,王海龍, 2,張 芳, 3*,韓林芳, 3,李 運
1. 中國礦業(yè)大學(北京)力學與建筑工程學院,北京 100083 2. 河北省土木工程診斷、 改造與抗災重點實驗室,河北 張家口 075000 3. 中國礦業(yè)大學(北京)深部巖土力學與地下工程國家重點實驗室,北京 100083
水的存在使巖石的強度特性發(fā)生了改變,含水量不同其影響程度也不相同。在邊坡、 地下工程和文物保護領(lǐng)域中,許多災變和病害都是由水導致巖石強度減弱而誘發(fā)的[1-2]。因此,巖石中含水量的測定對于評估巖石的物理力學特性以及工程結(jié)構(gòu)的穩(wěn)定性具有重要的意義。
傳統(tǒng)的巖石含水量測定方法需要現(xiàn)場原位取樣,破壞了工程結(jié)構(gòu)的完整性,尤其是在文物保護領(lǐng)域。近紅外光譜分析技術(shù)(near infrared spectroscopy, NIRS)測定巖石中的含水量是近些年研究的新思路,通過測定含水巖石中OH基團的光譜吸收強度,建立含水量與近紅外光譜特征之間的相關(guān)關(guān)系,從而實現(xiàn)含水量測定的目的,與傳統(tǒng)方法相比具有實時、 無損的優(yōu)點[3]。本文基于近紅外光譜分析技術(shù)對砂巖的光譜特征以及其含水量反演的可行性進行了研究。首先,通過室內(nèi)試驗獲取砂巖試樣不同飽和度的近紅外光譜曲線;其次,基于最大信息系數(shù)(maximal information coefficient, MIC)對試樣的近紅外光譜特征進行了分析和篩選;最后,采用搭建的BP神經(jīng)網(wǎng)分類器對巖石的含水量進行了反演。
砂巖試樣取自中國陜西省榆林市神木縣檸條塔煤礦,經(jīng)加工后制作成標準試樣,試樣及監(jiān)測點位置見圖1。數(shù)據(jù)采集系統(tǒng)采用瑞士萬通的XDS Smart Probe近紅外光譜分析儀,見圖2。該儀器采集光譜范圍為400~2 500 nm,數(shù)據(jù)采樣間隔為0.5 nm,采用漫反射方式采集砂巖試樣的光譜信號。試驗中砂巖試樣不同飽和度的近紅外光譜曲線采集步驟如下[4]:
(1)將砂巖試樣放入干燥箱中干燥24 h,待冷卻至室溫后取出并稱重,測量飽和度為0%的近紅外光譜曲線;
(2)將砂巖試樣放入恒溫水箱中煮沸8 h,待冷卻至室溫后取出擦去表面自由水分,測量飽和度為100%的近紅外光譜曲線;
(3)將飽和度為100%的砂巖試樣放到天平上進行蒸發(fā)試驗,觀察含水量的變化,當達到理論計算飽和度時(99%, 98%, 97%, …, 1%),放入密封袋中待其內(nèi)部含水分布均勻后測量其近紅外光譜曲線;
(4)重復步驟(3)即可采集到砂巖不同飽和度的近紅外光譜曲線。
試驗過程中為了保證采集到的近紅外光譜曲線能夠較準確的包含砂巖含水飽和度的信息,測點選取位置為試樣中部并將光纖探頭垂直接觸試樣表面。每塊試樣采集的飽和度位于0~100%之間,整個試驗共采集到120條近紅外光譜曲線。
近紅外光譜儀在采集光譜數(shù)據(jù)的時候受機器、 試樣以及外界的干擾會存在各種噪聲,比如高頻隨機噪聲、 基線漂移和光散射等[5-6]。因此,想要通過近紅外光譜曲線特征準確的分析試樣的物質(zhì)成分,光譜的預處理顯得格外重要。首先,利用馬氏距離法剔除試驗中采集到的異常光譜曲線[7];
圖1 巖樣及其測試點位置(紅點)Fig.1 Rock sample and its test point location (red dot)
圖2 XDS Smart Probe近紅外光譜分析儀Fig.2 XDS Smart Probe near infrared spectrum analyzer
其次,對剔除后剩余的光譜曲線進行一階導數(shù)預處理,消除儀器背景或漂移對信號的影響,提高光譜信號的分辨率和靈敏度[8-9]。圖3(a)是砂巖的原始近紅外光譜曲線,圖3(b)是一階導數(shù)預處理后的近紅外光譜曲線,受篇幅的影響只展示了部分原始和一階導數(shù)預處理后的近紅外光譜曲線。
圖3 不同飽和度砂巖近紅外光譜 (a):原始光譜;(b):一階導數(shù)預處理后光譜Fig.3 Near-infrared spectra of sandstone with different degrees of saturation (a):Original spectra;(b):First derivative pre-processed spectra
含水砂巖在400~2 500 nm波長范圍內(nèi)最主要有2個明顯的吸收峰,1 400 nm處OH和·nH2O的倍頻、 合頻,以及1 900 nm處H2O的振動譜帶,依次將這2個吸收峰命名為R1和R2。結(jié)晶水吸收峰位于1 400 nm附近,譜帶比較寬緩;吸附水的吸收峰位于1 900 nm附近,譜帶比較尖銳。在砂巖的原始光譜曲線中,兩個吸收峰R1和R2隨著含水量的增加,整體吸收強度也在增加,具有明顯的正相關(guān)性;砂巖飽和度在30%~40%附近原始光譜曲線發(fā)生了整體跳躍,其可能是砂巖內(nèi)部水的賦存狀態(tài)發(fā)生了改變。
原始光譜曲線經(jīng)過一階導數(shù)去燥處理后提取其光譜初始特征,其初始特征變量提取見圖4,分別為:峰高(height)、 峰面積(area)、 左肩寬(left half width)、 右肩寬(right half width)、 半高寬(full width at half maxium),共計5個初始特征參數(shù),分別用首字母H,A,L,R和F表示。各個初始特征變量之間存在量綱和閾值的差異,可能導致在后續(xù)的分析計算過程中,一些數(shù)量級較小的特征變量所占的權(quán)重較小其作用無法體現(xiàn)。因此,對提取的初始特征參數(shù)進行歸一化處理,消除量綱和域值差異帶來的影響。歸一化的方法是將原始數(shù)據(jù)各元素值減去數(shù)據(jù)集的最小值后再除以該數(shù)據(jù)集的極差,見式(1)
(1)
受篇幅的限制,只展示了部分飽和度砂巖試樣的歸一化結(jié)果,見表1。
圖4 近紅外光譜特征變量的示意圖Fig.4 Schematic diagram of characteristic variablesof near infrared spectrum
模式識別系統(tǒng)中相關(guān)性弱的特征會影響分類的準確性,因而特征選擇就顯得尤為重要。特征選擇是從系統(tǒng)中挑選出一些相關(guān)性強的特征并降低特征空間維數(shù)的過程,其選擇結(jié)果的好壞將直接影響著模式識別中分類器的分類精度和泛化性能[10-11]。利用MIC進行光譜特征分析和篩選,其具體計算過程如式(2)和式(3)
Imax(C,f,xi,yi)=maxI((C,f)|Gxi, yi(j)),
j=1, 2, …,n
(2)
(3)
首先,計算最大信息值Imax,見式(2),然后,計算最大信息系數(shù),見式(3)。xi為行數(shù),yi為列數(shù),xi,yi
表1 歸一化后特征變量Table 1 Normalized characteristic variable
表2 飽和度與光譜特征的MIC值
根據(jù)表2所計算的MIC值可知,R1峰(1400 nm)中飽和度與特征變量的相關(guān)性為:H>A>F>L>R;其中A,H與飽和度S的相關(guān)性較高,分別為0.946 0和0.980 4,而F,L,R與飽和度S的相關(guān)性較低,分別為0.642 3,0.619 4和0.456 5。R2峰(1 900 nm)中飽和度與特征變量的相關(guān)性為:H>A>R>F>L;其中A,H,F(xiàn),R與飽和度S的相關(guān)性較高,分別為0.960 2,0.980 4,0.906 6和0.952 5,而L與飽和度S的相關(guān)性較低,為0.620 3。整體上來看,峰R2與砂巖飽和度的相關(guān)性大于峰R1,是含水量反演的主要吸收峰;分析原因可能是峰R1是結(jié)晶水的吸收峰,在飽和度較低的情況下具有較好的相關(guān)性,而在整個飽和度區(qū)間,其與水的相關(guān)性就大大減弱。由于R1峰的A,H和R2峰的A,H,F,R六個特征與巖石含水量的MIC值大于0.9,具有較強的相關(guān)性,本文將其作為砂巖含水量識別的特征變量。
為了量化砂巖的含水量,將砂巖的含水量分為5個等級,即0~20%,21%~40%,41%~60%,61%~80%,81%~100%,并采用自主搭建的BP神經(jīng)網(wǎng)絡進行砂巖含水量的識別。整個數(shù)據(jù)集共采集到120條近紅外光譜曲線,經(jīng)過篩選后剩余102條,將其按7∶3的比例隨機分為訓練集(71條)和測試集(31條)。
BP神經(jīng)網(wǎng)絡是一種按照誤差反向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡,一般由輸入層、 隱含層、 輸出層組成。該網(wǎng)絡結(jié)構(gòu)可以很好地將多個特征變量組合起來,自動增強相關(guān)性強的特征變量權(quán)重,降低相關(guān)性弱的特征變量權(quán)重。目前,理論上已經(jīng)表明單隱含層的BP神經(jīng)網(wǎng)絡可以擬合出任意的非線性函數(shù),而且在實際的應用中單隱含層的BP神經(jīng)網(wǎng)絡已經(jīng)可以滿足工程上精度的需求。
基于近紅外光譜砂巖含水量反演的數(shù)學思想是綜合多個光譜特征變量信息,突出相關(guān)性強的變量權(quán)重。BP神經(jīng)網(wǎng)絡采用單隱含層,由于基于MIC值篩選后的光譜特征變量共6個,所以輸入層神經(jīng)元個數(shù)6(R1-H,R1-A,R2-H,R2-A,R2-F,R2-R);隱含層神經(jīng)元個數(shù)經(jīng)過計算后最優(yōu)個數(shù)為10,參見表3;由于含水量共分為5個等級,所以輸出層神經(jīng)元個數(shù)為5。
表3 隱含層不同神經(jīng)元個數(shù)訓練結(jié)果Table 3 Training results of different number of neuronsin hidden layer
將訓練集數(shù)據(jù)輸入到BP神經(jīng)網(wǎng)絡模型中進行訓練,訓練完成后輸入測試集數(shù)據(jù)進行測試,訓練和測試結(jié)果見表4。訓練集準確率為90.3%,測試集的準確率為83.9%,反演效果整體較好,說明基于近紅外光譜砂巖含水量反演是可行的。
表4 識別結(jié)果Table 4 Identification results
基于近紅外光譜分析技術(shù)對砂巖的光譜特征以及其含水量反演的可行性進行了研究。首先,通過室內(nèi)試驗獲取不同飽和度的砂巖試樣近紅外光譜曲線;其次,基于MIC對試樣的近紅外光譜特征進行了分析和篩選;最后,采用搭建的BP神經(jīng)網(wǎng)分類器對砂巖的含水量進行了反演。其具體結(jié)論如下:
(1)含水砂巖的近紅外光譜在1 400和1 900 nm附近有明顯的吸收峰,隨著含水量增加,吸收強度也在增加,兩者有明顯的相關(guān)性。吸收峰位于1 400 nm附近,譜帶比較寬緩,吸附水的吸收峰在1 900 nm附近,譜帶比較尖銳。
(2)根據(jù)計算的MIC值,1 400 nm附近的峰高與含水量的相關(guān)性最強,1 900 nm附近的峰高與含水量的相關(guān)性也最強;1 400 nm附近的峰面積、 峰高,1 900 nm附近的峰面積、 峰高、 半高寬、 右肩寬共6個特征變量其MIC值>0.9,可作為BP神經(jīng)網(wǎng)絡反演砂巖含水量的特征變量。
(3)利用MIC值篩選出1 400和1 900 nm兩個吸收峰的特征變量進行BP神經(jīng)網(wǎng)絡建模,其所建立的砂巖含水量反演模型訓練集準確率為90.3%,測試集的準確率為83.9%,說明基于近紅外光譜分析技術(shù)砂石含水量反演的方法是可行的。