錢昱沛,陳向東,丁 星,李 皋,陳一健,夏文鶴
(1.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756;2.西南石油大學(xué) 油氣藏地質(zhì)及開發(fā)工程國家重點(diǎn)實(shí)驗(yàn)室,四川 成都 610500;3.西南石油大學(xué) 石油與天然氣工程學(xué)院,四川 成都 610500;4.西南石油大學(xué) 電氣信息學(xué)院,四川 成都 610500)
氣體鉆井技術(shù)是油氣資源勘探開發(fā)的一種重要技術(shù)手段,在提高機(jī)械鉆井效率等方面具有獨(dú)特的優(yōu)勢(shì);但是在氣體鉆井過程中遇到地層出水后,井下容易發(fā)生環(huán)空堵塞、鉆頭卡鉆、井壁坍塌等復(fù)雜事故[1]。因此,在鉆井過程中需要快速檢測(cè)掘進(jìn)過程中返出巖屑的濕度水平來預(yù)警地層出水狀況。目前,巖土濕度的測(cè)量方式以烘干法最為準(zhǔn)確,但是無法達(dá)到快速檢測(cè)的目的;而常用的快速檢測(cè)方法中,最常見的為探針法,但無法實(shí)現(xiàn)大面積檢測(cè)。文獻(xiàn)[2-3]研究了通過近紅外光譜來分析土壤濕度的方法,能夠達(dá)到較高的檢測(cè)精度,但并未涉及有干擾物影響的復(fù)雜環(huán)境檢測(cè)。文獻(xiàn)[4]采用基于圖像處理的方法來檢測(cè)巖土濕度,通過圖像處理算法有效解決干擾物的影響,但其檢測(cè)靈敏度不高,而且受環(huán)境可見光影響較大,無法適應(yīng)野外鉆井的應(yīng)用場(chǎng)景。
針對(duì)上述問題,本文設(shè)計(jì)了一種基于近紅外圖像的巖土濕度快速檢測(cè)系統(tǒng)。
巖土濕度快速檢測(cè)的總體方案為:利用樹莓派控制USB攝像頭采集850 nm波段近紅外巖土圖像數(shù)據(jù),并通過WiFi實(shí)時(shí)發(fā)送至上位機(jī)。在上位機(jī)中,首先將圖像從RGB顏色空間變換到Lab顏色空間;然后通過混合高斯模型的建立分割出巖土區(qū)域,將分割后的只包含巖土區(qū)域的圖像轉(zhuǎn)換為灰度空間,采用一種基于小波變換的算法降低散斑噪聲干擾,通過DBSCAN聚類算法找到只包含巖土類的像素點(diǎn)并計(jì)算其灰度中心值,并將其作為分段回歸模型的輸入,輸出巖土的預(yù)測(cè)濕度值。圖1為所述系統(tǒng)框架。
圖1 系統(tǒng)框架
本系統(tǒng)主要利用便攜式嵌入式設(shè)備樹莓派控制攝像頭采集圖像,并將采集的圖像發(fā)送至上位機(jī)。采用基于TCP傳輸協(xié)議的Socket技術(shù)實(shí)現(xiàn)樹莓派與上位機(jī)之間的通信[5]。樹莓派作為硬件控制端,首先初始化Socket模塊,綁定一個(gè)IP端口并監(jiān)聽,等待上位機(jī)的連接請(qǐng)求。上位機(jī)為PC機(jī),同樣初始化Socket模塊,通過connect()函數(shù)給硬件控制端發(fā)送連接請(qǐng)求來建立起與遠(yuǎn)程硬件之間的通信橋梁。如果連接成功,上位機(jī)可以控制樹莓派實(shí)時(shí)拍攝圖像并接收樹莓派連續(xù)發(fā)送的圖像數(shù)據(jù)流,實(shí)現(xiàn)系統(tǒng)的快速檢測(cè)功能。上位機(jī)和下位機(jī)通信流程如圖2所示。
圖2 上位機(jī)和下位機(jī)通信
3.1.1 Lab顏色空間模型的轉(zhuǎn)換
巖土圖像容易受背景復(fù)雜性、光照多變性等環(huán)境因素干擾,在Lab顏色空間下建立混合高斯模型可以根據(jù)巖土的亮度特征和顏色特征來區(qū)分巖土中的干擾物。Lab顏色空間是一種基于人的視覺感應(yīng)并使其均勻化的顏色系統(tǒng),其中包含L、a、b三個(gè)特征值,L值表示亮度特征,a和b表示顏色的對(duì)立維度特征[6]。CMOS近紅外攝像頭采集到的近紅外圖像為RGB顏色空間下的圖像,首先需要映射到XYZ顏色空間[7],其關(guān)系為:
然后通過XYZ顏色空間進(jìn)一步轉(zhuǎn)換為Lab顏色空間,轉(zhuǎn)換公式為:
其中:
式中,m=0.008 856。
經(jīng)過轉(zhuǎn)換后,Lab顏色空間下的近紅外巖土圖像可以表示為X={x1,x2,...,xi,...,xN},其中xi=(xL,xa,xb)表示該圖像的每個(gè)像素點(diǎn),是一個(gè)3維向量,xL、xa、xb分別表示該像素點(diǎn)的L、a、b值。
3.1.2 混合高斯模型的建立
混合高斯模型是根據(jù)事物的正態(tài)分布特性采用多個(gè)高斯模型的加權(quán)和來表征數(shù)據(jù)的一個(gè)混合模型[8]。在巖土的近紅外圖像中其像素點(diǎn)存在聚集性分布,因此可以利用混合高斯模型對(duì)其進(jìn)行建模,從而分割出檢測(cè)區(qū)域中較大干擾物,降低復(fù)雜環(huán)境下誤檢測(cè)的概率。近紅外圖像的概率密度為:
3.1.3 基于EM算法的參數(shù)學(xué)習(xí)
EM(Expectation-Maximization)算法是混合高斯模型的常用參數(shù)學(xué)習(xí)算法[9],通過對(duì)參數(shù)θ設(shè)定初值使其變?yōu)橐阎P?,根?jù)該模型進(jìn)行E步的計(jì)算得到每個(gè)像素點(diǎn)的概率密度;然后再通過整幅圖像的概率分布進(jìn)行M步計(jì)算,采用極大似然估計(jì)法求取高斯模型的參數(shù)θ,更新E步的假設(shè)參數(shù)并重復(fù)上述過程,使其達(dá)到最終的最優(yōu)化收斂。
首先假定圖像中的高斯分布模型是已知的,給定初值θ0。通過如下公式進(jìn)行E步計(jì)算:
其中,ωik表示圖像中像素點(diǎn)xi在第k個(gè)高斯分布下的概率,且1≤k≤K,1≤m≤K,1≤i≤N。
通過E步計(jì)算出概率后進(jìn)行M步計(jì)算,并更新該模型的參數(shù),具體表達(dá)式如下:
重復(fù)以上E步和M步,直至參數(shù)達(dá)到最優(yōu)的收斂。
3.1.4 通過先驗(yàn)知識(shí)確定巖土的高斯分布
通過混合高斯模型可以將采集到的圖像分為K個(gè)高斯分布,這個(gè)過程屬于無監(jiān)督學(xué)習(xí),不需要先驗(yàn)知識(shí)。這K個(gè)高斯分布模型中就包括了本文需要的巖土區(qū)域的高斯模型。問題的關(guān)鍵在于并不能事先知道哪個(gè)高斯模型是該巖土的高斯模型,需要通過多次實(shí)驗(yàn)來確定。
本文經(jīng)過多次實(shí)驗(yàn)后確定近紅外圖像中所含K個(gè)高斯模型,均值為μk=(Lk,ak,bk),其中,Lk為第k個(gè)高斯分布圖像像素區(qū)域的亮度值,ak、bk為其顏色值,將其作為該巖土區(qū)域高斯分布的先驗(yàn)知識(shí)。
圖3(a)是含干擾物原始近紅外圖像,對(duì)其分別采用基于RGB顏色空間和基于Lab顏色空間的混合高斯模型進(jìn)行圖像分割處理,得到分割后的圖像分別見圖3(b)、圖3(c)。從圖3的對(duì)比效果可以看出,基于Lab顏色空間的混合高斯模型可以有效將巖土像素點(diǎn)從圖像的背景以及干擾中分割出來;同時(shí)相較于RGB顏色空間的建模能夠較好地分割出巖土區(qū)域中的陰影部分,提高檢測(cè)精度。
圖3 圖像分割效果對(duì)比
3.2.1 圖像顏色空間轉(zhuǎn)換
單色灰度空間直觀地反映了巖土的亮度特征,能夠較好地分析不同濕度下的巖土對(duì)于光照的吸收反射程度。經(jīng)過圖像分割后的灰度圖像可表示為f(x,y),其中f(x,y)可由2個(gè)分量來表征,分別是入射分量和反射分量[10],如公式(11)所示:
式中:i(x,y)的性質(zhì)取決于近紅外光源的光照強(qiáng)度;r(x,y)的性質(zhì)取決于待測(cè)巖土混合物成分,主要影響變量為濕度。因濕度不同的巖土對(duì)近紅外光的吸收不同,因此反射分量的變化會(huì)引起數(shù)字圖像函數(shù)值的變化。
在數(shù)字圖像處理過程中,對(duì)攝像頭傳感器接收的電壓波形進(jìn)行了取樣和量化[11],單色圖像在任意坐標(biāo)(x0,y0)處的強(qiáng)度(灰度)表示為:
l的取值范圍為lmin≤l≤lmax,其中區(qū)間[lmin,lmax]為灰度級(jí),范圍為[0,255]。
3.2.2 基于小波變換的圖像去噪
近紅外圖像中通常存在散斑噪聲,其中既包含加性噪聲的成分,也包含乘性噪聲的成分,表達(dá)式為:
其中:f(x,y)為原始圖像信號(hào);nm為乘性噪聲信號(hào);na為加性噪聲信號(hào);(x,y)為含噪信號(hào)。因此,本文采用一種基于小波變換的近紅外圖像去噪方法來解決噪聲[12]。
信號(hào)中的加性噪聲采用閾值去噪的方法濾除,濾除之后信號(hào)表達(dá)式(13)變?yōu)椋?/p>
通過對(duì)公式兩邊取對(duì)數(shù)可將乘性噪聲變?yōu)榧有栽肼?,公式如下?/p>
對(duì)log4(x,y)進(jìn)行離散小波變換,然后通過硬閾值規(guī)則,消除加性噪聲log4nm。
首先選擇近似于巖土頻率信號(hào)的小波基函數(shù),對(duì)該信號(hào)進(jìn)行等間隔抽樣,經(jīng)過抽樣后得到信號(hào)樣本序列為CJ+1[k],然后對(duì)該序列進(jìn)行N級(jí)離散小波變換。目的是為了得到圖像中每個(gè)像素點(diǎn)的頻率特征,并將該像素點(diǎn)的噪聲信號(hào)分離出來[13]。通過以上過程得到了N級(jí)不同尺度的離散小波展開系數(shù)dJ[k],dJ-1[k],...,dJ-N+1[k]以及一級(jí)近似展開系數(shù)CJ-N+1[k]。
對(duì)于小波變換的各級(jí)展開系數(shù),首先給定每級(jí)系數(shù)的閾值界限,將低于該閾值界限的系數(shù)設(shè)置為零,高于該閾值的系數(shù)保持不變,公式為:
巖土是復(fù)雜的混合物,雖然混合高斯模型算法能夠從近紅外圖像中分割出較大干擾物,但復(fù)雜環(huán)境下的巖土包含的一些較小的干擾物也會(huì)影響檢測(cè)的準(zhǔn)確性,如石塊以及溝壑陰影。除此之外,圖像檢測(cè)屬于大面積的區(qū)域性檢測(cè),而巖土區(qū)域中還存在著水分分布不均的情況。
針對(duì)以上問題,本文采用了密度聚類算法中的DBSCAN算法來實(shí)現(xiàn)聚類。該算法是一種基于密度的聚類算法,通過將高密度區(qū)域內(nèi)具有相同特征的點(diǎn)劃分為同一類實(shí)現(xiàn)聚類[14]??梢愿鶕?jù)區(qū)域的不同性質(zhì)和形狀聚類出具有同一特征的類別,并且可以很好地識(shí)別出噪聲點(diǎn)、排除干擾。
DBSCAN算法需要2個(gè)參數(shù):以每個(gè)核心點(diǎn)為中心構(gòu)成鄰域的半徑ε、構(gòu)成一個(gè)聚類簇的區(qū)域內(nèi)至少包含的關(guān)聯(lián)點(diǎn)個(gè)數(shù)minPts[15]。通過設(shè)置以上參數(shù)進(jìn)行多次迭代直至最終收斂,該算法能夠找到巖土類別在灰度圖像中的簇。本文通過大量實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)取ε=4、minPts=(w×h)/5時(shí)可以得到最優(yōu)化的聚類效果,其中w為近紅外巖土圖像區(qū)域的橫向像素點(diǎn)個(gè)數(shù),h為圖像區(qū)域的縱向像素點(diǎn)個(gè)數(shù)。使用DBSCAN算法能夠分割出類似于巖土的巖石塊以及巖土圖像中溝壑造成的陰影,找出巖土的像素點(diǎn)。前后的對(duì)比如圖4所示,噪聲點(diǎn)統(tǒng)一用白色點(diǎn)代替。聚類后的巖土區(qū)域可能存在水分分布不均的情況,因此需要計(jì)算該區(qū)域的灰度中心點(diǎn)并將其作為該區(qū)域濕度代表。
圖4 巖土聚類前后效果對(duì)比
本系統(tǒng)主要采集了不同產(chǎn)地下不同類型的三種巖土做對(duì)比實(shí)驗(yàn),樣本分別為碳酸鹽巖屑、天然農(nóng)田土和綠化帶黏土。對(duì)3種巖土分別隨機(jī)采集30組不同濕度的樣本,將每組樣本隨機(jī)抽樣分為訓(xùn)練集和測(cè)試集。
測(cè)量巖土的實(shí)際濕度值采用的是傳統(tǒng)的烘干稱重法,可以準(zhǔn)確地測(cè)得巖土樣本的實(shí)際濕度值。其中所用到的烘干稱重儀器有:質(zhì)量精度為0.1 g的天平、盛土所用的不銹鋼容器、50 mL的量杯、ZK-82B型電熱真空干燥箱。
采集近紅外圖像數(shù)據(jù)用的是800萬像素的索尼IMX317系列的415 USB攝像頭模組,鏡頭上貼了850 nm的窄帶濾光片防止攝像頭采集到其他波段的信息,近紅外主動(dòng)光源選用850 nm的40 W廣角近紅外補(bǔ)光燈。硬件控制平臺(tái)采用Raspberry Pi 3 Model B。
采集數(shù)據(jù)參數(shù)設(shè)置包括攝像頭模組的鏡頭和近紅外補(bǔ)光燈與巖土樣品的距離,為48 cm。通過USB攝像頭的SDK控制攝像頭的白平衡、曝光等參數(shù)保持不變。
取完全干燥條件下質(zhì)量為M1的巖土,將其放在質(zhì)量為M0的不銹鋼容器里。用量杯盛取一定質(zhì)量的清水加入該巖土中使其過飽和,然后攪拌均勻使巖土充分吸收水分,再將其放入真空干燥箱中進(jìn)行烘干。平均每烘干5 min后對(duì)盛有巖土的容器稱得一次質(zhì)量并放在實(shí)驗(yàn)箱內(nèi)的平臺(tái)上拍攝一次該濕度下的圖像數(shù)據(jù)。每次烘干后稱得的質(zhì)量為M2,重復(fù)該實(shí)驗(yàn)過程直至巖土完全干燥,對(duì)其他2種巖土重復(fù)上述實(shí)驗(yàn)過程。
巖土的濕度公式為:
在模擬實(shí)驗(yàn)環(huán)境下通過上述方法采集到的數(shù)據(jù)見表1所列。
表1 巖土濕度與巖土圖像的灰度中心值
4.3.1 灰度特征曲線
不同類別巖土的圖像灰度中心值隨其對(duì)應(yīng)的濕度變化曲線如圖5所示。通過圖5可以看出,圖像灰度中心值隨濕度的變化趨勢(shì)近似線性;但是不同類別巖土在每個(gè)濕度下對(duì)應(yīng)的灰度中心值不同,且灰度值隨濕度變化的斜率不同,反映了不同類別巖土的近紅外特性不同。產(chǎn)生這種差異的影響因素比較多,如化學(xué)成分的組成和含量不同、對(duì)水分的吸收能力不同等。
圖5 巖土像素點(diǎn)的灰度中心值隨其濕度的變化曲線
根據(jù)巖土濕度與灰度中心值的對(duì)應(yīng)關(guān)系,本文建立了巖土濕度與拍攝圖像中巖土的灰度中心值之間的分段線性回歸模型。除此之外,為了對(duì)低濕度進(jìn)行及時(shí)且準(zhǔn)確的檢測(cè),將巖土濕度分為2個(gè)類別來提升低濕度下的預(yù)測(cè)準(zhǔn)確率,其模型為:
式中,t0代表劃分高濕度與低濕度臨界點(diǎn)的灰度值。在t處于不同的灰度值時(shí),Y的期望值分別為:
該模型的損失函數(shù)定義為:
模型的參數(shù)估計(jì)值為:
式中,β={β0,β1,β2}。
4.3.2 分段線性回歸
實(shí)驗(yàn)中將采集的不同類別巖土在不同濕度下的30組數(shù)據(jù),以13%的濕度為分界線分為高濕度和低濕度2類,其中每類分為4個(gè)子集進(jìn)行4折交叉驗(yàn)證,得到如圖6所示的對(duì)比圖。
圖6 不同類別巖土在交叉驗(yàn)證下的濕度實(shí)測(cè)值與預(yù)測(cè)值對(duì)比
本文使用濕度的平均絕對(duì)誤差來衡量系統(tǒng)的準(zhǔn)確性,平均絕對(duì)誤差MAD表示為:
式中:N為訓(xùn)練樣本的個(gè)數(shù);Tp(i)表示樣本的預(yù)測(cè)濕度值;Tf(i)表示樣本的實(shí)測(cè)濕度值。
由式(25)計(jì)算出巖土濕度模型的誤差見表2所列。
表2 巖土濕度模型的誤差
通過對(duì)比實(shí)驗(yàn),得到了表2所列的不同類型巖土的識(shí)別結(jié)果,可以看出3種巖土在低濕度下的預(yù)測(cè)結(jié)果比高濕度下的預(yù)測(cè)結(jié)果更為準(zhǔn)確。對(duì)比碳酸鹽巖屑、天然農(nóng)田土和綠化帶黏土的實(shí)驗(yàn)結(jié)果,本系統(tǒng)對(duì)于不同產(chǎn)地不同類型的巖土同樣具有很高的檢測(cè)準(zhǔn)確率。在實(shí)際應(yīng)用過程中應(yīng)該首先針對(duì)不同的巖土進(jìn)行分類,然后通過建立對(duì)應(yīng)巖土類別的數(shù)據(jù)庫實(shí)現(xiàn)不同巖土濕度的預(yù)測(cè)。
4.3.3 系統(tǒng)測(cè)試
本系統(tǒng)進(jìn)行快速檢測(cè)測(cè)試時(shí)采用Intel i5-1135G7 CPU、Win10操作系統(tǒng)的PC機(jī)作為上位機(jī),其運(yùn)行效果如圖7所示。
圖7 系統(tǒng)測(cè)試上位機(jī)運(yùn)行效果
通過多次的實(shí)驗(yàn)驗(yàn)證,檢測(cè)得到一幅規(guī)格為800×600的圖像時(shí),各功能運(yùn)行大致時(shí)間見表3所列。由表3可知,系統(tǒng)需要花費(fèi)的總體時(shí)間約為50 s,基本滿足巖土濕度快速檢測(cè)的需求。
表3 系統(tǒng)各部分運(yùn)行時(shí)間
本文針對(duì)巖土濕度快速檢測(cè)提出了基于近紅外圖像的處理方法,在不同光照環(huán)境和復(fù)雜背景下具有很強(qiáng)的魯棒性,針對(duì)不同類別的巖土還有很強(qiáng)的適應(yīng)性;同時(shí)搭建了模擬環(huán)境驗(yàn)證了該方法的可行性,針對(duì)巖土的濕度實(shí)現(xiàn)了高精度測(cè)量,對(duì)于氣體鉆井地層出水的快速檢測(cè)具有一定的參考價(jià)值。
物聯(lián)網(wǎng)技術(shù)2021年12期