張曉光
【摘要】? ? 為了實(shí)現(xiàn)非接觸、低成本隧道圍巖形變測(cè)量,本文利用單目相機(jī)拍攝二維圖像,提出了基于深度卷積神經(jīng)網(wǎng)絡(luò)的隧道三維重構(gòu)方法。將二維片圖像關(guān)鍵點(diǎn)位置看作潛在變量,利用數(shù)據(jù)挖掘進(jìn)行特征提取,通過深度卷積神經(jīng)網(wǎng)絡(luò)仿真其不確定性;未知的三維形狀通過稀疏表示建立模型,三維參數(shù)估計(jì)通過期望最大化挖掘算法進(jìn)行,實(shí)現(xiàn)了隧道的可視化三維模型重構(gòu),為隧道圍巖非接觸式測(cè)量及預(yù)警研究提供參考。
【關(guān)鍵詞】? ? 深度卷積神經(jīng)網(wǎng)絡(luò)? ? 圍巖形狀? ? 深度學(xué)習(xí)? ? 三維重建
引言:
針對(duì)施工期隧道圍巖形變量測(cè),傳統(tǒng)的解決方案包括激光測(cè)距、反射性標(biāo)記物、接觸式傳感器等技術(shù),如利用ATR全站儀[1]、壓力分布統(tǒng)計(jì)[2]。這些技術(shù)要求定制化設(shè)備、現(xiàn)場(chǎng)安裝調(diào)試復(fù)雜,靈活便捷性有限。相比之下基于單目RGB圖像構(gòu)建三維隧道模型,實(shí)現(xiàn)非接觸式形變測(cè)量,具有成本低、實(shí)時(shí)性強(qiáng)等優(yōu)點(diǎn)。
在預(yù)測(cè)隧道圍巖形狀變化時(shí),目前多通過搜素示例數(shù)據(jù)集的判別式,或者通過直接從歷史數(shù)據(jù)庫到圍巖關(guān)鍵點(diǎn)位置的判別式學(xué)習(xí)映射圖實(shí)現(xiàn)。但大多數(shù)研究中,均利用從單個(gè)相機(jī)捕捉的圖像序列中恢復(fù)三維非剛性形狀的一類因式分解方法,即非剛性運(yùn)動(dòng)結(jié)構(gòu),以及基于已知架構(gòu)的圍巖形狀恢復(fù)模型。通過假定機(jī)器學(xué)習(xí)識(shí)別的二維關(guān)鍵點(diǎn)位置,通過二維形狀捕捉來自動(dòng)提供輸入關(guān)鍵點(diǎn)或聯(lián)合解決二維和三維形狀估算還鮮有研究。
一、模型算法
研究描述隧道三維形狀、二維形狀和圖像之間關(guān)系,提出了一種介于圖像辨別與三維重建之間三維圍巖形狀仿真算法----TunnelCap算法。該方法考慮了基于圖像的二維部分位置估算,以及基于模型的三維形狀重建,針對(duì)拍照?qǐng)D像的畸變、阻擋,以及重建魯棒性的不足,向三維形狀和視圖參數(shù)加入了時(shí)間平滑性特征參數(shù)。圖1給出了本文提出算法流程。
在給定輸入圖像之后,可以用深度卷積神經(jīng)網(wǎng)絡(luò)生成二維關(guān)鍵點(diǎn)熱圖,并結(jié)合期望最大化數(shù)據(jù)挖掘EM算法,這些熱圖與三維圍巖形狀的稀疏模型結(jié)合起來,恢復(fù)了三維形狀的序列,從而構(gòu)成三維模型。
圖中為了全面考慮不確定性,這個(gè)問題是在概率框架下考慮的,其中將二維關(guān)鍵點(diǎn)置模型化為潛在變量,因此在EM算法中被邊緣化。同時(shí)在三維中加入了時(shí)間平滑性特征,結(jié)合二維模型輸出形成基于深度卷積神經(jīng)網(wǎng)絡(luò)的隧道圍巖三維空間形變模型。
1.1三維形狀的稀疏表示
三維圍巖形狀由一組p關(guān)鍵點(diǎn)的三維位置表示,針對(duì)第t幀,由St∈R3×p所表示。為了減少三維重建的模糊性,假定一個(gè)隧道三維形狀可以被表示為預(yù)定義的基本形狀的一種線性組合:
其中Bi∈R3×p表示一種基本形狀,cit表示對(duì)應(yīng)的權(quán)重。本文沒有使用基本形狀集很小的傳統(tǒng)主動(dòng)形狀模型,而是使用了能夠模型化圍巖形狀大量變動(dòng)性的一種稀疏表示,也就是說,一個(gè)含有相對(duì)大量基本形狀k的過完備字典{B1,...,Bk},其中cit系數(shù)被認(rèn)為是稀疏的。在本文后續(xù)部分,ct表示第t幀的系數(shù)矢量[c1t,...,ckt]T,而C表示所有ct構(gòu)成的矩陣。
1.2 二維和三維形狀之間的依賴性
本文通過相機(jī)視角模型表達(dá)三維形狀其成像的二維形狀之間的依賴性:
其中,Wt∈R2×p表示第t幀中的二維形狀,Rt∈R2×3和Tt∈R2分別表示相機(jī)旋轉(zhuǎn)和平移。本模型中取消了視圖模型中的縮放參數(shù),是因?yàn)槿S結(jié)構(gòu)St自身就可以縮放。在后面,W,R和T分別表示所有t的Wt , Rt和Tt集合。
考慮觀察噪音和模型誤差,給定三維形狀參數(shù)下的二維形狀條件分布通過以下模型表:
其中θ={C,R,T}是所有三維形狀參數(shù)的并集,而損失函數(shù)定義為:
其中,h‖·‖F(xiàn)表示弗羅貝尼烏斯矩陣范數(shù)。公式(3)中的模型說明,如果給定三維形狀和相機(jī)參數(shù),則每個(gè)關(guān)鍵點(diǎn)的二維位置呈高斯分布,其均值等于三維對(duì)應(yīng)的投射。
1.3 形狀和圖像之間的依賴性
給定隧道圍巖二維形狀后,假定三維形狀參數(shù)的分布有條件獨(dú)立于圖像數(shù)據(jù)。因此,θ的概率函數(shù)可以分解為:
其中I={I1,...,In}表示輸入圖像,Pr(W|θ)可以從公式(3)中得到。雖然直接獲得Pr(I|W)比較困難,但是通過假定W和I具備統(tǒng)一的先驗(yàn),則Pr(I|W)就與Pr(W|I)成比例,而則Pr(W|I)可以從數(shù)據(jù)中獲得。
給定圖像數(shù)據(jù)后,可以假定每個(gè)關(guān)鍵點(diǎn)的二維分布只取決于當(dāng)前圖像。因此,Pr(I|W)∝。
其中,wjt表示第t幀中關(guān)鍵點(diǎn)j的圖像位置,而hj(·;Y)表示圖像Y到關(guān)鍵點(diǎn)位置的概率分布的映射圖(稱為熱圖)。對(duì)于每個(gè)關(guān)鍵點(diǎn)j,其熱圖分布通過深度卷積神經(jīng)網(wǎng)絡(luò)CNN從訓(xùn)練數(shù)據(jù)中得到。
二、 模擬仿真
2.1 數(shù)據(jù)集的獲取
在網(wǎng)上尋找包含隧道開挖階段、隧道圍巖二襯階段施工等圖像的開源數(shù)據(jù)集,并對(duì)此進(jìn)行了機(jī)器學(xué)習(xí)和仿真模擬。
本文所有實(shí)驗(yàn)是在具備Intel i7 3.4G CPU,8G RAM,GeForce GTX Titan X 6GB GPU配置的臺(tái)式計(jì)算機(jī)上進(jìn)行的,大數(shù)據(jù)結(jié)構(gòu)采用Hadoop的Hbase列存儲(chǔ)。
2.2 評(píng)估矩陣
給定一組估計(jì)的三維關(guān)鍵點(diǎn)位置和同樣坐標(biāo)里對(duì)應(yīng)的地面實(shí)況位置,每關(guān)鍵點(diǎn)誤差定義為所有關(guān)鍵點(diǎn)的平均歐幾里得距離:
上述矩陣取決于所估計(jì)的結(jié)構(gòu)的絕對(duì)形狀,包括大小、平移和方向。針對(duì)本文方法得到的重建進(jìn)行縮放,使得平均長(zhǎng)度等于所有訓(xùn)練主體的平均值。
重建誤差定義為相似轉(zhuǎn)換決定的每個(gè)關(guān)鍵點(diǎn)的三維誤差:
其中指的是相似轉(zhuǎn)換,可以通過Procrustes方法獲得最優(yōu)參數(shù)。三維重建誤差廣泛用于從位移信息中恢復(fù)三維場(chǎng)景結(jié)構(gòu)領(lǐng)域,以期評(píng)估恢復(fù)后結(jié)果的準(zhǔn)確性。
正確部分百分比(PCP)定義為:
其中,xi和yi是第i個(gè)部分兩端點(diǎn)的坐標(biāo),和是對(duì)應(yīng)的估計(jì)值。和分別表示指示函數(shù)和閾值。PCP矩陣測(cè)量位置正確部分相對(duì)給定閾值的百分比。
2.3 隧道圍巖三維重建及可視化描述
本文所提出的重建算法可以在相當(dāng)大程度上通過利用形狀先驗(yàn)、整合時(shí)間平滑和模型化不確定性而修正誤差,并進(jìn)行圍巖三維重構(gòu)。
利用本文提出方法重建的每個(gè)三維形狀都縮放到使得其平均長(zhǎng)度等于訓(xùn)練形狀的平均長(zhǎng)度,然后根據(jù)根位置利用平移方法與圍巖現(xiàn)場(chǎng)圖像對(duì)齊。考慮了形狀和時(shí)間平滑先驗(yàn)后可以修正二維熱圖的誤差。每個(gè)圖給出了工程現(xiàn)場(chǎng)的六個(gè)可視化示例,從左到右的圖像對(duì)應(yīng)于原始圖像、熱圖圖像、根據(jù)熱圖響應(yīng)通過單獨(dú)定位每個(gè)關(guān)鍵點(diǎn)獲得的模型形狀、關(guān)鍵點(diǎn)空間化形狀、本文提出的EM算法重建模型形狀、在新視點(diǎn)中可視化的三維形狀模型結(jié)果。隧道圍巖三維重建可視化圖像如圖2和圖3所示。
可視化結(jié)果表明圍巖CNN三維重建具有很高的自由度和修復(fù)遮擋的特性,其視覺末端也易于定位。
同時(shí),利用在數(shù)據(jù)集上預(yù)先訓(xùn)練,又在數(shù)據(jù)集上進(jìn)一步微調(diào)的沙漏模型作為二維形狀探測(cè)器,使得結(jié)果有了很大改善。
三、結(jié)束語
本文提出了一種從二維圖像中重建三維形狀的方法,它是一種基于深度學(xué)習(xí)二維回歸算法和一種三維時(shí)間平滑先驗(yàn)方法的新型綜合應(yīng)用方法。這種算法中的對(duì)關(guān)鍵點(diǎn)的考慮,綜合了二維探測(cè)的判別式功能,三維形狀模型的表達(dá)性和通過整合時(shí)間信息的規(guī)則化方法。在實(shí)踐中,可以通過替換本文提出方法中的條件元素,方便地結(jié)合替代性關(guān)鍵點(diǎn)探測(cè)、形狀表示和時(shí)間模型。實(shí)驗(yàn)證實(shí)三維幾何先驗(yàn)和時(shí)間連貫性不僅有助于三維重建,還能改善二維關(guān)鍵點(diǎn)定位。通過圍巖圖像大數(shù)據(jù)集的模擬仿真,表明本文所提出的方法在準(zhǔn)確性、可視化等方面優(yōu)當(dāng)前工程使用的測(cè)量方法,具有良好的收斂性、多樣性和可擴(kuò)展性,可以有效解決此類復(fù)雜難題。
參? 考? 文? 獻(xiàn)
[1]劉九陽,楊鳳蕓. TM30測(cè)量機(jī)器人ATR功能的功效及精度[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版).2015.11(3):275-279.
[2]李鵬飛,趙勇. 基于現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)統(tǒng)計(jì)的隧道圍巖壓力分布規(guī)律研究[J]. 巖石力學(xué)與工程學(xué)報(bào).2013.07(2):1392-1399.