摘要:水利工程施工進(jìn)度是工程建設(shè)方關(guān)注的重要事項(xiàng)。為實(shí)現(xiàn)水閘工程的智慧化建設(shè),基于BIM技術(shù)和圖像識(shí)別技術(shù)提出了一種虛實(shí)結(jié)合的閘墩澆筑高度識(shí)別方法。通過(guò)BIM技術(shù)建模,生成了包含不同閘墩澆筑高度的虛擬圖像數(shù)據(jù)集;利用深度學(xué)習(xí)的目標(biāo)檢測(cè)算法YOLOv5對(duì)虛擬數(shù)據(jù)集進(jìn)行訓(xùn)練,得到能準(zhǔn)確識(shí)別不同澆筑高度閘墩的智能模型。在實(shí)驗(yàn)室搭建具有不同澆筑高度的閘墩模型,通過(guò)攝像機(jī)拍攝獲取不同高度閘墩的實(shí)景圖像,再利用該智能識(shí)別模型對(duì)實(shí)景圖像進(jìn)行驗(yàn)證。研究結(jié)果表明,該模型能夠準(zhǔn)確識(shí)別實(shí)際場(chǎng)景中閘墩的澆筑高度,可廣泛應(yīng)用于水利工程主體建筑物的實(shí)際施工進(jìn)度識(shí)別,為數(shù)字孿生水利工程建設(shè)提供有效的模型支持。
關(guān) 鍵 詞:水閘閘墩; BIM; YOLOv5; 計(jì)算機(jī)視覺(jué)技術(shù); 深度學(xué)習(xí)
中圖法分類號(hào): TV511
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2024.09.032
0 引 言
水閘閘墩是支撐閘門(mén)和上部結(jié)構(gòu)的重要建筑物,為確保安全運(yùn)行,需嚴(yán)格控制施工進(jìn)度和質(zhì)量,尤其是澆筑高度的控制至關(guān)重要。對(duì)于大體積閘墩,多采用分層澆筑,以減少裂縫和加快施工進(jìn)度[1]。在澆筑過(guò)程中,混凝土流動(dòng)性差、熱脹冷縮、模具變形等導(dǎo)致閘墩高度不足或者超高問(wèn)題。必須通過(guò)有效的管理措施,嚴(yán)格控制水閘閘墩的每次澆筑高度。除使用模板來(lái)控制分層澆筑高度,傳感器技術(shù)也被應(yīng)用于此,例如方宏偉等人發(fā)明了基于壓力傳感的混凝土澆筑高度控制桿[2],但采用有線方式采集數(shù)據(jù),可能會(huì)引起施工不便和干擾。因此,探索采集非接觸方式的建筑信息模型(Building Information Modeling,BIM)和圖像識(shí)別技術(shù)來(lái)進(jìn)行閘墩澆筑高度識(shí)別是有意義的,這種方法可以提供更高的準(zhǔn)確性和可追溯性,同時(shí)也有提高施工效率的潛力。另外,它還可以減少人為操作帶來(lái)的誤差并且降低人工成本。
BIM技術(shù)可將施工計(jì)劃和進(jìn)度表現(xiàn)為三維數(shù)字模型。王勝軍采用BIM技術(shù)將施工信息高效整合,通過(guò)不同階段的比對(duì),實(shí)現(xiàn)施工進(jìn)度的控制和管理[3]。李瑛等用循環(huán)網(wǎng)絡(luò)建立圍堰施工運(yùn)輸仿真模型,結(jié)合BIM技術(shù)實(shí)現(xiàn)優(yōu)化方案施工可視化[4]。陳麗芳借助BIM技術(shù)促進(jìn)設(shè)計(jì)與施工一體化,通過(guò)對(duì)上海市張涇河南延伸整治工程的研究,驗(yàn)證了設(shè)計(jì)BIM模型在施工階段應(yīng)用的可行性[5]。李成等通過(guò)BIM技術(shù),在都勻市大河水庫(kù)工程施工中實(shí)現(xiàn)了施工布置、場(chǎng)地規(guī)劃、工藝模擬和4D仿真等應(yīng)用[6]。因此,BIM技術(shù)的數(shù)字化建模能力可助力水利工程施工進(jìn)度控制。
圖像識(shí)別技術(shù)涵蓋分類、目標(biāo)檢測(cè)和圖像分割。水利行業(yè)中,此技術(shù)主要應(yīng)用在三維預(yù)測(cè)、水位監(jiān)測(cè)、河道流速測(cè)量、遙感水體識(shí)別等[7]。趙薛強(qiáng)等研發(fā)無(wú)人機(jī)巡檢系統(tǒng),利用圖像識(shí)別等技術(shù)提高水利工程監(jiān)管效率,實(shí)現(xiàn)巡檢數(shù)據(jù)實(shí)時(shí)可視化,為防汛和監(jiān)管提供強(qiáng)有力支持[8]。其中,目標(biāo)檢測(cè)旨在識(shí)別并定位圖像或視頻中的特定物體。自2014年R.Girshick就R-CNN提出“兩階段檢測(cè)”后,出現(xiàn)了SPP、Fast R-CNN、Faster R-CNN、FPN等方法[9-13]。2015年后,基于深度學(xué)習(xí)的一階段目標(biāo)檢測(cè)器如YOLO、RetinaNet相繼涌現(xiàn)[14]。常見(jiàn)算法見(jiàn)表1。
1 YOLO算法
YOLO是一種高效、快速、準(zhǔn)確的實(shí)時(shí)目標(biāo)檢測(cè)算法,已廣泛應(yīng)用于多個(gè)領(lǐng)域。Zhang等采用YOLOv3算法,自制數(shù)據(jù)集,結(jié)合預(yù)訓(xùn)練權(quán)重和Focal loss,優(yōu)化橋梁病害檢測(cè)效果[15]。向偉等使用YOLOv4模型訓(xùn)練檢測(cè)含硫天然氣中的火焰和煙霧,平均精度達(dá)99.62%,為井站火災(zāi)預(yù)警和救援偵察提供新方法[16]。張楠楠等在YOLOv7基礎(chǔ)上,引入CBAM注意力機(jī)制,顯著提高了對(duì)黃萎病、棉盲蝽、紅蜘蛛棉葉病蟲(chóng)害圖像的檢測(cè)準(zhǔn)確率[17]。其中,YOLOv5是一種輕量級(jí)網(wǎng)絡(luò)結(jié)構(gòu),采用自適應(yīng)多尺度訓(xùn)練和各種數(shù)據(jù)增強(qiáng)技術(shù),以提高模型的魯棒性和泛化性[18-19],整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)可以分為3個(gè)主要部分:Backbone主干層、Neck特征融合層和Head檢測(cè)層[20]。
YOLOv5使用多種算法和技術(shù)來(lái)提高模型性能。數(shù)據(jù)增強(qiáng)方面,采用Mosaic、CutMix和MixUp等技術(shù)來(lái)豐富訓(xùn)練集;采用組合損失函數(shù)進(jìn)行優(yōu)化,包括交叉熵?fù)p失和L1損失;超參數(shù)方面采用多尺度訓(xùn)練、自適應(yīng)步長(zhǎng)調(diào)整等技術(shù),同時(shí)使用小批量隨機(jī)梯度下降(mini-batch stochastic gradient descent)和動(dòng)量?jī)?yōu)化器(momentum optimizer)等訓(xùn)練技巧。評(píng)價(jià)指標(biāo)方面,使用PmA和F1-score來(lái)評(píng)估模型性能。相應(yīng)的計(jì)算公式如下:
交叉熵?fù)p失函數(shù):
LCE=-1NNi=1Cj=1yijlgy^ij+1-yijlg1-y^ij(1)
式中:N為訓(xùn)練樣本數(shù),C為類別數(shù),yij表示第i個(gè)樣本的第j個(gè)類別是否存在,y^ij為網(wǎng)絡(luò)預(yù)測(cè)的該類別存在的概率。
L1損失函數(shù):
L1=Ni=1j∈{xywh}yij-y^ij(2)
式中:j表示邊界框的4個(gè)坐標(biāo)(中心點(diǎn)x,y和寬高w,h)。
PmA:
PA=∫10P(R)dR(3)
PmA=1nni=1PAi(4)
F1:
F1=2(P×R)/(P+R)(5)
式中:PA表示單個(gè)檢測(cè)類別的精度;P表示所有被預(yù)測(cè)為正的樣本中實(shí)際為正樣本的概率;R表示實(shí)際為正的樣本中被預(yù)測(cè)為正樣本的概率;PmA表示所有檢測(cè)類別的平均精度。
模型評(píng)價(jià)指標(biāo)見(jiàn)表2。
2 水閘閘墩施工進(jìn)度控制
準(zhǔn)確及時(shí)了解閘墩的澆筑高度是水利工程施工中不可或缺的一項(xiàng)任務(wù),它對(duì)工程的進(jìn)度和質(zhì)量具有重要的影響。本文利用BIM技術(shù)創(chuàng)建閘墩的三維模型,并設(shè)置不同的高度參數(shù),根據(jù)施工組織設(shè)計(jì)得到閘墩在不同高度下的虛擬圖像集合;然后,通過(guò)應(yīng)用基于圖像識(shí)別技術(shù)的目標(biāo)檢測(cè)算法YOLOv5分析學(xué)習(xí)虛擬圖像,得到能夠識(shí)別閘墩澆筑高度的智能識(shí)別模型;最后,在實(shí)驗(yàn)室制作閘墩模型獲取閘墩實(shí)際澆筑高程圖片集合,再用訓(xùn)練好的算法模型對(duì)閘墩實(shí)際澆筑高程圖像集進(jìn)行檢測(cè),從而預(yù)測(cè)閘墩在施工過(guò)程中的高度。
2.1 閘墩澆筑高程虛景圖像
使用Revit和Lumion軟件對(duì)水閘閘墩進(jìn)行建模和渲染。在Revit中進(jìn)行建模,并將其導(dǎo)入Lumion進(jìn)行渲染。調(diào)整太陽(yáng)高度、亮度和物體材質(zhì)等參數(shù),以盡可能準(zhǔn)確地還原實(shí)驗(yàn)室場(chǎng)景,如圖1。然后在Lumion中調(diào)整攝像機(jī)的角度和高度,使其與實(shí)驗(yàn)室場(chǎng)景一致,并錄制視頻,生成閘墩澆筑高度變化的虛景圖像集。
2.2 閘墩澆筑高程實(shí)景圖像
作為方法研究及模型驗(yàn)證,本文采用在實(shí)驗(yàn)室搭建實(shí)體模型的方法來(lái)獲取閘墩澆筑高度實(shí)景圖像集。根據(jù)某水閘閘墩實(shí)際尺寸按1∶5比例縮放,尺寸見(jiàn)圖2。采用XPS擠塑料板作為模型制作材料,按圖2尺寸進(jìn)行切割,每2塊粘貼后作為一個(gè)閘墩模型單元,厚度10 cm,并在中間高度位置粘貼2 cm寬紅色膠帶作為識(shí)別標(biāo)記,見(jiàn)圖3。通過(guò)疊加不同的閘墩模型單元,可以模擬閘墩澆筑到不同高程的狀態(tài),同時(shí)通過(guò)攝像機(jī)記錄不同高程的視頻圖像,見(jiàn)圖4。
2.3 虛實(shí)結(jié)合對(duì)比中的關(guān)鍵問(wèn)題
在利用虛景圖像集進(jìn)行閘墩澆筑高度識(shí)別模型訓(xùn)練時(shí),可能會(huì)遇到類別數(shù)量分布不均勻和數(shù)據(jù)集多樣性不足的問(wèn)題。為了解決這些問(wèn)題,可以在制作標(biāo)簽時(shí)每類取同等數(shù)量的照片,并且進(jìn)行數(shù)據(jù)增強(qiáng)和遷移學(xué)習(xí)。同時(shí),虛景和實(shí)景之間存在微小差異,如色彩、紋理和環(huán)境光照度等問(wèn)題,這里選用YOLOv5算法,并優(yōu)化預(yù)處理算法,以便更好地觀察虛實(shí)物體的角度和距離微差,從而更好地處理虛實(shí)差異性問(wèn)題。
3 基于YOLOv5算法的閘墩高度識(shí)別
考慮到施工現(xiàn)場(chǎng)的復(fù)雜環(huán)境和噪音干擾,采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法YOLOv5。以下為基于此算法進(jìn)行閘墩識(shí)別的流程,如圖5所示。
oHXN31jUSz+HEIZXRhafHQ==3.1 數(shù)據(jù)集準(zhǔn)備
對(duì)于YOLOv5算法來(lái)說(shuō),所有虛景照片中的每一根紅色條帶都為相同目標(biāo),所以檢測(cè)類別為單類別。但是虛景照片因?yàn)榧t色條帶的數(shù)量不同,共分為10類,即10個(gè)不同高度。通過(guò)Labelming軟件對(duì)不同類別同等數(shù)量的圖片作出標(biāo)注便可解決數(shù)據(jù)集類別分布不均勻的問(wèn)題。標(biāo)注后生成僅包含一個(gè)類別“red”標(biāo)注信息的xml文件。利用鏡像、模糊、亮度調(diào)整、旋轉(zhuǎn)等方式擴(kuò)充數(shù)據(jù)集和模擬真實(shí)環(huán)境,并轉(zhuǎn)換成模型訓(xùn)練所需的文件格式(txt格式)。將數(shù)據(jù)集劃分為訓(xùn)練集(80%)和驗(yàn)證集(20%)集,制作可供模型訓(xùn)練的數(shù)據(jù)集coco.yaml。變換方式見(jiàn)表3。數(shù)據(jù)集照片見(jiàn)圖6。
3.2 模型選擇及訓(xùn)練
采用官網(wǎng)預(yù)先訓(xùn)練好的yoyo5s.pt輕量級(jí)模型,并使用處理過(guò)后的數(shù)據(jù)集進(jìn)行遷移學(xué)習(xí)。模型訓(xùn)練時(shí),設(shè)置每批處理尺寸為16,模型訓(xùn)練迭代次數(shù)為200,預(yù)設(shè)一組超參數(shù)并自動(dòng)進(jìn)行超參數(shù)調(diào)優(yōu)。訓(xùn)練時(shí),模型會(huì)通過(guò)Mosaic數(shù)據(jù)增強(qiáng)技術(shù),將4張隨機(jī)選取的訓(xùn)練圖像組合成一張新的訓(xùn)練圖像,見(jiàn)圖7。圖上的檢測(cè)框?yàn)閷?shí)際邊界框(真實(shí)框),0表示類別“red”。
3.3 模型評(píng)價(jià)
通過(guò)對(duì)不同超參數(shù)訓(xùn)練的模型進(jìn)行評(píng)價(jià),可得到最優(yōu)模型。評(píng)價(jià)指標(biāo)見(jiàn)圖8。
在本次研究中,考慮采用平均精度PmA對(duì)模型進(jìn)行評(píng)價(jià)。由PmA曲線圖可以看出,模型在訓(xùn)練初期很快收斂。說(shuō)明模型在前幾輪訓(xùn)練中學(xué)習(xí)到了大量的特征,使其能夠很快地準(zhǔn)確地識(shí)別目標(biāo)。隨著訓(xùn)練次數(shù)的增加,模型在優(yōu)化參數(shù)和減小損失方面變得越來(lái)越困難,因此在訓(xùn)練后期,PmA值的增長(zhǎng)速度會(huì)變得緩慢。PmA_0.5和PmA_0.5:0.95為常用的兩種指標(biāo),分別表示置信度閾值為0.5和0.5~0.95的平均精度均值。兩個(gè)指標(biāo)的變化趨勢(shì)類似,其中在閾值為0.5的時(shí)候,PmA曲線最終趨近于0.995,說(shuō)明模型在不同的值下都能夠達(dá)到較高的檢測(cè)精度,即模型正確分類閘墩高度的能力和檢測(cè)出所有閘墩上紅色條帶的能力很強(qiáng)。同樣,模型的精度和召回率都很快收斂并且都趨近于1,表明訓(xùn)練的模型在閘墩檢測(cè)任務(wù)表現(xiàn)出了很高的準(zhǔn)確性和可靠性。在3類損失上,box_loss和obj_loss曲線快速下降并趨近于0,表明模型在訓(xùn)練過(guò)程中能夠準(zhǔn)確地識(shí)別和定位圖像中的目標(biāo)對(duì)象,并且有效地減少了誤檢和漏檢的情況,模型表現(xiàn)出了較高的穩(wěn)定性和魯棒性,能夠適應(yīng)不同的數(shù)據(jù)集和環(huán)境。而cls_loss恒為0是因?yàn)橹挥小癛ed”這一個(gè)類別。綜上,該模型是一個(gè)優(yōu)秀的模型,能夠準(zhǔn)確識(shí)別出紅色條帶。
3.4 模型驗(yàn)證
使用已訓(xùn)練好的YOLOv5模型對(duì)實(shí)景照片進(jìn)行檢測(cè),并新增了紅色條數(shù)和高度信息的輸出。這些信息通過(guò)計(jì)算檢測(cè)框數(shù)量獲得,并在圖像左上角顯示,以便用戶查看??梢园l(fā)現(xiàn)預(yù)測(cè)結(jié)果與實(shí)際情況相符,證明了模型的準(zhǔn)確性和有效性,如圖9所示。
4 結(jié) 語(yǔ)
本文利用YOLOv5算法進(jìn)行閘墩澆筑高度圖像識(shí)別,通過(guò)實(shí)驗(yàn)表明該技術(shù)具有較高的識(shí)別精度。同時(shí),本文還采用BIM技術(shù)模擬水工建筑物施工過(guò)程,獲取虛擬圖像集,并利用圖像識(shí)別技術(shù)對(duì)其進(jìn)行訓(xùn)練得到識(shí)別模型。此模型能夠?qū)?shí)際施工過(guò)程中采集的圖像進(jìn)行識(shí)別,從而實(shí)現(xiàn)對(duì)施工進(jìn)度的監(jiān)測(cè)。這一研究思路具有廣泛的推廣應(yīng)用價(jià)值,可為水利工程領(lǐng)域提供一種新的數(shù)字化施工管理方法,實(shí)現(xiàn)更高效、精準(zhǔn)的施工進(jìn)度監(jiān)測(cè)。
參考文獻(xiàn):
[1] 譚峰屹,何坦,郭留鋒,等.長(zhǎng)江流域水閘工程安全運(yùn)行專項(xiàng)監(jiān)督檢查分析[J].人民長(zhǎng)江,2023,54(增1):25-28.
[2] 方宏偉,王寬,李路平,等.一種基于壓力傳感的混凝土分層澆筑高度控制桿:CN215803295U[P].2022-02-11.
[3] 王勝軍.BIM4D虛擬建造在施工進(jìn)度管理中的應(yīng)用[J].人民黃河,2019,41(3):145-149.
[4] 李瑛,林楚凌,惠建偉,等.邕寧水利樞紐一期臨時(shí)土石圍堰施工仿真及BIM可視化[J].中國(guó)農(nóng)村水利水電,2020(5):92-97,102.
[5] 陳麗芳.主流BIM平臺(tái)在水利工程設(shè)計(jì)施工中的應(yīng)用研究[J].人民長(zhǎng)江,2021,52 (2):128-131,136.
[6] 李成,王奮,江濤.BIM技術(shù)在大河水庫(kù)工程施工階段中的應(yīng)用[J].水電站機(jī)電技術(shù),2021,44(3):78-81.
[7] 李濤,徐高,梁思涵,等.人工智能圖像識(shí)別在水利行業(yè)的應(yīng)用進(jìn)展[J].人民黃河,2022,44(11):163-168.
[8] 趙薛強(qiáng),凌峻.無(wú)人機(jī)自動(dòng)巡檢智慧監(jiān)控系統(tǒng)研究與應(yīng)用[J].人民長(zhǎng)江,2022,53 (6):235-241.
[9] GIRSHICK R,DONAHUE J,DARRELL T,et al.Region-based convolutional networks for accurate object detection and segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,38 (1):142-158.
[10]HE K,ZHANG X,REN S,et al.Spatial pyramid pooling in deep convolutional networks for visual recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37 (9):1904-1916.
[11]GIRSHICK R.Fast r-cnn[C]∥Proceedings of the IEEE international conference on computer vision,2015:1440-1448.
[12]REN S,HE K,GIRSHICK R,et al.Faster R-CNN:towards real-time object detection with region proposal networks[C]∥IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,39 (6):1137-1149.
[13]LIN T-Y,DOLLR P,GIRSHICK R,et al.Feature pyramid networks for object detection[C]∥Proceedings of the IEEE conference on computer vision and pattern recognition,2017:2117-2125.
[14]REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:Unified,real-time object detection[C]∥Proceedings of the IEEE conference on computer vision and pattern recognition,2016:779-788.
[15]ZHANG C,CHANG C,JAMSHIDI M.Concrete bridge surface damage detection using a single4S4T1aUKUIJh3nX/fqK/3cu+5TbsCvN6LRqmZTSvFXw= stage detector[J].Computer Aided Civil and Infrastructure Engineering,2020,35(4):389-409.
[16]向偉,龔云洋,李華昌,等.YOLO V4模型在含硫井站火焰和煙霧檢測(cè)中的應(yīng)用[J].機(jī)械設(shè)計(jì)與制造,2024(1):261-264.
[17]張楠楠,張曉,白鐵成,等.基于CBAM-YOLO v7的自然環(huán)境下棉葉病蟲(chóng)害識(shí)別方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(增1):239-244.
[18]楊鋒,丁之桐,邢蒙蒙,等.深度學(xué)習(xí)的目標(biāo)檢測(cè)算法改進(jìn)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2023,59(11):1-15.
[19]段升位,程欣宇,王浩舟,等.基于改進(jìn)的YOLOv5的大壩表面病害檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用,2023,43(8):2619-2629.
[20]王洪義,孔梅梅,徐榮青.基于改進(jìn)YOLOV5的火焰檢測(cè)算法[J].計(jì)算機(jī)與現(xiàn)代化,2023(1):103-107.
(編輯:鄭 毅)
Intelligent identification method of pouring height of sluice pier based on BIM and YOLOv5
LIU Yiwei1,CHEN Mingxuan1,NIU Zhiwei1,DING Yi2,CHEN Rong3
(1.College of Water Resources and Hydropower,Hohai University,Nanjing 210098,China; 2.Nanjing Hongyuan Information Technology Co.,Ltd.,Nanjing 210000,China; 3.Yizheng Municipal Water Conservancy Bureau,Yangzhou 225000,China)
Abstract:
The construction schedule of water conservancy projects is an important matter of great concern to the construction parties.Based on BIM technology and image recognition technology,this paper proposed a virtual and real combining method for pouring height recognition of sluice piers,so as to realize the intelligent construction of sluice projects.Through BIM technology modeling,virtual image data sets containing different pouring heights of gate piers were generated.The object detection algorithm YOLOv5 of deep learning was used to train the virtual data set,and an intelligent model of accurately identifying piers with different pouring heights was obtained.The real pier models with different pouring heights were built in the laboratory,and the real images of the piers with different heights were captured by the camera and verified by the established intelligent recognition model.The results showed that the model can accurately identified the pouring heights of piers in actual scenes.This method can be widely used to identify the actual construction progress of buildings in hydraulic engineering,and provide effective model support for the construction of digital twin hydraulic engineering.
Key words:
sluice pier; BIM; YOLOv5; computer vision technology; deep learning