靳澤園,田 楓,劉 芳,于巾濤,盧 俊,徐 昕
(東北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)
油田生產(chǎn)作業(yè)是高風(fēng)險(xiǎn)行業(yè),在生產(chǎn)中原油有毒有害,一旦遇到高溫高壓就會(huì)發(fā)生爆炸。而實(shí)際采油時(shí)環(huán)境較為惡劣,加上機(jī)器運(yùn)作時(shí)本身溫度就高,一旦作業(yè)現(xiàn)場(chǎng)出現(xiàn)原油泄漏,就很容易發(fā)生爆炸,這對(duì)油田作業(yè)造成極大的安全隱患。目前,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法已經(jīng)應(yīng)用于生活中的方方面面,像人臉識(shí)別、車牌識(shí)別等。為了保障油田作業(yè)現(xiàn)場(chǎng)安全生產(chǎn),本文將基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法應(yīng)用于漏油識(shí)別問題中。
國(guó)外的原油泄漏研究大多是針對(duì)海上溢油檢測(cè)方面的研究,如Calla等人使用衛(wèi)星上的多頻微波傳感器來測(cè)量海面上溢油的程度以及海面上漏油的厚度[1]。而針對(duì)陸地油田石油的漏油檢測(cè)研究卻較少。
關(guān)于油田遠(yuǎn)程視頻監(jiān)控,國(guó)內(nèi)栗生亞[2]認(rèn)為由于油田生產(chǎn)管理大多是采用人工管理的方式,管理工序多且需要分工不間斷值守,但不能保障所有工序每時(shí)每刻都有人值守,容易產(chǎn)生安全隱患且效率低下,引入油田視頻監(jiān)控系統(tǒng)可提高生產(chǎn)效率和安全生產(chǎn)的可靠性。大多數(shù)油田所采用的遠(yuǎn)程視頻監(jiān)控系統(tǒng),需要利用傳感器采集數(shù)據(jù),如安裝壓力變送器和流量計(jì)來采集油井內(nèi)的壓力、流量等信息數(shù)據(jù),再通過無線傳輸網(wǎng)絡(luò)進(jìn)行信息通信,進(jìn)而將現(xiàn)場(chǎng)情況反饋給監(jiān)控室以了解采油設(shè)備的工作狀態(tài)。密超[3]的視頻監(jiān)控技術(shù)在油田生產(chǎn)中的應(yīng)用研究,提到由于油井、計(jì)量間等主要分布在野外,工作人員要耗時(shí)耗力去現(xiàn)場(chǎng)了解油田作業(yè)區(qū)的狀況,所以有遠(yuǎn)程實(shí)時(shí)監(jiān)控的需求。隨著科學(xué)技術(shù)的不斷進(jìn)步,油田企業(yè)會(huì)讓生產(chǎn)管理更加信息化、科學(xué)化、智能化,遠(yuǎn)程視頻監(jiān)控系統(tǒng)在油田中的應(yīng)用不斷增多。邢智偉等人[4]總結(jié)分析了油田在生產(chǎn)過程中,油田的數(shù)字化建設(shè)將會(huì)成為主要方向,對(duì)突發(fā)性問題能夠?qū)崟r(shí)、快速、準(zhǔn)確地處理。
本文提出了基于YOLOv5算法的油田作業(yè)現(xiàn)場(chǎng)漏油識(shí)別方法。首先自主拍攝室內(nèi)、室外2個(gè)場(chǎng)景的漏油數(shù)據(jù)集,并利用數(shù)據(jù)增強(qiáng)方式擴(kuò)充數(shù)據(jù)集,然后將處理好的數(shù)據(jù)輸入到Y(jié)OLOv5的4種預(yù)訓(xùn)練網(wǎng)絡(luò)中訓(xùn)練,保存最優(yōu)的訓(xùn)練權(quán)重?cái)?shù)據(jù),并用作測(cè)試集測(cè)試。測(cè)試結(jié)果表明,所用算法模型的檢測(cè)速度和準(zhǔn)確性都達(dá)到了油田作業(yè)現(xiàn)場(chǎng)的要求,并成功通過了功能測(cè)試和性能測(cè)試。
YOLOv5(You Only Look Once)是由 Ultralytics LLC公司于2020年提出,模型最快的目標(biāo)檢測(cè)速度可達(dá)到0.007 s,即每秒可處理140幀,滿足油田作業(yè)現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)的需求[5]。其整體的網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。
YOLOv5算法的整體網(wǎng)絡(luò)結(jié)構(gòu)分為Input、Backbone、Neck、Prediction 4 個(gè)主要部分[6]。Input端采用YOLOv4中的Mosaic方式做數(shù)據(jù)增強(qiáng)處理。Backbone主干網(wǎng)絡(luò)指的是提取特征網(wǎng)絡(luò),其作用是提取圖片中的信息,以供后面的網(wǎng)絡(luò)使用。Neck部分是放在Backbone和Prediction之間的,是為了更好地利用Backbone提取的特征。Prediction是獲取網(wǎng)絡(luò)輸出內(nèi)容的網(wǎng)絡(luò),利用之前提取的特征,以GIoU Loss作為bounding box的損失,并使用二進(jìn)制交叉熵函數(shù)計(jì)算類概率,以及使用Logits損失計(jì)算目標(biāo)得分的損失,最終做出綜合預(yù)測(cè)。
本文中漏油識(shí)別算法以YOLOv5為檢測(cè)模型,首先通過攝像頭采集并標(biāo)注相關(guān)數(shù)據(jù)集,針對(duì)作業(yè)現(xiàn)場(chǎng)存在工作人員頭發(fā)等干擾樣本,采用負(fù)樣本對(duì)比的方法提高算法精度;其次將數(shù)據(jù)集送入YOLOv5網(wǎng)絡(luò)的4種預(yù)訓(xùn)練模型中進(jìn)行訓(xùn)練,通過對(duì)比檢測(cè)速度、精度及召回率得到最佳權(quán)重?cái)?shù)據(jù);最后將最佳權(quán)重文件部署到作業(yè)現(xiàn)場(chǎng),得到最終的油田作業(yè)現(xiàn)場(chǎng)漏油檢測(cè)模型。具體的算法流程如圖2所示。
數(shù)據(jù)集是深度學(xué)習(xí)任務(wù)中最基本且最重要的一部分,一個(gè)模型對(duì)于不同的數(shù)據(jù)集,訓(xùn)練出的結(jié)果也會(huì)有所差異,數(shù)據(jù)集的好壞還會(huì)影響模型的性能。對(duì)于目標(biāo)檢測(cè)任務(wù),更需要大量的數(shù)據(jù)集作為網(wǎng)絡(luò)的輸入。太少的數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò),容易發(fā)生過擬合;太多的數(shù)據(jù)集,容易造成數(shù)據(jù)冗余,增加網(wǎng)絡(luò)計(jì)算量。
本文的數(shù)據(jù)集首先通過室內(nèi)、室外監(jiān)控?cái)z像頭拍攝漏油視頻,其次利用Python截取室內(nèi)、室外2個(gè)場(chǎng)景下的漏油數(shù)據(jù)集,最后通過數(shù)據(jù)增強(qiáng)的方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)增。數(shù)據(jù)集標(biāo)注采用LabelImg軟件對(duì)整個(gè)數(shù)據(jù)集中每個(gè)圖像進(jìn)行人工標(biāo)注,標(biāo)注樣本如圖3所示。標(biāo)注后生成的是遵循PASCAL VOC格式的XML文件,訓(xùn)練時(shí)YOLOv5不能直接提取XML文件,而是將中心點(diǎn)的坐標(biāo)即標(biāo)注框的寬和高以偏移量的方式存儲(chǔ)到TXT文件中,使得訓(xùn)練時(shí)可以忽略不同圖像的尺寸。最終數(shù)據(jù)集的總量為6566張,其中訓(xùn)練集5850張,測(cè)試集650張,驗(yàn)證集66張。
訓(xùn)練平臺(tái)的參數(shù)配置越高,圖形計(jì)算能力越強(qiáng),模型訓(xùn)練的效果則會(huì)越好。為了使模型達(dá)到良好的訓(xùn)練效果,在GPU上對(duì)YOLOv5網(wǎng)絡(luò)的4個(gè)預(yù)訓(xùn)練模型分別進(jìn)行訓(xùn)練。本次實(shí)驗(yàn)在Intel Core i7 6700處理器,主頻為4 GHz,內(nèi)存為32 G,顯卡型號(hào)為GeForce RTX 3080的PC機(jī)上進(jìn)行,在Ubuntu18.04環(huán)境下利用深度學(xué)習(xí)框架Pytorch對(duì)YOLOv5模型進(jìn)行訓(xùn)練與測(cè)試。訓(xùn)練模型的參數(shù)設(shè)置如表1所示。
表1 訓(xùn)練平臺(tái)配置Tab.1 Training platform configuration
YOLOv5共有4種預(yù)訓(xùn)練模型,分別為YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,每種預(yù)訓(xùn)練模型的深度和寬度不同,所以在數(shù)據(jù)集上的表現(xiàn)會(huì)有所不同。為了選取精度較高和實(shí)時(shí)性較快的檢測(cè)模型,本文在相同數(shù)據(jù)集條件下,分別在YOLOv5的4種預(yù)訓(xùn)練模型中進(jìn)行了訓(xùn)練,對(duì)比結(jié)果如表2所示。
表2 不同模型效果對(duì)比Tab.2 Comparison of different models
通過對(duì)比結(jié)果發(fā)現(xiàn),YOLOv5s模型用時(shí)最短,檢測(cè)速度最快,但YOLOv5m與之相差不大。YOLOv5m模型的精度最高,達(dá)到了94%,且YOLOv5m模型的精準(zhǔn)率相對(duì)于YOLOv5s模型、YOLOv5l模型和YOLOv5x模型分別高出0.10、0.05和0.02個(gè)百分點(diǎn)。4種模型對(duì)于同一場(chǎng)景下的漏油檢測(cè)樣例如圖4所示。
由圖4可以看出,該模型能夠檢測(cè)到室內(nèi)場(chǎng)景中的小目標(biāo)漏油,并且具有一定識(shí)別精度,其中YOLOv5l、YOLOv5m、YOLOv5s、YOLOv5x 4種模型的檢測(cè)精度分別為0.87、0.93、0.89、0.91。綜合上述模型的精度和速度分析,本文選用YOLOv5m模型訓(xùn)練,能得到最佳權(quán)重?cái)?shù)據(jù),所得出的數(shù)據(jù)可作為油田作業(yè)現(xiàn)場(chǎng)漏油識(shí)別模型的權(quán)重?cái)?shù)據(jù)。
為了保障油田作業(yè)現(xiàn)場(chǎng)安全生產(chǎn),本文提出了一種基于YOLOv5的油田作業(yè)現(xiàn)場(chǎng)漏油識(shí)別模型。首先對(duì)采集的數(shù)據(jù)集進(jìn)行預(yù)處理以及數(shù)據(jù)集標(biāo)注,然后通過YOLOv5的4種預(yù)訓(xùn)練模型分別進(jìn)行訓(xùn)練,最后對(duì)比性能結(jié)果和檢測(cè)效果得到最優(yōu)權(quán)重?cái)?shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,YOLOv5m模型更適用于本文制作的漏油數(shù)據(jù)集,檢測(cè)準(zhǔn)確率達(dá)到了94.2%,能夠監(jiān)控油田作業(yè)現(xiàn)場(chǎng)區(qū)域內(nèi)原油泄漏情況,并進(jìn)行實(shí)時(shí)、準(zhǔn)確、穩(wěn)定檢測(cè)。