摘要:為了應(yīng)對海上開闊環(huán)境目標(biāo)檢測面臨的挑戰(zhàn),并致力于開發(fā)先進(jìn)的海上目標(biāo)檢測技術(shù),文章提出了一種基于深度學(xué)習(xí)框架YOLOv5的海上船舶自動檢測與識別技術(shù)。該技術(shù)具備實(shí)時檢測海上船舶等小目標(biāo)的能力,并且體積較小,克服了傳統(tǒng)目標(biāo)檢測技術(shù)在速度和性能上的限制。這項(xiàng)技術(shù)的應(yīng)用能夠有效提高航海運(yùn)輸、海上搜救和國防安全等領(lǐng)域的效率和可靠性。實(shí)驗(yàn)結(jié)果表明,文章提出的針對船舶視覺識別的方案快速而精準(zhǔn),能夠驗(yàn)證YOLOv5在船舶檢測中的重要價值,為相關(guān)領(lǐng)域的應(yīng)用提供了重要的支持和保障。
關(guān)鍵詞:海上;船舶;檢測;YOLOv5
中圖分類號:TP29文獻(xiàn)標(biāo)志碼:A
0引言
海上目標(biāo)檢測技術(shù)重要性顯而易見,其影響涵蓋多個方面。首先,該技術(shù)有助于監(jiān)測和識別海上活動,包括合法的航運(yùn)和潛在的安全威脅。其次,在海上搜救行動中,快速準(zhǔn)確地檢測到遇險船只或人員可以提高救援效率,減少生命損失。最后,隨著全球航運(yùn)業(yè)的增長,有效的目標(biāo)檢測技術(shù)可以幫助管理海上交通,避免船只相撞,確保航線的安全和高效運(yùn)行[1]。因此,研究和開發(fā)先進(jìn)的海上目標(biāo)檢測技術(shù)對于保障海上安全、提高海上作業(yè)效率和保護(hù)海洋環(huán)境都具有極其重要的價值。
傳統(tǒng)的船舶識別依賴船舶自動識別系統(tǒng)和雷達(dá)等通信導(dǎo)航設(shè)備,但隨著科技的進(jìn)步和隱形技術(shù)的應(yīng)用,這些方法的識別能力受到了一定的局限[2]。目前,基于深度學(xué)習(xí)的船舶識別方法已取得一定進(jìn)展[3]。這些方法通過自動提取船舶圖像特征并不斷學(xué)習(xí)和訓(xùn)練,可以在海上交通視頻和圖像中實(shí)現(xiàn)對船舶的準(zhǔn)確識別,具有代表性的模型包括Faster R-CNN[3]、SSD和YOLO等。這些基于深度學(xué)習(xí)的船舶識別方法在海上船舶小目標(biāo)檢測中具有積極意義,不僅提供了一種有效的解決方案,還為未來的研究方向和應(yīng)用實(shí)踐指明了方向。
1YOLOv5模型
YOLOv5是一種基于深度學(xué)習(xí)的目標(biāo)檢測算法,專注于快速、準(zhǔn)確地識別圖像或視頻中的目標(biāo)。相比于之前的版本,YOLOv5在檢測速度和準(zhǔn)確率方面均有顯著提升。這得益于YOLOv5采用了一種輕量級的網(wǎng)絡(luò)架構(gòu),同時結(jié)合了數(shù)據(jù)增強(qiáng)和模型優(yōu)化的技術(shù),在保持準(zhǔn)確性的同時大幅提升了檢測速度。YOLOv5在實(shí)際應(yīng)用中已取得較為顯著的成果,并在目標(biāo)檢測領(lǐng)域得到了廣泛的應(yīng)用。
YOLO檢測識別算法在物體識別領(lǐng)域已經(jīng)建立了成熟的體系[4-5]。從YOLOv1開始,通過直接擬合物體的坐標(biāo)位置(x,y)、寬度(w)、高度(h)以及置信度,實(shí)現(xiàn)了快速而準(zhǔn)確的識別。YOLOv2在此基礎(chǔ)上進(jìn)一步提高了識別速度和準(zhǔn)確性,并提出了聯(lián)合訓(xùn)練算法,能夠更精確地檢測物體的位置,同時增加分類的類別量和提升算法的健壯性。YOLOv3進(jìn)一步優(yōu)化了多尺度的預(yù)測過程,采用了更好的基礎(chǔ)分類網(wǎng)絡(luò),速度比傳統(tǒng)檢測算法快成百上千倍。隨著YOLOv4的推出,一種高效而強(qiáng)大的目標(biāo)檢測模型也得到了應(yīng)用。相較于YOLOv4在Tesla P100上實(shí)現(xiàn)了50 FPS檢測的基準(zhǔn)結(jié)果,YOLOv5具有更快的檢測速度(140 FPS)。目前,YOLO算法已經(jīng)進(jìn)行了多次迭代,并且研究者不斷推出各種改進(jìn)版本,以加快對各種具體事物的識別速度,應(yīng)對不同的情況。
在實(shí)驗(yàn)中,研究者觀察到損失和評價指標(biāo)的變化,這反映了模型訓(xùn)練的有效性和進(jìn)步。在訓(xùn)練階段,模型展現(xiàn)了逐步降低的損失曲線,包括邊界框損失(box_loss)、分類損失(cls_loss)以及目標(biāo)檢測損失(obj_loss)。這些指標(biāo)的變化顯示了模型在目標(biāo)定位、識別和分類能力上的顯著提升效果。具體而言,在訓(xùn)練集上,邊界框損失從一個較高的起始點(diǎn)迅速下降,并在隨后的訓(xùn)練周期內(nèi)穩(wěn)定在較低水平。分類損失的下降趨勢進(jìn)一步證實(shí)了模型在區(qū)分各種類別上的學(xué)習(xí)能力。在驗(yàn)證階段,研究者同樣觀察到,盡管存在一些波動,損失曲線呈下降趨勢,但總體趨勢仍然表明模型在驗(yàn)證數(shù)據(jù)集上具有良好的泛化能力。
在性能評價指標(biāo)方面,隨著訓(xùn)練周期的增加,精確度(Precision)和召回率(Recall)逐漸提高,表明模型對真實(shí)正樣本的檢測和正確分類的能力得到了加強(qiáng)。同時,綜合評價指標(biāo)mAP50和mAP50-95的提升表明了模型在多個閾值下的檢測性能都有所提升,這對于實(shí)際應(yīng)用中常見的各種尺寸和形狀的對象都具有重要意義。
為了更深入地評估YOLOv5模型在海上交通工具識別任務(wù)中的性能,本文繪制了精確度-召回率(P-R)曲線。這一評估標(biāo)準(zhǔn)特別適用于類別分布不均的數(shù)據(jù)集。在各個類別中,浮標(biāo)(Buoy)類別的識別性能明顯優(yōu)于其他類別。其P-R曲線幾乎與精確度線完全重合,即使在高召回率下也幾乎沒有下降,這表明模型對該類別的識別準(zhǔn)確性非常高。游輪(Cruise)類別同樣展現(xiàn)了出色的性能,大部分召回率范圍內(nèi)精確度保持較高水平,表明模型在識別游輪時具備較高的可靠性和完整性。相比之下,集裝箱船(Container)類別的P-R曲線較為陡峭,這反映在試圖提高召回率時,精確度會有顯著的降低,指示該類別在模型中存在精確度與召回率之間的權(quán)衡。魚雷艇(Fish-b)的性能處于中間水平,顯示在實(shí)現(xiàn)較高召回率的同時,精確度略有下降,這意味著模型對此類別的識別仍有改進(jìn)空間。而軍艦(Warship)類別展現(xiàn)了較為均衡的P-R曲線,盡管在高召回率區(qū)間精確度稍有下降,但總體而言,性能仍然理想。
2實(shí)驗(yàn)結(jié)果分析
本研究利用YOLOv5模型對海洋物體進(jìn)行分類,并構(gòu)建了標(biāo)準(zhǔn)化的混淆矩陣來評估模型的性能。本文在圖1所示混淆矩陣中進(jìn)行清晰的視覺展示,以說明模型在多個類別上的預(yù)測準(zhǔn)確性,包括“浮標(biāo)”(Buoy)“集裝箱”(Container)“游輪”(Cruise)“魚雷艇”(Fish-b)“軍艦”(Warship)以及“背景”(Background)。
由圖1可知,本文實(shí)驗(yàn)可以觀察到模型在“浮標(biāo)”類別的識別上表現(xiàn)出色,準(zhǔn)確率高達(dá)96%。“游輪”和“魚雷艇”類別的預(yù)測準(zhǔn)確率分別為94%和90%,而“軍艦”類別也有90%的高準(zhǔn)確率。這表明模型在這些類別上具有很強(qiáng)的辨識能力。然而,根據(jù)圖1,研究者也觀察到“背景”類別的誤判相對較多,這與背景場景的多樣性和復(fù)雜性有關(guān)。例如,“集裝箱”類別被誤判為“背景”的次數(shù)有37次,此外,“魚雷艇”類別有13次被誤判為“背景”。這些結(jié)果表明,本文模型在非目標(biāo)背景場景處理上還有待改進(jìn)。
總體而言,從混淆矩陣中對角線元素的高值可以看出,模型的整體預(yù)測準(zhǔn)確性很高。非對角線元素揭示了模型可能需要改進(jìn)的具體領(lǐng)域,尤其是在“集裝箱”和“背景”類別的分類上。通過這些實(shí)證數(shù)據(jù)的分析,本文可以為模型的進(jìn)一步優(yōu)化奠定基礎(chǔ),并強(qiáng)調(diào)了專注于提升“集裝箱”和“背景”類別分類性能的必要性。
在圖像檢測階段,模型展示了在復(fù)雜海洋環(huán)境中對各類船只進(jìn)行有效檢測的能力。模型能夠準(zhǔn)確地辨認(rèn)并界定集裝箱船、軍艦、漁船等多種船舶類別。本文使用彩色邊界框?qū)︻A(yù)測結(jié)果進(jìn)行編碼,邊界框內(nèi)的數(shù)字代表了模型預(yù)測的類別標(biāo)簽,如圖2所示。
3結(jié)語
本文探討了模型在不同類別和環(huán)境條件下的表現(xiàn),評估了數(shù)據(jù)不平衡對模型性能的影響。實(shí)驗(yàn)結(jié)果表明,模型在浮標(biāo)、游輪等類別的檢測上表現(xiàn)出色,準(zhǔn)確率和召回率均達(dá)到了較高水平。未來,研究者將繼續(xù)優(yōu)化模型、豐富數(shù)據(jù)集,并調(diào)整評估標(biāo)準(zhǔn)。特別是在數(shù)據(jù)采集方面,研究者計(jì)劃擴(kuò)大數(shù)據(jù)來源,增加小目標(biāo)的樣本量,以更好地適應(yīng)實(shí)際的海上監(jiān)控環(huán)境。此外,針對特定類別的高級數(shù)據(jù)增強(qiáng)技術(shù)和目標(biāo)檢測策略的應(yīng)用也將是未來研究的重點(diǎn)。
參考文獻(xiàn)
[1]李坤垚,郗潤平,連春艷.基于深度學(xué)習(xí)的海面目標(biāo)檢測方法研究[J].中國體視學(xué)與圖像分析,2019(4):352-364.
[2]楊雪鋒.基于船載紅外視頻分析的海盜船艇智能辨識方法研究[D].大連:大連海事大學(xué),2016.
[3]谷東亮,徐曉剛,金鑫.基于FasterR-CNN的海上艦船識別算法[J].圖像與信號處理,2018(3):136-141.
[4]趙文強(qiáng),孫巍.基于S4-YOLO的海上目標(biāo)檢測識別方法[J].光學(xué)與光電技術(shù),2020(4):38-46.
[5]李慶忠,徐相玉.基于改進(jìn)YOLOV3-Tiny的海面船艦?zāi)繕?biāo)快速檢測[J].計(jì)算機(jī)工程,2021(10):283-289.
(編輯王雪芬編輯)
Marine ship target detection based on deep learning
DONG" Song, WANG" Yisen, DING" Zixuan
(School of Intelligent Equipment Engineering, Wuxi Taihu University, Wuxi 214064, China)
Abstract: To address the challenges of target detection in the vast marine environment and develop advance marine target detection technology, this paper proposes a marine ship automatic detection and recognition technology based on the deep learning framework YOLOv5. The technology enables real-time detection of small targets such as marine ships, with a compact size that overcomes the speed and performance limitations of traditional target detection techniques. Its application can effectively enhance efficiency and reliability in marine transportation, marine search and rescue, and national defense security fields. The experimental results demonstrate that the proposed solution for ship visual recognition is both rapid and accurate, confirming the significant value of YOLOv5 in ship detection and providing crucial support and assurance for relevant applications.
Key words: marine; ships; detection; YOLOv5