張訓(xùn)源 王華超 吳慶海 蔡喜光
(1.威海海洋職業(yè)學(xué)院 機電工程系,威海 264300;2.威海市智慧海洋漁業(yè)裝備工程技術(shù)研究中心,威海 264300)
海上船舶檢測是運用檢測算法標定圖片或視頻中船舶的檢測技術(shù)。在科技飛速發(fā)展的今天,以圖像為載體的目標識別技術(shù)在日常生活中應(yīng)用廣泛。但是,在實際檢測中,海上環(huán)境的多變性會導(dǎo)致船舶以各種姿態(tài)出現(xiàn)。海浪、光照變化等因素復(fù)雜多變,使得海上船舶檢測效果不夠理想。此外,高分辨率攝像機的日益普及也給實時檢測帶來了機遇。
在以圖像處理為背景的目標檢測算法中,基于統(tǒng)計學(xué)習(xí)的檢測算法比較常見。該算法需要在大量的正負樣本下,從數(shù)學(xué)角度描述特征,得到特征算子[1]?,F(xiàn)有的算子多采用Haar小波[2-3]、主分量分析[4-5]、方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征等算法來提取特征點[6],再應(yīng)用支持向量機(Support Vector Machine,SVM)、AdaBoost和決策樹算法[7-9]進行分類。其中,HOG+SVM檢測算法最經(jīng)典,應(yīng)用也最廣泛。
通常一張圖片會包含多個尺度的船舶,因此在檢測時普遍采用多尺度滑動窗口法進行全局遍歷式搜索。這個過程需要對每一個滑動窗口提取特征。一幅N×N大小的圖像,候選窗口有N4個,而大多數(shù)的窗口都不包含檢測目標。所以,如何減少滑動窗口的數(shù)量和降低算法耗時,是提升檢測速度的關(guān)鍵。人在識別圖像中的檢測目標時,往往會快速過濾背景區(qū)域,將注意力集中在顯著區(qū)域。以此為背景,眾多學(xué)者提出了一系列快速過濾算法。例如:魏麗等人通過普殘留顯著性檢測構(gòu)建似物性分析,實現(xiàn)了紅外圖像行人檢測,但后續(xù)處理過程較為復(fù)雜[10];程明明等人提出的規(guī)范二進制梯度特征(Binarized Normed Gradients,BING)是一種新的描述算子,可以快速標記一幅圖像中的似物性物體,算法簡單,檢測速度快,但屬于多尺度、無類別標記,需要進一步處理候選框[11]。
基于此,本文在BING似物性檢測的基礎(chǔ)上引入一種基于相似度匹配的篩選模型。首先,似物性檢測在圖片中標記一系列的似物性候選框。其次,選取場景中某一檢測目標的向量直方圖作為匹配模板,計算似物性候選框與模板的相似度,過濾相似度低的其他類別物體。最后,對剩余候選框進行最終的判別。
在海上進行船舶檢測,首先要解決檢測區(qū)域問題。攝像機捕捉到的畫面包括兩部分,分別是海水和天空。待檢測圖片,如圖1所示。由于船舶不會出現(xiàn)在天空中,因此需要標定海面與天空的分界線,以減少飛機、云朵等干擾因素,如圖2所示。Prewitt算子是一種一階微分算子,利用像素點上下左右鄰點灰度差,在邊緣處達到極值檢測邊緣,對噪聲具有平滑作用,可以有效檢測海天線。
圖1 待檢測圖片
圖2 海天線標定
似物性是指與類別無關(guān)的所有物體。在一幅圖像中,“物體”最大的特點是具有良好的封閉輪廓,而與之對應(yīng)的背景元素則是單一或雜亂無章的[12-14]。似物性檢測作為第一級分類器,訓(xùn)練時把有物體屬性的圖片作為正樣本,將背景圖片作為負樣本,將所有的正負樣本圖片大小縮放到8×8,計算每個樣本的64維梯度值即規(guī)范梯度特征,如圖3所示。
圖3 規(guī)范梯度特征
在檢測物體時,所有的窗口都會縮放到統(tǒng)一的尺度進行判別,因此規(guī)范梯度特征對目標的尺度和縱橫比有良好的適應(yīng)性。為進一步提高算法速度,對規(guī)范梯度特征進行近似運算,計算公式為
式中:bk,l為提取的BING特征值;gt為BING的近似值;Ng為近似位數(shù),即實驗用的BING特征向量位數(shù)。
篩選時,利用得到的分類器ω∈R64對所有掃描窗口打分,計算公式為
式中:st為掃描窗得分,分值越高,表示該區(qū)域包含物體的可能性越大;gt為規(guī)范梯度特征;i為檢索尺寸;(x,y)為窗口位置;l為i尺存下的坐標。
似物性搜索運用的是多尺度滑動窗口法。不同大小的窗口包含物體的概率不同,因此在對候選窗口打分時采用多尺度打分,即
式中:vi,ω∈R;i為不同尺度的窗口。針對尺度i,得到該尺度下的學(xué)習(xí)系數(shù)。最后,對所有的搜索窗口打分進行排序,選擇合適的閾值,將排名靠前的窗口作為似物性候選窗口。
圖4為排名前30的似物性候選窗口標定結(jié)果??梢钥闯?,船舶、太陽以及海浪等目標都被標定。然而,多尺度搜索導(dǎo)致候選窗幾乎布滿了整個圖像區(qū)域,需要在此基礎(chǔ)上進一步減少候選窗口數(shù)量,把注意力集中在感興趣區(qū)域,進一步提高檢測速度。
圖4 似物性檢測結(jié)果
似物性檢測標記了一幅圖像中有物體屬性的候選框,這里的物體是多尺度且不分類別的,需要進一步篩選。如圖5所示,實驗中發(fā)現(xiàn)同一場景中船舶與背景的直方圖分布存在很大差異。船舶的直方圖分布相對分散,而背景圖像的分布集中于某一個區(qū)間,因此可以利用這一特性過濾掉背景窗口[15-17]。
圖5 直方圖分布
灰度直方圖是像素的統(tǒng)計特征,用來描述灰度像素出現(xiàn)的概率,可表示為
式中:H(P)為灰度直方圖的向量表示形式;h(xi)為灰度值xi出現(xiàn)的概率;S(xi)為灰度值xi出現(xiàn)的總次數(shù)。
向量間夾角大小可以表示兩者的相似程度。將兩幅圖像的灰度直方圖寫成向量形式,計算兩者之間的夾角,以此判斷兩個圖像的差異度,計算方法為
式中:ra、rb分別為兩幅圖像的直方圖向量;ai、bj分別為直方圖中每個維度的數(shù)值。由于ra、rb都是正整數(shù),因此θA,B為0°~90°。為了更加直觀地看到相似度,將夾角與0%~100%對應(yīng),把夾角大小歸一化到0~1之間,則A與B的相似度可表示為
式中:S(A,B)為相似度;0.011為將90°歸一化到數(shù)值100%時的轉(zhuǎn)換系數(shù)。
由圖6可見,經(jīng)過相似度匹配,多數(shù)背景窗口被成功過濾,初步解決了多尺度似物性檢測導(dǎo)致的候選窗口類別多、數(shù)量大的問題,但候選窗中仍有少部分背景圖片被保留,需要進一步判別。
圖6 相似度匹配結(jié)果
某些場合下,船舶檢測定位后需要對船上人員進行異常行為檢測與跟蹤,包括檢測船舶上人員的走動以及是否升降旗等異常行為。
HOG特征從數(shù)學(xué)角度將圖像信息整合為向量形式,是對圖像的編碼,在目標檢測方面有較普遍的應(yīng)用。首先,將圖像細分成單元、塊、滑動窗口,每4個單元組成一個塊。其次,計算每個像素的梯度和方向。最后,將梯度方向按步長平分為9個區(qū)間,計算各區(qū)間直方圖,并用像素梯度幅值作為權(quán)重進行投票。每個塊中4個直方圖按序連接,形成塊的特征向量,將塊特征向量串聯(lián)得到一個高維向量,即該圖像的HOG特征[18-21]。
實驗中選擇2 000張大小為96×160且包含行人的圖像作為正樣本,1 200張大小不一的不包含行人的圖片作為負樣本,經(jīng)SVM訓(xùn)練得到行人檢測分類器。似物性檢測得到的候選框大小遠遠小于原始圖片,因此不再進行滑動搜索,直接提取剩余候選窗口的HOG特征,并使用行人檢測分類器進行判定,結(jié)果如圖7所示。
圖7 檢測結(jié)果
算法首先利用邊緣檢測算法提取海天線,提升檢測區(qū)域的準確性,改善檢測算法的實時性。其次,算法利用似物性檢測方法初步估計船舶的位置,以方便后面對檢測區(qū)域的劃定和相應(yīng)的船舶目標提取。再次,利用相似度匹配方法排除干擾項,鎖定船舶位置。最后,利用HOG+SVM方式對船上的人員進行識別定位,進一步判別船上人員有無危險行為。實驗結(jié)果表明:一方面,算法可準確有效實現(xiàn)海上船舶的檢測,借助行人檢測技術(shù)實現(xiàn)對船舶人員的識別;另一方面,算法只是對船上人員進行檢測,后續(xù)需進一步研究船上人員的具體行為判別。