雷俊鋒,董宇軒,眭海剛
(1.武漢大學(xué)電子信息學(xué)院,湖北武漢430072;2.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北武漢430079)
視頻衛(wèi)星作為一種新型對(duì)地觀測(cè)衛(wèi)星,通過“凝視”成像方式[1]對(duì)某一區(qū)域進(jìn)行連續(xù)觀測(cè),特別適用于動(dòng)態(tài)目標(biāo)的觀測(cè)。近年來,我國(guó)的視頻衛(wèi)星發(fā)展十分迅速,其中長(zhǎng)光衛(wèi)星技術(shù)有限公司于2015年發(fā)射的兩顆視頻衛(wèi)星-吉林一號(hào)(1星,2星)的各項(xiàng)技術(shù)指標(biāo)均達(dá)到較高水準(zhǔn)。該實(shí)時(shí)視頻衛(wèi)星支持全球業(yè)務(wù),包括石油儲(chǔ)存檢測(cè)、災(zāi)害響應(yīng)、生態(tài)系統(tǒng)擾動(dòng)檢測(cè)和船舶車輛跟蹤[2]等。
當(dāng)今智能交通系統(tǒng)的主要數(shù)據(jù)源一般來自地面固定或空中的攝像機(jī)、傳感器。這類圖像的主要缺點(diǎn)是空間覆蓋有限,因此研究人員開始關(guān)注更高的空間。衛(wèi)星視頻在廣域監(jiān)控領(lǐng)域具有巨大的優(yōu)勢(shì)和潛力,如城市的交通監(jiān)控、建筑的三維重建[3]和地震救援工作等。為了有效地監(jiān)控城市地區(qū)的場(chǎng)景,一個(gè)主要且關(guān)鍵的任務(wù)就是檢測(cè)和識(shí)別衛(wèi)星視頻中捕捉到的移動(dòng)車輛。然而,在衛(wèi)星視頻中檢測(cè)微小運(yùn)動(dòng)車輛存在諸多挑戰(zhàn)。
在衛(wèi)星視頻中,車輛目標(biāo)非常?。?],每輛車通常只有幾個(gè)像素。基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法諸如YOLOV3[5],F(xiàn)AST-RCNN[6]等,由于卷積操作的局限性很難完成對(duì)幾個(gè)像素目標(biāo)的特征提取,多被用于超過0.5 m分辨率的監(jiān)測(cè)系統(tǒng);基于全卷積網(wǎng)絡(luò)的目標(biāo)分割方法如邊緣敏感的顯著性網(wǎng)絡(luò)BASNet[7],在背景復(fù)雜的衛(wèi)星視頻中常常會(huì)受到多種干擾,在先驗(yàn)信息不足的情況下大概率會(huì)將路障或者道路邊的建筑誤檢為目標(biāo)。
在這種情況下,運(yùn)動(dòng)信息常常是最穩(wěn)健的特征,改進(jìn)的視覺背景提?。↖mproved Visual Back?ground extractor,ViBe)等算法[8-10]可以實(shí)現(xiàn)視頻中運(yùn)動(dòng)車輛檢測(cè),該類方法通過與建立的背景模型進(jìn)行比較,在圖像中搜索變化像素。但由于成像系統(tǒng)中噪聲影響以及背景的運(yùn)動(dòng),該類方法容易產(chǎn)生視差引起的虛影。文獻(xiàn)[11]提出了針對(duì)成像系統(tǒng)的3種場(chǎng)景差別補(bǔ)償和更新的檢測(cè)方法,能有效處理強(qiáng)視差下的誤檢測(cè),但在處理小目標(biāo)時(shí)的檢測(cè)能力不佳。
Larsen等人[12]用橢圓斑點(diǎn)的檢測(cè)策略檢測(cè)車輛,利用具有多種經(jīng)典特征的KNN(K-Near?est-Neighbor)分類器將車輛與非車輛目標(biāo)分離。Liu[13]提出了一種改進(jìn)的形態(tài)學(xué)重建方法來建立復(fù)雜背景的衛(wèi)星圖像模型,采用歸一化差分設(shè)計(jì)方向?yàn)V波器來生成用于形態(tài)學(xué)重建的車輛。然而在衛(wèi)星視頻序列中,存在著大量類似于車輛的物體,這可能會(huì)導(dǎo)致混淆。文獻(xiàn)[14]則是關(guān)注于圖像的明暗變化,采用半自動(dòng)雙閾值技術(shù)首先在掩蔽道路上檢測(cè)出暗車和亮車。利用相鄰關(guān)系和雙區(qū)域?yàn)V波去除殘留干擾(陰影、車道線和噪聲)。為了解決道路外的干擾,文獻(xiàn)[15]提出采用道路先驗(yàn)的方法完成預(yù)先道路區(qū)域的提取,消除了道路外的誤檢,但這種方法適用于長(zhǎng)時(shí)間不動(dòng)的凝視衛(wèi)星,需要多幀的有效圖片進(jìn)行道路建模提取,在靈活度以及處理速度上有所欠缺。Teng等人[16]采用迭代多網(wǎng)格圖像變形方法計(jì)算全局運(yùn)動(dòng)場(chǎng),具有更準(zhǔn)確、更省時(shí)的優(yōu)點(diǎn)。文獻(xiàn)[17]則是假設(shè)真實(shí)的數(shù)據(jù)存在于一個(gè)低維的子空間,通過降維的方法分割目標(biāo)和背景,增強(qiáng)了數(shù)據(jù)的可處理性,但降維過程也常常會(huì)受到視頻傳輸過程中的噪聲干擾。
現(xiàn)有的多種算法都針對(duì)于目標(biāo)的某一種特征(色彩、形狀)或聚焦于衛(wèi)星視頻中最為穩(wěn)健的運(yùn)動(dòng)信息,而在復(fù)雜的背景以及成像系統(tǒng)的偏移下并不可靠,基于這一情況,通過觀察衛(wèi)星視頻[18]的特點(diǎn),發(fā)現(xiàn)顯著性映射也能在一定程度上為目標(biāo)的檢測(cè)提供有用的信息,結(jié)合運(yùn)動(dòng)信息能更好地消除誤檢,設(shè)計(jì)了一種基于多種先驗(yàn)約束顯著性的衛(wèi)星視頻中微小運(yùn)動(dòng)車輛檢測(cè)方法。本文對(duì)文獻(xiàn)[19]提出的人眼視覺模型進(jìn)行改進(jìn)來獲得感興趣目標(biāo),并通過顯著性映射的空間特性獲得“區(qū)域穩(wěn)定性”映射圖,同時(shí)采用背景建模生成圖像的運(yùn)動(dòng)熱圖并完成基于超像素的運(yùn)動(dòng)區(qū)域估計(jì),最后結(jié)合多種先驗(yàn)信息獲得最終的特征映射完成目標(biāo)二值分割。實(shí)驗(yàn)結(jié)果表明,相較于現(xiàn)有算法,所提算法在圖像場(chǎng)境適應(yīng)性以及檢測(cè)指標(biāo)上取得了更好的結(jié)果,具有一定優(yōu)勢(shì)。
現(xiàn)有的顯著性檢測(cè)方法,多是針對(duì)自然圖像中的目標(biāo),其圖像色彩鮮明,目標(biāo)像素占比較大,并不適用于背景復(fù)雜、目標(biāo)小的衛(wèi)星視頻。
圖1 吉林一號(hào)衛(wèi)星道路影像Fig.1 Road scenes in“Jilin-1”satellite video
圖1 為吉林一號(hào)衛(wèi)星視頻某處道路場(chǎng)景,從圖中可以看出,背景復(fù)雜且色彩晦暗,微小車輛(道路中間的白色目標(biāo))與邊界擁有較少的“交互性”,與圖像邊界的聯(lián)系較少。這里的邊界不是廣義上的圖像線條而是能描述圖像區(qū)域布局的界限。
文獻(xiàn)[19]提出了人眼視覺模型,使用邊界相關(guān)性公式(1)來描述一個(gè)區(qū)域的重要性,定義為:
其中:Bd為某個(gè)圖像區(qū)域邊界的集合,p為其中的一個(gè)圖像塊,它表示某個(gè)區(qū)域與邊界接觸的長(zhǎng)度與其面積平方根的比值。
為了解決純粹分割算法可能導(dǎo)致的誤差校正和偽邊界問題,Zhu[19]將圖像抽象為一組規(guī)則的超像素來簡(jiǎn)化計(jì)算。定義每個(gè)超像素m所屬的本征區(qū)域面積如式(2)所示:
其中:N為超像素的總數(shù),W(m,mi)表示某個(gè)超像素mi對(duì)m所在的本征區(qū)域的貢獻(xiàn)權(quán)重。連接所有相鄰的超像素(m,n),計(jì)算出它們的平均顏色在CIE-LAB空間中的歐式距離E(m,n),計(jì)算出圖像中所有超像素間的互相關(guān)性Cc(m,n),σ是貢獻(xiàn)度的閾值。實(shí)驗(yàn)表明[19]當(dāng)σ取值在[5,15]之間時(shí)對(duì)不同本征區(qū)域分離效果較好。
類似地,Zhu定義某個(gè)超像素對(duì)本區(qū)域邊界接觸的“長(zhǎng)度”為:
其中:Q為與m相鄰的超像素個(gè)數(shù),δ(mi∈Bd)用來判斷m與相鄰超像素之間是否存在區(qū)域邊界,存在則置為1,不存在則置為0。
文獻(xiàn)[19]最終采用了簡(jiǎn)化公式(4)來代替式(1)計(jì)算超像素與邊界的相關(guān)性:
通過簡(jiǎn)化后的公式(4)可以利用較可靠且快速的超像素分割來完成相關(guān)性模型的計(jì)算。
簡(jiǎn)單線性迭代聚類算法(Simple Linear Itera?tive Cluster,SLIC)[20]生成的超像素如同細(xì)胞一般緊湊整齊,領(lǐng)域特征比較容易表達(dá),很適合將基于像素的計(jì)算方法拓展到基于超像素的方法。且需要設(shè)置的參數(shù)非常少,默認(rèn)情況下只需要設(shè)置預(yù)分割的超像素?cái)?shù)量NR和緊湊性參數(shù)NC。對(duì)于式(4)提出的計(jì)算方法,需要獲得輪廓緊湊的超像素以及盡量避免不同的微小車輛被生硬地分割到相鄰的超像素中,采用Stutz[21]提出的緊湊度(Compactness,CO)和邊界召回率(Bound?ary Recall,BR)來作為超像素分割的評(píng)價(jià)指標(biāo)進(jìn)行參數(shù)選取。選取吉林一號(hào)衛(wèi)星圖像中兩個(gè)不同數(shù)據(jù)集的道路區(qū)域進(jìn)行了實(shí)驗(yàn)。圖2是不同NR參數(shù)得到的CO指標(biāo)對(duì)比。
圖2 不同NR參數(shù)的CO指標(biāo)對(duì)比Fig.2 CO index comparison of different NR parameters
從圖2中的折線圖可以看出,NR從200~400的過程中CO指標(biāo)較為明顯地上升,而在NR>600后,繼續(xù)增加超像素?cái)?shù)量對(duì)指標(biāo)的提升很有限,且通過實(shí)驗(yàn)在超像素?cái)?shù)量大于700后NR每增加100,計(jì)算時(shí)間大約增加11%。綜合考慮后選擇NR取值范圍為[500,700],本文中選取600。
除了超像素?cái)?shù)量的選擇,分割緊湊性參數(shù)NC也會(huì)影響生成超像素的邊界穩(wěn)定性。對(duì)圖2中的數(shù)據(jù)在NR為600的情況下選取了不同的NC參數(shù)進(jìn)行了實(shí)驗(yàn),獲得不同BR指標(biāo)如圖3所示。
圖3 不同NC參數(shù)的BR指標(biāo)對(duì)比Fig.3 BR index comparison of different NC parameters
由圖3的折線圖可知,當(dāng)NC取35~45之間時(shí),能夠獲得最好的BR指標(biāo),這表明超像素的邊界能更好地“包裹”住目標(biāo),而在NC>50后BR指標(biāo)逐漸下降。綜合考慮后選擇NC的取值范圍是35~45,本文中選取40。
衛(wèi)星視頻傳輸過程中產(chǎn)生的多種噪聲對(duì)單個(gè)像素的影響很大,為了將噪聲的影響降到最低,本文在人眼視覺模型的基礎(chǔ)上獲得其他先驗(yàn)信息,定義不同的約束項(xiàng)來適應(yīng)衛(wèi)星圖像的環(huán)境。
首先引入文獻(xiàn)[19]定義的超像素與區(qū)域邊界的相關(guān)性。背景概率Pib作為超像素mi邊界相關(guān)性的映射,當(dāng)超像素與邊界的相關(guān)性很大時(shí),很小時(shí)該項(xiàng)定義為:其中:σbc是映射超參數(shù),當(dāng)σbc∈[1,3]時(shí),輸出結(jié)果對(duì)該參數(shù)敏感,最終設(shè)置為2。同時(shí),可以得到與之對(duì)應(yīng)的前景概率Pio,當(dāng)超像素與邊界的相關(guān)性很大時(shí),Pio→0,很小時(shí),Pio→1。
由于超像素相鄰區(qū)域可能會(huì)導(dǎo)致像素值的跳躍性變化。在某些情況下,道路中的車輛會(huì)處于鄰接狀態(tài),位于不同超像素中的目標(biāo)車輛可能產(chǎn)生邊界融合。為了消除因相鄰超像素間局部差異導(dǎo)致的邊界干擾,本文提出了一個(gè)新的區(qū)域平滑約束項(xiàng),將每對(duì)相鄰的超像素之間的平滑約束定義為:
其中:σ為定義的權(quán)重,用歐式距離E(mi,mj)來表示同一個(gè)超像素中像素值的接近程度,μ是優(yōu)化參數(shù),通常取0.1,用來消除在前景背景中的小噪聲。
通過融合多種類型約束,本文將第i個(gè)超像素的顯著性定義為Si,構(gòu)建整個(gè)圖像的顯著性代價(jià)函數(shù),如式(7)所示:
式(7)中分別用平方差的形式定義了背景、前景和區(qū)域平滑三個(gè)約束項(xiàng)。用最小二乘法進(jìn)行優(yōu)化求解,得到需要的顯著性目標(biāo)圖。
然而某些顯眼的建筑物或路障也可能獲得和目標(biāo)相似的顯著性映射,而這些區(qū)域靜止不動(dòng)的特性可以通過生成運(yùn)動(dòng)熱圖的方法約束顯著性結(jié)果。本文算法將像素引申到超像素,定義了一種基于背景模型的超像素運(yùn)動(dòng)熱圖生成方法,步驟如下:
Step1設(shè)定距離相近判定的閾值D和近似樣本點(diǎn)數(shù)目判定的閾值minT。
Step2對(duì)于像素點(diǎn)p,定義OD(v(p))為以像素值v(p)為中心、D為半徑的區(qū)域集合。
Step3計(jì)算像素點(diǎn)p背景模型樣本集B(p)={v1,v2,…vN}中的樣本落在OD(v(p))中的個(gè)數(shù):
Step4若n 其中:Qi為某個(gè)像素的運(yùn)動(dòng)標(biāo)志位,P為超參數(shù)中包含的像素個(gè)數(shù)。當(dāng)時(shí),認(rèn)為該超像素屬于運(yùn)動(dòng)區(qū)域。本文用與標(biāo)記真實(shí)運(yùn)動(dòng)像素的準(zhǔn)確率來驗(yàn)證這種方法的有效性,給出單像素判決和超像素判決的受試者工作特征(Receiver Operating Characteristic,ROC)曲線對(duì)比(彩圖見期刊電子版)。 圖4 不同策略的ROC曲線對(duì)比Fig.4 ROC curve comparison of different strategies 從ROC曲線對(duì)比可以看出基于超像素能提高對(duì)運(yùn)動(dòng)像素的檢測(cè)準(zhǔn)確度。 對(duì)于單個(gè)顯著性映射或者運(yùn)動(dòng)熱圖來說,均存在由于方法缺陷導(dǎo)致的誤檢,例如顯著性無法區(qū)分目標(biāo)車輛和“顯眼”的路障或建筑物,而運(yùn)動(dòng)熱圖在自我運(yùn)動(dòng)較為頻繁的衛(wèi)星視頻中也常常有諸多因光照或者畫面晃動(dòng)導(dǎo)致的誤檢。需要充分利用這兩部分特征完成信息的交流和互補(bǔ)。 獲得的顯著性映射能較好地反映道路中微小車輛的顯著性強(qiáng)度,但仍然存在缺陷。即得到的顯著性映射是灰度強(qiáng)度圖像,需要進(jìn)行閾值化操作來得到運(yùn)動(dòng)車輛的二值分割。 通過對(duì)顯著性映射圖的數(shù)據(jù)分析發(fā)現(xiàn),采用絕對(duì)的閾值化操作是不可取的,相反地,在顯著性映射中強(qiáng)度的多樣性以及變化恰恰包含了更多的信息。通過與周圍背景區(qū)域的對(duì)比[22]來評(píng)估局部圖像像素的顯著性,與邊界相關(guān)性較大的區(qū)域?qū)?huì)被賦予較高的顯著性值。如圖5所示,少數(shù)中類似車道線的區(qū)域也會(huì)獲得較大的顯著性值,這些區(qū)域與其說是誤檢,更多的可以當(dāng)做背景干擾,顯然這些區(qū)域均為假警報(bào),而當(dāng)待檢車輛與這些干擾背景融合的時(shí)候則會(huì)引入更多的區(qū)分困難。圖中圓形區(qū)域以及矩形區(qū)域中的目標(biāo)與道路中背景的關(guān)系密切。且均能從顯著性映射圖中獲得像素的響應(yīng),基于衛(wèi)星視頻1.13 m的分辨率并考慮到現(xiàn)實(shí)中車輛的平均大小,本文取某個(gè)像素的3×3鄰域,認(rèn)為該尺寸能更好的契合微小車輛的在圖像中的像素占比,反映目標(biāo)周圍像素的空間變化情況。 圖5 背景融合情況示意圖Fig.5 Schematic diagram of background fusion 將像素p的鄰域定義為:其中,p位于9鄰域的中心位置,下標(biāo)0處。同時(shí)基于該鄰域提出了一種區(qū)域穩(wěn)定性映射,通過前后幀的顯著性映射對(duì)比完成時(shí)間鄰域?yàn)V波,如式(11)所示: 其中:M(pi)和Mn(pi)分別是當(dāng)前幀以及下一幀中像素p下標(biāo)為i的鄰域像素值。 雖然由于衛(wèi)星角度的變化,運(yùn)動(dòng)檢測(cè)的結(jié)果充滿了不確定性,但仍然包含了許多可以利用的信息。 圖6 聯(lián)合預(yù)測(cè)結(jié)果Fig.6 Result of joint prediction 對(duì)于某像素點(diǎn)的檢測(cè),我們需要同時(shí)考慮運(yùn)動(dòng)熱圖、顯著性映射以及區(qū)域穩(wěn)定性映射的結(jié)果,進(jìn)行聯(lián)合推斷,完成更精確的微小車輛檢測(cè),如圖6所示。圖中利用運(yùn)動(dòng)熱圖、區(qū)域顯著性圖、以及顯著性穩(wěn)定特征為線索來構(gòu)建最終的聯(lián)合特征向量。充分利用了時(shí)間空間的信息,對(duì)大多數(shù)車輛均能完成有效地檢測(cè),特別是圖中圓形框標(biāo)記的與道路邊界或車道線關(guān)系密切也能通過多種先驗(yàn)信息提取出車輛,但對(duì)于矩形區(qū)域中與道路邊界背景基本完全融合的某些車輛則會(huì)漏檢,但也因此減少了因邊界預(yù)測(cè)將背景誤檢的概率,更多地關(guān)注于輪廓清晰的運(yùn)動(dòng)車輛。 為了選取最好的顯著性穩(wěn)定性閾值,選取不同的Pst進(jìn)行實(shí)驗(yàn),同時(shí)在標(biāo)注好的數(shù)據(jù)集上進(jìn)行受試者曲線面積(Area under Curve,AUC)指標(biāo)測(cè)試,得到圖7的折線圖。可以看出當(dāng)Pst選取15左右時(shí),能夠獲得最高的AUC指標(biāo),完成目標(biāo)的準(zhǔn)確提取。 圖7 不同Pst參數(shù)下的指標(biāo)對(duì)比Fig.7 Comparison of indexes under different Pst param?eters 按上述步驟,設(shè)計(jì)的算法流程如下:輸入為衛(wèi)星視頻當(dāng)前幀圖像Xd以及前一幀圖像Xe,輸出為二值化的車輛檢測(cè)結(jié)果圖Xo。 算法的主要步驟描述如下: Step1取輸入的當(dāng)前幀圖像利用簡(jiǎn)單線性迭代的方法得到超像素分割結(jié)果,根據(jù)輸入分辨率自適應(yīng)地設(shè)定合適的分割參數(shù)。 Step2通過人眼顯著性模型計(jì)算每個(gè)超像素與其本征區(qū)域的邊界相關(guān)性數(shù)值,計(jì)算公式為:其中L(m)為超像素對(duì)本區(qū)域接觸“長(zhǎng)度”,S(m)為本征區(qū)域的面積。 Step4對(duì)當(dāng)前幀圖像Xd以及前一幀圖像Xe利用背景建模的方法獲得運(yùn)動(dòng)熱圖,并利用運(yùn)動(dòng)熱圖、區(qū)域顯著性圖、以及區(qū)域穩(wěn)定特征為線索來構(gòu)建最終的聯(lián)合特征向量獲得最終的預(yù)測(cè)輸出。 為了衡量本文所提算法效果,在長(zhǎng)光技術(shù)有限公司發(fā)射的“吉林一號(hào)”[23]第二批光學(xué)衛(wèi)星原始圖像中選取了世界各地不同城市的衛(wèi)星視頻進(jìn)行測(cè)試。該數(shù)據(jù)包括美國(guó)、土耳其、巴林穆哈拉格等不同城市的影像數(shù)據(jù)。每一幀衛(wèi)星圖像的空間分辨率約為1.13 m,對(duì)這些視頻截取了不同城市的道路場(chǎng)景視頻來進(jìn)行道路上車輛的檢測(cè)。部分測(cè)試圖像如圖8所示。 圖8 部分測(cè)試影像數(shù)據(jù)Fig.8 Part of the test image data 為驗(yàn)證所提算法(選取參數(shù)NC=40,NR=600以及Pst=15)的性能,與近年來部分優(yōu)秀算法進(jìn)行了結(jié)果對(duì)比,包括改進(jìn)的高斯混合模型(Gaussian Mixture Model,GMMv2)[9](采用背景門限為0.7高斯模型個(gè)數(shù)為5的默認(rèn)參數(shù));運(yùn)動(dòng)目標(biāo)提取ViBe算法[10](采用時(shí)間采樣因子為16的默認(rèn)最優(yōu)參數(shù));幀間背景融合差分(Differ?ence of Background Fusion between Frames,F(xiàn)BD)[8](采用方差閾值為0.01的默認(rèn)參數(shù)),以及動(dòng)態(tài)魯棒主成分分析[17](Dynamic Robust Prin?cipal Component Analysis,DRPCA)。 當(dāng)前的視頻衛(wèi)星雖然相較以前已達(dá)到了“高分辨”,但通常只能公開獲得精度為米級(jí)的圖像。并且衛(wèi)星視頻拍攝過程中狀態(tài)通常難以預(yù)測(cè),觀測(cè)方式雖稱為“凝視”,但常有細(xì)微的拍攝角度變化導(dǎo)致圖像偏移。下面分別對(duì)穩(wěn)定拍攝情況下和拍攝角度變化時(shí)獲得的衛(wèi)星影像進(jìn)行算法比較。 在圖8中顯示的4種道路場(chǎng)景中,除了美國(guó)圣保羅的衛(wèi)星數(shù)據(jù)有由衛(wèi)星角度偏移產(chǎn)生的背景變化外,均為穩(wěn)定條件下成像。圖9為巴林穆 哈拉格圖像的對(duì)比檢測(cè)結(jié)果。 圖9 巴林穆哈拉登衛(wèi)星影像效果對(duì)比圖Fig.9 Results comparison of Muharag satellite video in Bahrain 圖9 的數(shù)據(jù)為在巴林穆哈拉登拍攝的衛(wèi)星影像,此時(shí)衛(wèi)星以較為平穩(wěn)的狀態(tài)對(duì)地“凝視”觀測(cè)。從結(jié)果可以看出GMMv2算法對(duì)于運(yùn)動(dòng)目標(biāo)的檢測(cè)精度很高,但對(duì)于目標(biāo)輪廓的勾勒較為粗糙;并且會(huì)由于光照或影像傳輸過程中引起的背景細(xì)微變化產(chǎn)生許多誤檢;ViBe算法召回率很高但道路中的誤檢也較多;FBD算法能達(dá)到較高的檢測(cè)準(zhǔn)確度但由此導(dǎo)致大量漏檢;而基于主成分分析的DRPCA算法則是在道路中間能夠準(zhǔn)確地檢測(cè)到運(yùn)動(dòng)目標(biāo),但也會(huì)引入建筑物光照變化產(chǎn)生的誤檢。而所提算法在只有少量漏檢的情況下保持了較高的檢測(cè)準(zhǔn)確度,具有一定的優(yōu)勢(shì)。 為了進(jìn)一步評(píng)估檢測(cè)效果,選取檢測(cè)準(zhǔn)確率(Precision)、召 回率(Recall)和虛警率(False Alarm)來分析檢測(cè)效果。其中Precision=TP/(TP+FP);Recall=TP/TA;False Alarm=FP/(TP+FP)。TA表示人工標(biāo)注的目標(biāo)總數(shù);TP表示被正確檢測(cè)的目標(biāo)數(shù)目;FP表示把背景錯(cuò)誤地檢測(cè)為目標(biāo)的數(shù)目。取之前4個(gè)城市道路中除美國(guó)圣保羅之外的3個(gè)道路影像各500 frame計(jì)算平均指標(biāo)。結(jié)果如表1~表3所示。 從客觀指標(biāo)結(jié)果可以看出,GMMv2算法的召回率較高的同時(shí)虛警率也較高,ViBe算法的在召回率較高的前提下無法保證檢測(cè)的精度,而FBD算法和DRPCA算法則是在保證準(zhǔn)確率和虛警率無法擁有較高的召回率。所提算法在穩(wěn)定圖像環(huán)境下的三種客觀指標(biāo)相比于其他算法各種指標(biāo)均較為穩(wěn)定,在保證低虛警率的同時(shí)也能擁有相對(duì)較高的準(zhǔn)確率和召回率,具有一定的優(yōu)勢(shì)。同時(shí)為了更清晰地說明各算法的性能對(duì)比,通過上述各數(shù)據(jù)集的受試者工作特征(Re?ceiver Operating Characteristic,ROC)曲線,計(jì)算平均曲線下面積(Area Under Curve,AUC)值。并給出了在配置GTX1050顯卡計(jì)算機(jī)的平均運(yùn)行時(shí)間,結(jié)果如表4,表5所示。 表1 準(zhǔn)確率指標(biāo)對(duì)比Tab.1 Comparison of Precision (%) 表2 召回率指標(biāo)對(duì)比Tab.2 Comparison of Recall (%) 表3 虛警率指標(biāo)對(duì)比Tab.3 Comparison of False Alarm (%) 表4 AUC值對(duì)比Tab.4 Comparison of AUC 表5 運(yùn)行時(shí)間對(duì)比Tab.5 Comparison of time (ms) 從表4,表5的結(jié)果可以看出,反映綜合檢測(cè)效果的AUC值證明了所提算法在保持一定的運(yùn)算速度的前提下,總體性能上具有一定的優(yōu)越性。 衛(wèi)星視頻相較于傳統(tǒng)的監(jiān)控視頻一個(gè)較大的不同則是拍攝過程中會(huì)伴隨衛(wèi)星角度的細(xì)微變化。而這種變化有時(shí)是可控的有時(shí)則是隨機(jī)出現(xiàn)的。為了驗(yàn)證在該類場(chǎng)景下的對(duì)比結(jié)果,選取了美國(guó)圣保羅拍攝的具有微小角度變化的衛(wèi)星影像。結(jié)果如圖10所示。 圖10 美國(guó)圣保羅衛(wèi)星影像效果對(duì)比圖Fig.10 Results comparison of Muharag satellite video in St.Paul,USA 美國(guó)圣保羅拍攝的衛(wèi)星影像有明顯的拍攝角度變化,對(duì)于人眼而言可能只是小小的圖片整體偏移,但是對(duì)運(yùn)動(dòng)目標(biāo)的檢測(cè)會(huì)產(chǎn)生很大干擾。從圖10可以看出,各種對(duì)比算法在這種惡劣圖像環(huán)境下均無法獲得較好的結(jié)果產(chǎn)生了大量誤檢。而所提算法雖然有少量誤檢但是整體而言具有較好的抵抗衛(wèi)星拍攝角度變化的能力。由于其他算法在該環(huán)境下的結(jié)果較差難以統(tǒng)計(jì),這里只列出所提算法的客觀指標(biāo),計(jì)算方法同上:Precision=87.4%;Recall=88.6%;False Alarm=12.6%。 對(duì)于不同圖像環(huán)境中的結(jié)果對(duì)比后,可以看出所提算法在穩(wěn)定圖像環(huán)境下的三種客觀指標(biāo)不僅穩(wěn)定地獲得較好的指標(biāo),對(duì)衛(wèi)星拍攝角度發(fā)生變化的惡劣圖像環(huán)境也表現(xiàn)良好,在算法的魯棒性和適用性上有一定的優(yōu)勢(shì)。 衛(wèi)星視頻成像穩(wěn)定且目標(biāo)尺度小,將該方法應(yīng)用到某些圖像環(huán)境類似的檢測(cè)任務(wù),也能取得不錯(cuò)的效果,比較典型的是監(jiān)控?cái)z像頭中的微小運(yùn)動(dòng)目標(biāo)。這些目標(biāo)由于尺度較小、特征缺失,很難直接用深度學(xué)習(xí)等方法完成檢測(cè)分類。本文所提算法主要有其他兩種應(yīng)用方向: (1)對(duì)于某些目標(biāo)尺度過低或者只需要完成目標(biāo)位置的獲取而忽略分類的情況下,可以通過該方法獲得特定目標(biāo)的二值分割圖,確定目標(biāo)的輪廓和位置。 (2)結(jié)合深度學(xué)習(xí)檢測(cè)網(wǎng)絡(luò)提升對(duì)小目標(biāo)的檢測(cè)性能,通過實(shí)驗(yàn)發(fā)現(xiàn)圖像輸入的尺寸對(duì)小目標(biāo)在高分辨率圖像中的檢測(cè)影響很大,對(duì)于分辨率較大的圖像,檢測(cè)器也常常會(huì)忽略小目標(biāo)??梢酝ㄟ^本文算法的輸出結(jié)果提取可能存在目標(biāo)的感興趣區(qū)域,將該區(qū)域裁剪代替整圖輸入,完成對(duì)局部小目標(biāo)檢測(cè)的強(qiáng)化。 其他場(chǎng)景的部分實(shí)驗(yàn)結(jié)果如圖11所示。 圖11 其他場(chǎng)景下的部分實(shí)驗(yàn)結(jié)果Fig.11 Some of the experimental results in other scenarios 從實(shí)驗(yàn)結(jié)果可以看出,本文算法在某些類似場(chǎng)景下也能提取到運(yùn)動(dòng)的微小目標(biāo),具有一定的應(yīng)用價(jià)值。 針對(duì)衛(wèi)星圖像的特點(diǎn),提出了一種結(jié)合多種圖像先驗(yàn)信息的衛(wèi)星視頻微小運(yùn)動(dòng)車輛檢測(cè)方法。該算法在分辨率較低、含有如光照、拍攝角度變化、運(yùn)動(dòng)目標(biāo)紋理特征缺失等特點(diǎn)的衛(wèi)星視頻上具有很強(qiáng)的場(chǎng)境適用性。并可以發(fā)散到圖像環(huán)境類似的遠(yuǎn)距離監(jiān)控視頻、圖像環(huán)境惡劣的模糊圖像中。與近年來的許多優(yōu)秀算法對(duì)比,所提出的算法能夠在檢測(cè)準(zhǔn)確率和召回率達(dá)到85%的情況下保持低于10%的虛警率,穩(wěn)定地獲得0.97以上的AUC指標(biāo),同時(shí)對(duì)含有角度變化的衛(wèi)星視頻也有一定的抗干擾能力。但是本文算法由于定義了運(yùn)動(dòng)熱圖,需要相對(duì)較為穩(wěn)定的成像環(huán)境,對(duì)于無人機(jī)、或者劇烈運(yùn)動(dòng)的成像系統(tǒng)無法獲得置信度高的運(yùn)動(dòng)約束,可能會(huì)造成大片運(yùn)動(dòng)滯后造成的“鬼影”。同時(shí),多種約束在較好地減少誤檢的同時(shí)也可能濾除某些響應(yīng)較弱的目標(biāo),下一步還需要在運(yùn)動(dòng)補(bǔ)償穩(wěn)像以及約束閾值的自適應(yīng)上進(jìn)行深入研究。2.5 聯(lián)合預(yù)測(cè)
2.6 算法流程
3 實(shí)驗(yàn)結(jié)果
4 其他場(chǎng)景的應(yīng)用
5 結(jié) 論