張琪 王藝 陳兆飛
(中國(guó)電子科技集團(tuán)公司第二十七研究所 河南省鄭州市 450015)
圖像分割技術(shù)是圖像處理和計(jì)算機(jī)視覺(jué)等領(lǐng)域中最基本的技術(shù),其效果直接影響著后續(xù)圖像處理效果的好壞,更影響著后續(xù)目標(biāo)檢測(cè)的準(zhǔn)確性。目前圖像分割邊緣檢測(cè)技術(shù)從思路上大致分為三類(lèi):一類(lèi)是借助于空域差分卷積或類(lèi)似卷積的運(yùn)算來(lái)實(shí)現(xiàn)的方法,如:Roberts 算子、Prewitt 算子、Sobel 算子、Canny 算子等;第二類(lèi)是從能量的角度考慮以能量最小化為準(zhǔn)則的分割算法,有松弛算法、神經(jīng)網(wǎng)絡(luò)分析法、Snake 算法等;第三類(lèi)是以小波變換為代表的分割算法[1]。但是由于實(shí)際圖像中的邊緣類(lèi)型復(fù)雜且實(shí)際的圖像中存在不同程度的噪聲,對(duì)算法的適應(yīng)性、穩(wěn)定性和有效性提出了極大的考驗(yàn),因此,傳統(tǒng)的空域卷積算法具有較強(qiáng)的普適性和計(jì)算速度快等優(yōu)勢(shì),因此仍得到了廣泛的應(yīng)用。
目標(biāo)檢測(cè)的目的是從序列圖像中分割處感興趣的前景目標(biāo),并盡可能地抑制背景和前景噪聲,以準(zhǔn)確地得到視頻中感興趣的目標(biāo)區(qū)域。運(yùn)動(dòng)跟蹤是指在連續(xù)的圖像序列中對(duì)感興趣的目標(biāo)進(jìn)行檢測(cè),以獲得目標(biāo)的位置、速度、加速度等運(yùn)動(dòng)參數(shù),從而在連續(xù)的視頻序列中建立起目標(biāo)的對(duì)應(yīng)關(guān)系,為下一步的視頻理解和分析提供可靠的數(shù)據(jù)。
本文根據(jù)實(shí)際工程需求,首先采用改進(jìn)的Sobel 算子對(duì)圖像進(jìn)行預(yù)處理,然后對(duì)目標(biāo)檢測(cè)閾值進(jìn)行分析,并通過(guò)極大極小策略檢測(cè)N×N 像素塊來(lái)檢測(cè)運(yùn)動(dòng)目標(biāo),同時(shí)根據(jù)幀間關(guān)聯(lián),確定目標(biāo)所在ROI 區(qū)域,并根據(jù)目標(biāo)運(yùn)動(dòng)特征動(dòng)態(tài)更新ROI 區(qū)域,以更好的對(duì)目標(biāo)特性進(jìn)行分析,并進(jìn)行目標(biāo)檢測(cè)。
假設(shè)連續(xù)圖像函數(shù)未f(x,y),函數(shù)在(x,y)處的梯度是一個(gè)具有方向和大小的梯度矢量,即[3]式中i、j 分別為x 和y 方向的單位矢量?;谔荻鹊乃阕佣际墙⒃谶@一基礎(chǔ)之上,絕大部分梯度算子把(x,y)處的邊緣梯度幅度和方向分別定義為:
而計(jì)算出的grad[f(x,y)]值即為圖像的邊緣數(shù)據(jù),因?yàn)樯鲜绞菍?duì)連續(xù)的圖像函數(shù)的處理,而在實(shí)際應(yīng)用中,采集的圖像為一定像素大小離散數(shù)據(jù),因此在圖像處理中,常用相鄰或間隔像素差分值來(lái)代表圖像的邊緣信息。而Sobel 算子是對(duì)離散的數(shù)據(jù)進(jìn)行加權(quán)計(jì)算,采用如圖1 的小型卷積模板,利用模板與對(duì)應(yīng)的圖像數(shù)據(jù)進(jìn)行卷積來(lái)做近似計(jì)算,這2 個(gè)方向模板分別為水平方向和豎直方向邊緣檢測(cè)。
其計(jì)算步驟為:
(1)分別將2 個(gè)方向模板沿著圖像從一個(gè)像素移動(dòng)到另一個(gè)像素,并將模板的中心像素與圖像中的某個(gè)位置重合;
圖1:Sobel 算子卷積模板
圖2:目標(biāo)運(yùn)動(dòng)示例
圖3:第N 幀ROI 區(qū)域示例
(2)將模板內(nèi)的系數(shù)與其對(duì)應(yīng)的圖像像素相乘;
(3)將模板內(nèi)所有相乘值相加;
(4)將2 個(gè)卷積的最大值賦值給圖像對(duì)應(yīng)模板中心位置的像素值,作為該像素的新灰度值。
改進(jìn)Sobel 算子實(shí)現(xiàn)步驟為:
(1)分別將2 個(gè)方向模板沿著圖像從一個(gè)像素移動(dòng)到另一個(gè)像素,并將模板的中心像素與圖像中的某個(gè)位置重合;
(2)將模板內(nèi)的系數(shù)與其對(duì)應(yīng)的圖像像素相乘并作和,記為SA;
(3)將模板內(nèi)每項(xiàng)系數(shù)與對(duì)應(yīng)像素相乘后,絕對(duì)值相加,記為SB;
改進(jìn)后的sobel 具有更好的抗噪能力,其處理過(guò)的圖像特征線(xiàn)與背景的對(duì)比度較好,可有效的抑制噪聲對(duì)圖像輪廓線(xiàn)的干擾,其隱含的處理結(jié)果為將目標(biāo)圖像進(jìn)行類(lèi)似差分處理,對(duì)于動(dòng)目標(biāo)的檢測(cè)提供了很好的基礎(chǔ)。
首先對(duì)圖像進(jìn)行改進(jìn)的Sobel 算子預(yù)處理。由于動(dòng)目標(biāo)在圖像中運(yùn)動(dòng)時(shí)其與周邊像素將產(chǎn)生一定的差值,經(jīng)過(guò)Sobel 算子處理后,目標(biāo)與圖像背景之間將產(chǎn)生較為明顯的邊界,目標(biāo)檢測(cè)的目的即是快速準(zhǔn)確的對(duì)目標(biāo)所在的位置進(jìn)行判定,并以此為基礎(chǔ)為后續(xù)檢測(cè)提供基礎(chǔ),供后續(xù)ROI 區(qū)域確定。
本文目標(biāo)檢測(cè)主要分為以下步驟:
(1)ROI 區(qū)域圖像進(jìn)行改進(jìn)Sobel 算子預(yù)處理,ROI 區(qū)域圖像初始化為整幅圖像;
(2)目標(biāo)檢測(cè)閾值確定;
(3)初始確定目標(biāo)所在位置,幀間關(guān)聯(lián)最終判定目標(biāo)真假;
(4)更新目標(biāo)位置坐標(biāo),幀間關(guān)聯(lián)目標(biāo)位置更新目標(biāo)ROI 區(qū)域;
(5)重復(fù)步驟1-5。
下面對(duì)上述步驟進(jìn)行詳細(xì)描述。
圖像預(yù)處理過(guò)程主要采用上文介紹的改進(jìn)Sobel 算子對(duì)視頻圖像進(jìn)行Sobel 算子卷積預(yù)處理,預(yù)處理后圖像供后續(xù)目標(biāo)檢測(cè);
目標(biāo)檢測(cè)中,閾值的確定關(guān)系著目標(biāo)檢測(cè)的準(zhǔn)確性和快速性,其閾值應(yīng)能過(guò)濾掉絕大部分的背景像素點(diǎn),且能保留目標(biāo)信息。本文閾值確定采用以下公式進(jìn)行計(jì)算;
其中T 為最終計(jì)算出的閾值,Mp 為圖像中ROI 區(qū)域中最大像素值,θ 為比例因子。
本文將通過(guò)統(tǒng)計(jì)法進(jìn)行目標(biāo)位置確定,即通過(guò)統(tǒng)計(jì)計(jì)算超出閾值的目標(biāo)像素位置的上下左右坐標(biāo),進(jìn)而確定目標(biāo)形心位置,確定目標(biāo)位置后,對(duì)目標(biāo)位置進(jìn)行真假判定,本文使用多幀幀間關(guān)聯(lián)方法進(jìn)行判斷,即假設(shè)目標(biāo)在連續(xù)運(yùn)動(dòng)過(guò)程中,其位置不會(huì)出現(xiàn)大幅跳動(dòng)的情況,下一幀的位置將與上N 幀之間具有一定的關(guān)系,利用此關(guān)系,可對(duì)當(dāng)前檢測(cè)的目標(biāo)位置進(jìn)行真假判定。這里選擇連續(xù)三幀數(shù)據(jù)進(jìn)行目標(biāo)判斷,假設(shè)目標(biāo)運(yùn)動(dòng)過(guò)程中未出現(xiàn)劇烈跳動(dòng),即速度和方向不會(huì)出現(xiàn)未知變化,使用歐幾里得距離進(jìn)行計(jì)算,根據(jù)置信度來(lái)決策當(dāng)前檢測(cè)出的目標(biāo)是否為所需目標(biāo),即以目標(biāo)上一幀目標(biāo)位置為圓心,半徑為閾值的2 維圖像上繪制一個(gè)圓,目標(biāo)應(yīng)在該圓之內(nèi),而不應(yīng)出現(xiàn)在該圓之外。
2.3.5 攪拌速率 攪拌速率會(huì)引起溶液反應(yīng)濃度差而導(dǎo)致質(zhì)子化轉(zhuǎn)移,同時(shí)也能減少局部溫度過(guò)高降低重排幾率。一般不會(huì)影響合成的產(chǎn)率,但會(huì)使反應(yīng)得到產(chǎn)品外觀和整體性能有所差異。實(shí)驗(yàn)長(zhǎng)鏈烯基A和有機(jī)胺B比例為1∶1.2,反應(yīng)溫度控制在25℃,反應(yīng)時(shí)間6h,催化劑比例為0.25%,實(shí)驗(yàn)結(jié)果見(jiàn)圖7。
ROI 區(qū)域即圖像處理中的感興趣區(qū)域,ROI 區(qū)域的確定決定著后續(xù)目標(biāo)處理檢測(cè)的效率和準(zhǔn)確性。這里主要使用目標(biāo)運(yùn)動(dòng)的位置坐標(biāo)(x,y)和目標(biāo)運(yùn)動(dòng)的速度Vx,Vy。
圖示如圖2 所示。
定義初始化ROI 區(qū)域?yàn)椋阂訰x,Ry 為左上定點(diǎn),寬度為W,高度為Н 的矩形區(qū)域。第N 幀ROI 區(qū)域示例如圖3 所示。
如圖4 所示,第N+1 幀ROI 區(qū)域更新定義如下:
圖4:第N+1 幀ROI 區(qū)域示例
圖5:視頻處理時(shí)間統(tǒng)計(jì)圖
假設(shè)原圖像寬度為L(zhǎng),高度為P。
目標(biāo)檢測(cè)成功時(shí):
目標(biāo)檢測(cè)失敗時(shí),將根據(jù)上上幀目標(biāo)數(shù)據(jù)進(jìn)一步擴(kuò)大更新ROI區(qū)域,其策略為以上上幀ROI 區(qū)域左頂點(diǎn)為基礎(chǔ),檢測(cè)ROI 區(qū)域:
目標(biāo)檢測(cè)成功時(shí):
攝像機(jī)分辨:1800*1400 幀:25 幀 攝像機(jī)靜止放置,視頻共5564 幀。
從表1、圖5-7 所示,可知,本文算法在處理1800*1400 分辨率的視頻時(shí),首幀處理時(shí)間為405ms,目標(biāo)檢測(cè)成功后,其處理時(shí)間下降為20ms,同時(shí)從表中可看出在3536-3880 幀時(shí),算法處理時(shí)間增加為277ms,在3881 幀后,算法處理時(shí)間又下降為19ms,分析可知,首幀處理時(shí)間較長(zhǎng),其原因?yàn)樗惴ㄌ幚硎讕瑫r(shí),進(jìn)行全屏檢測(cè),待目標(biāo)檢測(cè)到后,算法自動(dòng)創(chuàng)建ROI 區(qū)域,因此后續(xù)檢測(cè)時(shí)間迅速下降,其處理時(shí)間降低為原來(lái)的1/20,證明該算法具有較好的處理速度;經(jīng)觀看視頻分析,在3536-3880 幀時(shí),目標(biāo)從攝像機(jī)視場(chǎng)中消失,在3881 幀時(shí),目標(biāo)又再次進(jìn)入攝像機(jī)視場(chǎng)中,因此,算法處理時(shí)間又下降為19ms,即該算法對(duì)于消失在攝像機(jī)視場(chǎng)中的目標(biāo),當(dāng)目標(biāo)再次進(jìn)入視場(chǎng)后,仍能較好的對(duì)目標(biāo)進(jìn)行二次檢測(cè)跟蹤。
圖6:目標(biāo)位置x 坐標(biāo)統(tǒng)計(jì)圖
圖7:目標(biāo)位置y 坐標(biāo)統(tǒng)計(jì)圖
圖8:視頻處理時(shí)間統(tǒng)計(jì)圖
圖9:目標(biāo)位置x 坐標(biāo)統(tǒng)計(jì)圖
圖10:目標(biāo)位置y 坐標(biāo)統(tǒng)計(jì)圖
表1:視頻處理時(shí)間統(tǒng)計(jì)表
表2:視頻處理時(shí)間統(tǒng)計(jì)表
攝像機(jī)分辨:2048*2048幀:25攝像機(jī)處于晃動(dòng)過(guò)程,視頻共1750 幀。
數(shù)據(jù)統(tǒng)計(jì)圖示如下:
從表2、圖8-10 所示,可知,本文算法在處理2048*2048 分辨率的視頻時(shí),首幀處理時(shí)間為687ms,目標(biāo)檢測(cè)成功后,其處理時(shí)間下降為34ms,分析可知,首幀處理時(shí)間較長(zhǎng),其原因?yàn)樗惴ㄌ幚硎讕瑫r(shí),進(jìn)行全屏檢測(cè),待目標(biāo)檢測(cè)到后,算法自動(dòng)創(chuàng)建ROI區(qū)域,因此后續(xù)檢測(cè)時(shí)間迅速下降,其處理時(shí)間降低為原來(lái)的約1/20,說(shuō)明本文算法對(duì)于動(dòng)態(tài)攝像機(jī)場(chǎng)景仍具有較好的處理效果。
由第3 章節(jié)可知,本文算法對(duì)靜態(tài)或動(dòng)態(tài)環(huán)境下目標(biāo)檢測(cè)效果都取得了較好的效果,且算法具有較好的魯棒性,對(duì)背景圖像變化不敏感。不足之處為若首幀檢測(cè)目標(biāo)為假目標(biāo)時(shí),后續(xù)檢測(cè)將在一個(gè)錯(cuò)誤基礎(chǔ)上開(kāi)展,對(duì)于該問(wèn)題可使用模板匹配算法或者人工干預(yù)進(jìn)行首幀目標(biāo)位置確定,后續(xù)可針對(duì)該問(wèn)題進(jìn)行研究。