李歲月,陳 柳
(武漢理工大學 自動化學院,湖北 武漢 430070)
建筑物輪廓的提取和分類識別在軍事目標識別、城市建設、抵御和減少災難等上有很高的應用[1],提高建筑物的提取精度和效率對城市規(guī)劃、三維城市重建等有重要意義。搭載在無人機上的電荷耦合器件(Charge Coupled Device,CCD)攝像機能輕易地捕捉到大量的地物和空間信息[2],但受環(huán)境因素影響較大,城鄉(xiāng)建筑密度差異較大,分布不規(guī)則導致不利于紋理[3]的分析。因此,作為無人機視覺系統(tǒng)中最為重要的技術(shù),利用數(shù)字圖像圖像處理技術(shù)和前沿的計算機視覺理論來實現(xiàn)復雜環(huán)境下的建筑物檢測與提取具有重要意義。
本次研究用于獲取數(shù)據(jù)源采用的是普通民用大疆精靈系列精靈3無人機,于2017年冬季在武漢市某實驗小區(qū)上的70~200米的飛行高度上收集的一組航拍圖像。無人機在作業(yè)時受到航拍姿態(tài)、天氣和高度等因素影響,會有模糊等崎變的現(xiàn)象發(fā)生,在進行特征提取之前要進行預處理,才能排除干擾提取出更多的特征,使算法更加高效。
采用限制對比度自適應直方圖均衡重新分布亮度比例來提高無人機圖像的對比度,能夠保留圖像的細節(jié)特征。對比度受限的自適應直方圖均衡化(Contrast Limited Adaptive Histogram Equalization,CLAHE)是對自適應直方圖均衡化(Adaptive Histgram Equalization,AHE)的優(yōu)化,能夠抑制AHE放大同區(qū)域間噪聲的影響,CLAHE算法原理是預先設置一定的閾值裁剪直方圖來抑制放大的幅度,并將裁剪掉的部分均勻地分布到直方圖的其他部分。算法過程為:首先把源圖像分為3塊;其次,統(tǒng)計每個子塊的直方圖,裁剪門限值后對直方圖均衡化;最后,線性插值重構(gòu)、重鏈接,則得到最后的圖像方法。
極大值穩(wěn)定區(qū)域(Maximally Stable Extremal Regions,MSER)[5]是一種類似分水嶺圖像的分割與匹配算法,近年來MSER多應用于場景文本檢測并取得了非常好的效果。最大極穩(wěn)定區(qū)域是指對于A1,A2,……,An-1,An,n∈N包含局部極值區(qū)域集,滿足An-1∈An,若區(qū)域變化率在nmax處取得極小值時,則區(qū)域Anmax為最大極穩(wěn)定區(qū)域。極值區(qū)域反映的就是集合中的像素灰度值總大于或小于其鄰域區(qū)域像素的灰度值。MSER對每一個局部極值區(qū)域進行閾值劃分,尋找一系列閾值集來實現(xiàn)局部圖像變換。對于最大極穩(wěn)定區(qū)域,通過局部閾值集操作,區(qū)域內(nèi)的像素數(shù)量變化是最小的。
David Nister等[8]2008年發(fā)表的論文中改進了Matas等人于2002年提出的MSER算法,該算法計算的時間復雜度要比原著MSER算法小得多,其數(shù)學公式為
Qi表示閾值為i時的某一連通區(qū)域,?為灰度閾值的微小變化量,qi為閾值是i時的區(qū)域Qi的變化率。當qi為局部極小值時,則Qi為最大穩(wěn)定極值區(qū)域。
對預處理之后的無人機圖像建筑區(qū)域的MSER特征的提取步驟如下:
像素點排序,極值區(qū)域生成,穩(wěn)定區(qū)域判定,區(qū)域擬合,區(qū)域歸一化。為了同時得到圖像的最大和最小灰度,可以預先將圖像的灰度反轉(zhuǎn):Ir=255-I,再進行一遍算法檢測。利用檢測到的灰度以及反值灰度提取出MSER特征點,在此基礎上進行位移操作,在檢驗的圖像中利用橢圓標記計算出圖像的穩(wěn)定區(qū)域的數(shù)量,作為提取的MSER特征。
分析本次實驗圖像可知信息清晰、地物結(jié)構(gòu)明顯的特點可知,圖片中包含的目標信息有限,以目標提取物為主,干擾因素如植被、道路、陰影占據(jù)較少的信息量。對于分類較少的場景,模糊均值聚類(Fuzzy C-Means,F(xiàn)CM)方法具有速度快、提取效率高、無需進行訓練的優(yōu)勢,F(xiàn)CM算法可以通過對目標函數(shù)的優(yōu)化而得到各個樣本點對全部類中心的隸屬度,來判斷樣本點所屬類別,以此來對數(shù)據(jù)進行分類。所以本文選擇基于 FCM 聚類算法來對建筑物進行聚類提取。其算法流程如下:用0~1之間的隨機數(shù)初始化隸屬矩陣U,數(shù)據(jù)的隸屬度和為1;計算聚類中心Ci,i=1......C;計算價值函數(shù),若價值函數(shù)小于某個確定的閾值,或者相比上次的改變量小于某個閾值,則停止算法;重新計算U矩陣,進行第二步操作。
在初始化聚類中心后,執(zhí)行此迭代過程,以此確保FCM收斂于一個最優(yōu)解。
MSER特征經(jīng)過聚類之后,產(chǎn)生了若干個聚類中心,也就是說實驗圖片中含有若干棟建筑物,實驗結(jié)果說明,經(jīng)過此種柔性的聚類劃分,可以迅速地得出建筑物的數(shù)量。
傳統(tǒng)的sobel,prewitt和新興的canny邊緣檢測方法,經(jīng)過實驗發(fā)現(xiàn)難免還是會存在一些問題,尤其是在解決針對此實驗的情況下,還是不能達到預期的處理效果,在檢測精度以及抗噪能力方面還是有些不足。
對聚類分出來的值進行準確的描述成為提高提取準確率的關(guān)鍵,數(shù)學形態(tài)學被證明為是對建筑圖像區(qū)域提取其中有效的方法[4]。利用數(shù)學形態(tài)學對圖像進行提取的方法是:通過選取恰當?shù)慕Y(jié)構(gòu)元素,膨脹操作,將膨脹后的圖像與原圖像做減法即可得到圖像梯度邊緣。
將聚類之后的圖像對圖像進行交替的開閉濾波以平滑圖像,并用橢圓結(jié)構(gòu)元素分別進行邊緣檢測,最終的圖像邊緣是這些方向邊緣的加權(quán)和。
將本文算法提取結(jié)果與將人工目釋標注出的建筑區(qū)域作基準數(shù)據(jù)的提取結(jié)果進行比較。不同樣本數(shù)據(jù)的提取結(jié)果如表1所示,平均正確率達到了90.36%,誤檢率比較低,漏檢率偏高,這是因為在無人機圖像中建筑區(qū)域偏大,灰度變化不明顯,另外建筑邊緣有部分樹木等遮擋物,也是造成誤檢的原因。
表1 不同樣本數(shù)據(jù)的提取結(jié)果
綜上分析,在對無人機圖像進行預處理之后,利用MSER算法對圖像進行特征檢測,采用FCM聚類算法劃分建筑物個數(shù),最后利用形態(tài)學來描述建筑區(qū)域的算法取得了90.36%的準確率,對無人機圖像建筑區(qū)域提取是不錯的方法。另外,在森林地區(qū)由于樹木之間的遮擋、城市人造目標例如汽車、水泥路等造成局部存在穩(wěn)定區(qū)域,會對建筑區(qū)域檢測提取造成誤擾。如何對無人機圖像特征進行準確的劃分研究以及如何優(yōu)化MSER特征提取和增強本文算法的穩(wěn)定性是以后研究工作的方向 。
[參考文獻]
[1]KAAMIN M,IDRIS N A,BUKARI S M,et al.Visual inspection of historical buildings using micro UAV[C].MATEC Web of Conferences, 2017(103):7003.
[2]NISTéR D,STEWéNIUS H.Linear time maximally stable extremal regions[C].Marseille:European Conference on Computer Vision,2018(10):183-196.
[3]SHI C,WANG C,XIAO B,et al.Scene text detection using graph model built upon maximally stable extermal regions[J].Pattern Recognition Letters,2013(2):107-116.
[4]LEFEVRE S,WEBER J.Automatic building extraction in VHR images using advanced morphological operators[J].Urban Remote Sensing Joint Event,2007(20):1-5.