李東賓,高宏偉,2,王 輝
(1.沈陽理工大學(xué) 自動化與電氣工程學(xué)院,沈陽 110159;2.中國科學(xué)院沈陽自動化研究所 機(jī)器人學(xué)國家重點實驗室,沈陽 110016)
基于“玉兔號”月面數(shù)據(jù)的圖像分割算法研究
李東賓1,高宏偉1,2,王 輝1
(1.沈陽理工大學(xué) 自動化與電氣工程學(xué)院,沈陽 110159;2.中國科學(xué)院沈陽自動化研究所 機(jī)器人學(xué)國家重點實驗室,沈陽 110016)
月球表面環(huán)境感知是月球車自主導(dǎo)航的關(guān)鍵,月巖和月坑作為代表性的月面環(huán)境特征是月球車行駛過程中的主要障礙物。針對月球車自主導(dǎo)航和探測問題提出一種月巖和月坑的分割方法,首先對具有代表性的月面環(huán)境(月巖、月坑)進(jìn)行各異向性擴(kuò)散濾波(PM濾波),然后用最大類間方差法(Otsu)進(jìn)行詳細(xì)研究,對比分析最大類間方差法及基于最大類間方差法的兩種改進(jìn)方法。實驗結(jié)果表明,基于粒子群的二維最大類間方差法在分割月巖和月坑圖像時可取得較理想的效果。最后結(jié)合已有的三維重建平臺,很好地在其基礎(chǔ)上加入圖像分割模塊,為下一步避障和路徑規(guī)劃做準(zhǔn)備。
月巖月坑分割;二維Otsu;粒子群;PM濾波;
月球是距離地球最近的自然天體.對其進(jìn)行探測將具有重要的價值,由于月面環(huán)境和地面環(huán)境相比,具有情況更加復(fù)雜、不確定性因素多、高度依賴視覺圖像等特點,因此能夠更好的進(jìn)行探測試驗一直是國內(nèi)外研究的重點。
在進(jìn)行星際探測時,無人探測車是一種經(jīng)濟(jì)、高效的工具。但由于環(huán)境的未知性,建立一套切實可靠的感知系統(tǒng)十分必要。在月球車探測過程中,遇到的障礙物主要包括月巖和月坑等,因此準(zhǔn)確的識別出這些障礙物是進(jìn)行探測活動的關(guān)鍵。針對月球表面的月巖和月坑識別方面,目前研究的相關(guān)文獻(xiàn)較少,較多的是針對月球隕石坑的研究[1-2]。吉林大學(xué)在月表月巖和月坑的研究方面提出了幾種有效的識別方法,主要有結(jié)合最小誤差分割原理的形態(tài)學(xué)梯度法[3]、基于Fisher準(zhǔn)則函數(shù)分割算法[4]和基于區(qū)域生長[5]等方法。
2013年12月2日,我國成功發(fā)射了嫦娥三號探測器,并陸續(xù)展開了“觀天、看地、測月”的科學(xué)探索和其他預(yù)定任務(wù)。而搭載其上的月面巡視探測器(“玉兔號”月球車)是我國第一個實現(xiàn)月球軟著陸的無人登月探測器,月球車配置了全景相機(jī)、測月雷達(dá)等4種科學(xué)探測有效載荷[6]。全景相機(jī)作為玉兔號的重要科學(xué)載荷,主要依靠月球車的自我移動及桅桿提供的方位和俯仰運動實現(xiàn)對不同區(qū)域的成像。
本文針對嫦娥三號探測任務(wù),利用“玉兔號”無人探測器發(fā)回來的科學(xué)數(shù)據(jù)對月面環(huán)境進(jìn)行研究。首先對獲得的全景相機(jī)照片進(jìn)行各異向性擴(kuò)散濾波,然后在此基礎(chǔ)上利用基于粒子群改進(jìn)的二維最大類間方差法進(jìn)行二值化,最后結(jié)合形態(tài)學(xué)去除噪聲并利用外接矩形在原圖中標(biāo)出所要分割目標(biāo),即月巖和月坑。為下一步路徑規(guī)劃和自主導(dǎo)航提供技術(shù)支撐。
全景相機(jī)在月球車的位置如圖1所示。
嫦娥三號全景相機(jī)是一套雙目光學(xué)儀器,左右2臺相機(jī)共同安裝在巡視器桅桿上,主要參數(shù)如表1所示。
表1 全景相機(jī)主要參數(shù)
圖1 我國第一個無人登月探測器
數(shù)字圖像的噪聲主要來源于圖像的獲取和傳輸過程。在圖像的預(yù)處理過程中,常見的濾波算法有均值濾波、中值濾波、高斯濾波等。各向異性擴(kuò)散濾波[7-8]主要用來平滑圖像,其克服了高斯模糊的缺陷,能夠很好的保留圖像邊緣。
20世紀(jì)90年代初期,Perona等[9]根據(jù)熱傳導(dǎo)方程建立了各異向性擴(kuò)散方程,并將其應(yīng)用到圖像處理中(稱PM算法)。PM算法將圖像看作熱量場,每個像素看作熱流,根據(jù)當(dāng)前像素和周圍像素的關(guān)系,來確定是否要向周圍擴(kuò)散;其主要思想是將圖像在尺度空間中劃分為不同尺度的區(qū)域,在同一尺度區(qū)域內(nèi)進(jìn)行平滑,而在不同尺度區(qū)域之間(邊緣或邊界)減少平滑,因此在某種意義上也可以將PM算法看成對圖像邊緣“增強(qiáng)”。在PM算法中,邊緣采用常用的梯度微分算子來識別,其主要迭代方程如下:
(1)
(2)
(3)
當(dāng)梯度較小時,意味著對應(yīng)的中心像素在尺度區(qū)域內(nèi),這時擴(kuò)散方程如同低通濾波一樣進(jìn)行平滑;當(dāng)梯度較大時,意味著對應(yīng)的中心像素是邊緣或在邊緣附近,這時擴(kuò)散方程擴(kuò)散的行為變得很不明顯,從而保持了圖像的邊緣信息。
為驗證各向異性擴(kuò)散濾波能夠有效地保留圖像邊緣信息,以標(biāo)準(zhǔn)測試圖像house和常用的高斯濾波為例,分別對原圖進(jìn)行各異向性擴(kuò)散濾波和高斯核為3×3的高斯濾波,然后進(jìn)行參數(shù)相同的canny邊緣檢測,效果如圖2所示。
圖2 邊緣檢測效果圖
由圖2可知,各異向濾波相比高斯濾波可以更好地保留邊緣。其中各異向濾波邊緣像素個數(shù)為2033個,所占視場比率為0.0310211;高斯濾波邊緣像素個數(shù)為1956個,所占視場比率為0.0298462。
形態(tài)學(xué)(morphology)一詞通常表示生物學(xué)的一個分支。而圖像處理中的形態(tài)學(xué),往往指的是數(shù)學(xué)形態(tài)學(xué)(Mathematical morphology),它是建立在格論和拓?fù)鋵W(xué)基礎(chǔ)上的圖像分析學(xué)科,其基本運算包括:腐蝕和膨脹、開運算和閉運算、擊中擊不中變換等。
最基本的形態(tài)學(xué)操作有兩種,分別是:膨脹和腐蝕。其他操作都是建立在最基本的操作之上。從數(shù)學(xué)角度來說,膨脹和腐蝕是將圖像與核進(jìn)行卷積運算。通常核是一個小的、中間帶有參考點的正方形或圓形,也可以是任意形狀和大小。膨脹和腐蝕主要用來消除噪聲、求圖像的梯度等。實驗部分正是運用形態(tài)學(xué)來消除噪聲以達(dá)到提取目標(biāo)(月巖和月坑)的目的。
圖像分割在圖像處理中占有十分重要的地位,分割結(jié)果的好壞直接影響到圖像的后續(xù)處理,甚至最終結(jié)果。閾值分割是圖像分割中常用的方法,其難點是分割閾值的選取。針對不同的應(yīng)用場景,閾值的選取也有所不同,常用選取閾值的方法[10]有:迭代法、雙峰法、最大類間方差法、最大熵法等等。本文針對月面真實環(huán)境,就最大類間方差進(jìn)行詳細(xì)討論,對比最大類間方差法及基于最大類間方差法的兩種改進(jìn)方法。下文提及的前景目標(biāo)均為月巖或月坑。
在圖象分割中,閾值化是一個廣泛使用的工具,最大類間方差[11](Otsu)法是一種自動非監(jiān)督的閾值選擇法,最早由日本學(xué)者提出,又叫大津法,簡稱Otsu,是基于一種判別式測度準(zhǔn)則,最佳的閾值在該測度函數(shù)取最大時得到,其基本思想是按圖像的灰度特性,將圖像分成背景和前景部分。背景和前景之間的類間方差越大,說明構(gòu)成圖像的這兩部分差別越大,分割越精準(zhǔn)。該方法具有速度快、容易實現(xiàn)等優(yōu)點。
Otsu算法的流程如下:
假定閾值t將圖象分成前景μ0和背景μ1兩個部分。
Step1:計算直方圖并歸一化,前景點數(shù)占圖像比例為ω0,平均灰度為μ0;背景點數(shù)占圖像比例為ω1,平均灰度為μ1。
Step2:計算整幅圖像灰度均值:μ=ω0μ0+ω1μ1。
Step3:前景和背景圖像的方差為
g(t)=ω0*(μ0-μ)2+ω1*(μ1-μ)2
使得g(t)取得最大值時的t即為所求得的閾值T。
在實際圖像中由于噪聲干擾等因素的影響,使得圖像的灰度直方圖分布不一定出現(xiàn)明顯的波峰和波谷。此時一維Otsu算法不適合用于確定圖像的分割閾值,因此引入二維直方圖[12],將灰度信息擴(kuò)散到二維[13-14]。
設(shè)f(x,y)(1≤x≤M,1≤y≤N)是一幅大小為M×N的圖像,其灰度級為L。在每個像素點處,計算其n×n鄰域的平均灰度值,得到一幅平滑的圖像g(x,y)。由此可形成一個二元組:像素點的灰度值和其鄰域的平均灰度值。設(shè)rij為圖像中灰度級為i鄰域灰度級為j的像素的個數(shù),那么定義相應(yīng)的聯(lián)合概率密度pij=rij/(M×N),i=1,2,…,L,j=1,2,…,L。pij即為圖像的二維直方圖,是一個L×L的矩陣,如圖3所示。
圖3 二維直方圖
假設(shè)閾值向量(s,t)將二維直方圖分成4個區(qū)域。對于背景和目標(biāo)內(nèi)部的像素而言,其灰度值與鄰域平均值接近,而對位于邊界和噪聲處的像素,其灰度值與鄰域平均值有很大差別,因此區(qū)域0和1代表目標(biāo)或背景區(qū)域,而區(qū)域2和3代表邊界點或噪聲點。由于邊界和噪聲點占極少數(shù),因此可假設(shè)二維直方圖中遠(yuǎn)離對角線的分量近似為0。設(shè)圖像中存在背景C0和目標(biāo)C1兩類,那么兩類的概率分別為
(4)
(5)
背景C0和目標(biāo)C1兩類對應(yīng)的均值向量分別為
(6)
二維直方圖總的均值向量為
由于假設(shè)遠(yuǎn)離對角線方向的分量近似為零,有
ω0+ω1≈1,μT≈ω0μ0+ω1μ1
(8)
定義類間方差矩陣為
(9)
以矩陣σB(s,t)的跡作為類間離散度的測度
tr[σB(s,t)]=
(10)
(11)
即在L×L空間內(nèi)搜索使得式(11)最大。
為驗證二維直方圖的分布特性,利用分辨率為512×512的灰度Lenna標(biāo)準(zhǔn)測試照片,生成的二維直方圖如圖4所示。
圖4 Lenna的二維直方圖
二維Otsu方法同時考慮了圖像的灰度信息和像素間的空間鄰域信息,是一種有效的圖像分割方法,針對二維Otsu方法計算量大的特點,采用粒子群算法[15]來搜索最優(yōu)二維閾值向量。
受鳥集群飛行覓食行為的啟發(fā),Kennedy等于1995年提出了一種新的進(jìn)化算法,即粒子群算法(PSO)[16]。PSO是一種基于群體和適應(yīng)度的全局優(yōu)化方法,在PSO算法中,群體中的每個個體稱為“粒子”,在D維解空間中,每個粒子i有一個位置xi=(xi1,xi2,…,xiD)和“飛行”速度vi=(vi1,vi2,…,viD)。粒子的位置表示問題的解,其對應(yīng)的目標(biāo)函數(shù)值作為評價該粒子優(yōu)劣程度的適應(yīng)度,速度表示粒子在解空間中的當(dāng)前位置移動到下一個位置的速度大小。
PSO算法首先初始化一群具有隨機(jī)位置和速度的粒子,然后通過迭代的方式在解空間中尋找最優(yōu)解。在迭代過程中,每個粒子動態(tài)跟蹤兩個極值來更新其位置和速度。假設(shè)在第t次迭代時刻,粒子i目前所找到的最優(yōu)解為pBesti,稱為個體極值;整個粒子群目前找到的最優(yōu)解為gBest,稱為全局極值。在t+1次迭代時刻,粒子i根據(jù)上述兩個極值,由以下公式更新自己的速度:
(12)
然后以速度vi(t+1)從當(dāng)前位置移動到下一個位置,即
xi(t+1)=xi(t)+vi(t+1)
(13)
式中:t代表迭代次數(shù);w代表慣性因子;c1和c2是學(xué)習(xí)因子,通常c1=c2=2;r1、r2是均勻分布在(0,1)區(qū)間上的隨機(jī)數(shù)。為防止粒子陷入局部最優(yōu),迭代過程中粒子的速度限制[2,vmax],vmax=5,進(jìn)而保證粒子位置可以覆蓋整個灰度空間。粒子在解空間中不斷地跟蹤個體極值和全局極值進(jìn)行搜索,直到達(dá)到規(guī)定的迭代次數(shù)N=50。
為減少二維Otsu分割方法的計算量,本文采用粒子群算法來搜索最佳的閾值向量,其基本流程如下:
Step1:隨機(jī)生成m個二維粒子,粒子的位置從(10,50)之間隨機(jī)產(chǎn)生,速度在[ -vmax,vmax]之間隨機(jī)產(chǎn)生。實驗時m=20,vmax=5。
Step2:根據(jù)最大類間方差公式計算每個粒子的方差,更新m個粒子的局部極值pBesti(i=1,2,…,m)和整個粒子群的全局極值gBest。
Step3:根據(jù)速度和位置更新公式更新每個粒子。實驗時w=0.9-t×0.5/N,c1=c2=2。
Step4:令t=t+1,返回Step2直至t=N。
Step5:輸出粒子群的最佳閾值向量(s′,t′),因為s′和t′十分接近,本文利用s′作為最佳閾值。
設(shè)分割后圖像為fs′,t′(x,y),則
(14)
根據(jù)式(1)~式(3)進(jìn)行試驗,分別對月巖和月坑照片進(jìn)行濾波,實驗效果如圖5所示。
圖5 濾波前后效果圖
為驗證上述算法在月面環(huán)境下分割目標(biāo)月巖、月坑的有效性。以下所有試驗數(shù)據(jù)均在處理器為Inter(R) Core(TM) i5-4590 CPU為 3.30GHz、運行內(nèi)存為4G、系統(tǒng)為64位Window7的臺式電腦上進(jìn)行。
采用本文4.1節(jié)濾波后的照片,然后分別利用Otsu、二維Otsu和PSO+二維Otsu求取最佳閾值,結(jié)果如表2所示。
表2 圖像分割最佳閾值
由表2可知,月巖圖像在Otsu算法下取得的閾值和改進(jìn)后的兩種算法差別較大,即采用Otsu算法得到最佳閾值為68,而采用二維Otsu算法時得到結(jié)果為77。月坑圖像在三種算法下取得閾值較為接近。對比二維Otsu算法和二維Otsu+PSO算法在最佳閾值處的類間方差,可知二維Otsu+PSO算法得到的類間方差(398.184/2653.34)均大于二維Otsu算法得到的類間方差(397.74/2649.21),即二維Otsu+PSO算法可以最大化分開前景目標(biāo)和背景,并且二維Otsu+PSO的運算時間相比二維Otsu略有提高。綜上,二維Otsu+PSO算法在閾值獲取和時間效率上均可達(dá)到最優(yōu)。
月巖和月坑的提取效果如圖6、圖7和圖8所示,由效果圖可知,針對需要分割的目標(biāo)月巖和月坑,分割準(zhǔn)確率達(dá)到100%,沒有出現(xiàn)誤分情況。其中圖6a、圖7a、圖8a和圖6d、圖7d、圖8d均為采用上述算法取得的二值圖;圖6b、圖7b、圖8b和圖6e、圖7e、圖8e均為利用形態(tài)學(xué)去噪后從背景中分離出來的前景目標(biāo);圖6c、圖7c、圖8c和圖6f、圖7f、圖8f均為在原圖中將目標(biāo)利用外界矩形標(biāo)出的效果圖。
圖6 月巖和月坑的提取效果圖(Otsu)
圖7 月巖和月坑的提取效果圖(二維Otsu)
圖8 月巖和月坑的提取效果圖(二維Otsu+PSO)
本文在“玉兔號”數(shù)據(jù)的基礎(chǔ)上,針對月球車自主導(dǎo)航和探測問題提出了一種基于粒子群的二維最大類間方差法的分割算法。通過實驗對比可以發(fā)現(xiàn)基于粒子群改進(jìn)的二維最大類間方差法更適合于月表月巖和月坑的分割。結(jié)合形態(tài)學(xué)去噪等操作成功分割出目標(biāo)區(qū)域:月巖和月坑,并且能夠很好地滿足已有三維重建平臺的要求,為后期進(jìn)行路徑規(guī)劃和自主導(dǎo)航提供技術(shù)儲備。
[1] 丁萌,曹云峰,吳慶憲.一種從月面圖像檢測隕石坑的方法[J].宇航學(xué)報,2009,30(3):1243-1248.
[2] 何江.基于隕石坑匹配的月球精確著陸導(dǎo)航方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.
[3] 王榮本,顧柏園,郭烈,等.月球環(huán)境感知中的石塊識別方法研究[J].計算機(jī)工程,2006,32(15):174-175.
[4] 張如高.基于機(jī)器視覺的月表石塊識別方法研究[D].長春:吉林大學(xué),2007.
[5] 楊強(qiáng),吳中福,余萍.一個基于區(qū)域生長的石塊圖像分割系統(tǒng)[J].計算機(jī)科學(xué),2004,31(9):191-193.
[6] 代樹武,吳季,孫輝先,等.嫦娥三號巡視器有效載荷[J].空間科學(xué)學(xué)報,2014,34(3):332-340.
[7] 錢惠敏,茅耀斌,王執(zhí)銓.基于各向異性擴(kuò)散的幾種平滑算法比較及改進(jìn)[J].南京理工大學(xué)學(xué)報:自然科學(xué)版,2007,31(5):605-611.
[8] 馬捷,嚴(yán)家斌,劉貴忠,等.混合噪聲的各向異性擴(kuò)散平滑[J].中南大學(xué)學(xué)報:自然科學(xué)版,2010,41(1):231-237.
[9] PERONA P,MALIK J.Scale-space and edge detection using anisotropic diffusion[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,1990,12(7):629-639.
[10]齊麗娜,張博,王戰(zhàn)凱.最大類間方差法在圖像處理中的應(yīng)用[J].無線電工程,2006,36(7):25-26.
[11]王璇,張帆,程京.基于改進(jìn)最大類間方差法的灰度圖像分割[J].微計算機(jī)信息,2010,26(35):206-207.
[12]王永波,陳繼榮.二維Otsu閾值分割算法的改進(jìn)及應(yīng)用[J].計算機(jī)仿真,2008(4):263-266.
[13]唐英干,劉冬,關(guān)新平.基于粒子群和二維Otsu方法的快速圖像分割[J].控制與決策,2007,22(2):202-205.
[14]吳一全,樊軍,吳詩婳.改進(jìn)的二維Otsu法閾值分割快速迭代算法[J].電子測量與儀器學(xué)報,2011,25(3):218-225.
[15]徐翠,陳蒙愛,王廣君.基于粒子群算法的二維Otsu閾值分割法[J].儀器儀表用戶,2009,16(2):102-103.
[16]KENNEDY J,EBERHART R.Particle swarm optimization[C]//IEEE International Conference on Neural Networks Proceedings,Perth,Western Australia,1995:1942-1948.
ResearchonImageSegmentationAlgorithmBasedon“JadeRabbit”Data
LI Dongbin1,GAO Hongwei1,2,WANG Hui1
(1.Shenyang Ligong University,Shenyang 110159,China;2.State Key Laboratory of Robotics,Shenyang Institute of Automation,Chinese Academy of Sciences,Shenyang 110016,China)
Lunar surface environmental perception is the key to lunar rover autonomous navigation.Moon rocks and moon pits are main obstacles as representative characteristics of lunar surface in the driving process of lunar rover.A segmentation method is proposed for lunar rover navigation and detection problems.The maximum interclass variance method (Otsu) is studied in detail after performing anisotropic diffusion filter (PM filter).The maximum interclass variance method and two improved methods based on the maximum interclass variance method are compared and analyzed.Experimental results show that Particle swarm algorithm based two-dimensional maximum interclass variance method can achieve better results for segmenting images of moon rocks and moon pits,which provides technical reserves for obstacles avoidance and path planning combined with the existing three-dimensional reconstruction platform.
moon rocks and splits segmentation;Two-dimensional Otsu;particle swarm optimization;PM filter;
2017-03-31
機(jī)器人學(xué)國家重點實驗室開放課題資助項目(2016008)
李東賓(1992―),碩士研究生;通訊作者:高宏偉(1978―),男,教授,博士,研究方向:計算機(jī)視覺、智能控制。
1003-1251(2017)06-0061-07
TM921.01
A
王子君)