禹志鵬,龍杜輝,劉康
(200082 上海市 上海理工大學(xué)機(jī)械工程學(xué)院)
隨著生活品質(zhì)日益提高,人們對(duì)海參的需求量越來越大,海參養(yǎng)殖產(chǎn)業(yè)也隨之迅速發(fā)展,但是由于海參的捕撈方式十分麻煩,目前我國(guó)大部分海參的捕撈方式仍然為人力潛水采集為主[1-2],這項(xiàng)工作不僅工作強(qiáng)度大,而且風(fēng)險(xiǎn)系數(shù)非常高,并且人力采集也難以到達(dá)海參捕撈效率要求。減少捕撈人的捕撈風(fēng)險(xiǎn),更快地實(shí)現(xiàn)自動(dòng)化捕撈成為了目前迫切需要解決的問題?,F(xiàn)階段研究與應(yīng)用多以結(jié)合目標(biāo)識(shí)別技術(shù)的水下捕撈機(jī)器人來完成海參識(shí)別與自動(dòng)化或半自動(dòng)化捕撈,為了完成水下作業(yè)任務(wù),機(jī)器人需要具有對(duì)水下目標(biāo)進(jìn)行識(shí)別的能力。
機(jī)器視覺是用可以代替人眼的光學(xué)裝置和傳感器來對(duì)客觀世界三維場(chǎng)景進(jìn)行感知水下機(jī)器,視覺方法的核心是圖像處理技術(shù)。因?yàn)樗颅h(huán)境的特殊性,往往我們攝像頭采集到的圖片不能夠達(dá)到我們后期處理的預(yù)期,需要我們對(duì)圖像首先進(jìn)行圖像增強(qiáng),提高圖像的質(zhì)量和對(duì)比度以便后期進(jìn)行目標(biāo)識(shí)別與三維定位。近年來國(guó)內(nèi)外有一些有關(guān)研究成果公諸于世,Schettini[3]等總結(jié)水下圖像處理可被分為圖像增強(qiáng)和圖像恢復(fù)的方法;Wen[4]等根據(jù) RGB 三個(gè)顏色通道將水下彩色圖像分成3 個(gè)單獨(dú)的彩色圖像,分別對(duì)3 張單獨(dú)的圖像進(jìn)行直方圖均衡化,然后將3 張圖片組合到一起,最終輸出的圖像有著高對(duì)比度與豐富的色彩信息;喬曦[5]等發(fā)現(xiàn)海參和背景圖像在紋理、形狀和顏色等特征上存在差異,因此其基于目標(biāo)與背景之間的差異性完成了對(duì)海參的實(shí)時(shí)識(shí)別。
由此可見,水下圖像增強(qiáng)技術(shù)在目前的視覺研究方面占據(jù)著十分重要的地位。本文以水下海參圖像作為研究對(duì)象,著重研究了水下海參圖像的增強(qiáng)方法,提出了一種改進(jìn)于顏色模型的增強(qiáng)方法,并比較該算法與傳統(tǒng)算法處理圖像后圖像的質(zhì)量指標(biāo),證明了該算法的優(yōu)勢(shì)性,并且在水下圖像增強(qiáng)方面有一定的普適性。
因?yàn)樗拿芏缺瓤諝獯?00 多倍,所以水下環(huán)境的能見度比較低,而且由于水中水介質(zhì)存在的原因,導(dǎo)致光在水中傳播時(shí)會(huì)發(fā)生不同程度的折射與散射現(xiàn)象(如圖1 所示),這就使水下攝像機(jī)拍攝到的目標(biāo)物呈現(xiàn)對(duì)比度低、模糊、光照不均勻等一系列特征。
根據(jù)圖1 的水下成像模型,可以把水下圖像表示為3 個(gè)分量的相加[6]。
圖1 水下成像模型Fig.1 Underwater imaging model
(1)直接衰減分量可以表示為直接被目標(biāo)物反射回來的光線,用式(1)表示:
式中:(x,y)——圖像像素的橫縱坐標(biāo);c——圖像的紅、綠、藍(lán)3 個(gè)顏色通道;E(cx,y)——目標(biāo)物的反射光線;d(x,y)——目標(biāo)物到攝像頭的距離;a(c)——衰減系數(shù)。不同光在水中的衰減系數(shù)是不同的,所以海底圖像隨著深度的增加會(huì)以藍(lán)色綠色為主。
(2)前向散射分量表示目標(biāo)物反射回?cái)z像頭的過程中因?yàn)樗橘|(zhì)而發(fā)生的散射,用式(2)表示:
式中:g(cx,y)——點(diǎn)擴(kuò)散函數(shù);“”——卷積。
(3)后向散射分量表示為非目標(biāo)物周圍的背景經(jīng)過水介質(zhì)散射后進(jìn)入到攝像頭的光線,用式(3)表示:
式中:B∞(c)——背景光。
綜上所述,水下圖像可用式(4)表示:
直方圖均衡化是一種比較簡(jiǎn)單有效的圖像增強(qiáng)算法[7],主要用于增強(qiáng)圖像的灰度范圍較窄的圖像,增強(qiáng)圖像的對(duì)比度,使圖像的灰度大致落在整體部分。
為了方便研究,設(shè)r,s分別為歸一化以后的原圖像的灰度和經(jīng)過直方圖算法處理后的灰度,所以對(duì)于每一個(gè)r都有一個(gè)經(jīng)過變換函數(shù)T(r)的s與之對(duì)應(yīng),用式(5)表示:
根據(jù)概率論的相關(guān)知識(shí)可以知道,設(shè)r的概率密度為pr(r),因?yàn)閟是關(guān)于r的函數(shù),所以s的分布函數(shù)Fs(s)可以表示為式(6):
對(duì)式(6)兩邊同時(shí)求導(dǎo)可得
根據(jù)式(7)可知,HE 是把輸入圖像的累計(jì)分布函數(shù)作為變換函數(shù)的圖像增強(qiáng)技術(shù),這個(gè)算法的優(yōu)點(diǎn)在于算法簡(jiǎn)單,并且運(yùn)行速度快。但是這種算法對(duì)于水下工況較為復(fù)雜的場(chǎng)合并不適用,而且由于對(duì)紅色通道進(jìn)行了過度補(bǔ)償,圖像很容易產(chǎn)生色偏、失真等問題。為了改進(jìn)這類問題,Zuiderveld 提出了限制對(duì)比度的自適應(yīng)直方圖均衡化算法。在提高算法的運(yùn)行速度方面,前人采用了線性插值的方法,這種方法不會(huì)影響算法處理圖像的質(zhì)量而且能有效提高算法處理效率。CLAHE 算法能夠解決HE 算法不能解決的低光照問題,但是在解決顏色失真方面沒有太大效果。
Retinex 是一種常用的建立在科學(xué)實(shí)驗(yàn)和科學(xué)分析基礎(chǔ)上的圖像增強(qiáng)方法,是Land[8]等人從人眼對(duì)顏色的感知特性出發(fā)研究出來的增強(qiáng)算法。Retinex 的理論基礎(chǔ)如下:
(1)任何物體的顏色都是由紅色光、綠色光、藍(lán)色光的反射能力決定的,而不是光線的反射強(qiáng)度來決定。
(2)物體的色彩不會(huì)受到光照的不均勻性而受到影響。
該算法的模型如圖2 所示,攝像頭接受到的圖像Ic(x,y)可以表示為入射光的光照分量乘以物體的反射分量,計(jì)算公式如式(8)所示:
圖2 Retinex 成像模型Fig.2 Retinex imaging model
基于Retinex 理論的增強(qiáng)算法目的是從拍攝到的原始圖像分離出入射光照和目標(biāo)物的反射分量,從而可以消除因?yàn)楣庹詹痪鶆蛞鸬膱D像問題,從而提高圖像質(zhì)量。
該算法基于色彩平衡及對(duì)比度校正技術(shù)。目前對(duì)比度增強(qiáng)技術(shù)被廣泛運(yùn)用于水下圖像處理的領(lǐng)域中,受到國(guó)內(nèi)外學(xué)者的廣泛關(guān)注。該算法目的是通過提高水下圖像的對(duì)比度、細(xì)節(jié)來提高圖像的質(zhì)量。本文在對(duì)比度校正方面使用了直方圖拉伸技術(shù),將全局直方圖拉伸應(yīng)用到圖像直方圖上,在原拉伸模型的基礎(chǔ)上,研究并修改了紅色通道和綠色通道的倍增系數(shù),而藍(lán)色通道選擇原圖像藍(lán)色像素的平均值,最后重組為三通道的彩色圖像,再進(jìn)行后續(xù)操作,更好地提高圖像的質(zhì)量。具體算法可以分為以下3 步:
(1)首先對(duì)RGB 三顏色進(jìn)行顏色平衡;
(2)對(duì)圖像的RGB 模型進(jìn)行對(duì)比度校正;
(3)將RGB 模型轉(zhuǎn)換為HSI 模型,并且對(duì)HSI 模型進(jìn)行對(duì)比度校正。
本文算法對(duì)水下海參圖像處理流程如圖3所示。
圖3 算法流程圖Fig.3 Algorithm flow chart
2.3.1 RGB 三顏色平衡
在水下的工作環(huán)境下,由于紅光的波長(zhǎng)較短,所以水下圖像在紅色通道上數(shù)值較小,導(dǎo)致圖像質(zhì)量不高。為了提高質(zhì)量,首先在第1 步需要對(duì)圖像的顏色進(jìn)行平衡。取3 個(gè)顏色通道的像素最大值,如式(9)—式(11)所示。
通過式(9)—式(11)求得圖像中最顯著的顏色通道,以及該通道下最大的像素點(diǎn)的值,幫助我們后期確定哪些通道需要通過倍增系數(shù)來進(jìn)行增強(qiáng)。第2 步,計(jì)算每個(gè)顏色分量的平均值,如式(12)—式(14)所示。
式中:M×N——圖像中一個(gè)通道的像素?cái)?shù);I(i,j)——某一通道下某一位置的像素值。
之前的RGB 通道顏色平衡主要是假設(shè)保持主色投射通道不變,基于此色偏計(jì)算兩個(gè)倍增因子來和其他兩個(gè)通道相乘。但是本文發(fā)現(xiàn),如果通過使用這種以主要色偏通道作為參考對(duì)象,最低強(qiáng)度通道將會(huì)與更大的倍增因子相乘,這樣這個(gè)較大的倍增因子將會(huì)使原始通道的強(qiáng)度變得不合理,即圖像中對(duì)象的顏色會(huì)偏離原始顏色。因此本文提出了以中值強(qiáng)度顏色通道作為參考對(duì)象,重新構(gòu)造倍增因子,這樣就不會(huì)產(chǎn)生偏離原始顏色的現(xiàn)象。
中間值由式(12)—式(14)計(jì)算出的平均值而確定,將其作為參考值或目標(biāo)值,由此構(gòu)造倍增因子,如式(15)—式(16)所示。
然后將圖像中最小顏色強(qiáng)度通道與A相乘,最大顏色強(qiáng)度通道與B相乘,這樣就能達(dá)到更好的顏色平衡效果,并且不會(huì)造成太大的色偏現(xiàn)象。
2.3.2 RGB 模型對(duì)比度拉伸
低對(duì)比度會(huì)使圖像模糊。針對(duì)水下圖像對(duì)比度較低這一問題,本文通過對(duì)強(qiáng)度值范圍內(nèi)進(jìn)行加權(quán)來擴(kuò)大原來的強(qiáng)度范圍,以達(dá)到增強(qiáng)圖像的對(duì)比度的目的。并且為了保證圖像的清晰度,防止數(shù)值過高或者過低的像素值影響圖像,本文選擇了0.2%~99.8%之間的像素值來進(jìn)行對(duì)比度拉伸。對(duì)比度拉伸公式如式(17)所示。
式中:P0——對(duì)比度校正后的像素值;Pi——待處理的像素值;a——0 的下限值;b——255 的上限值;c——圖像中當(dāng)前存在的最小像素值;d——圖像中當(dāng)前存在的最大像素值。
首先根據(jù)以上基于RGB 模型的對(duì)比度拉伸方法對(duì)拍攝出的海參圖像的像素值進(jìn)行處理,增強(qiáng)紅色通道和綠色通道,得到處理后的圖像,然后再對(duì)該圖像進(jìn)行HSI 模型上的強(qiáng)度拉伸。
2.3.3 HSI 模型對(duì)比度拉伸
在對(duì)圖像進(jìn)行RGB 模型對(duì)比度拉伸以后,需要對(duì)圖像進(jìn)行HSI 模型對(duì)比度拉伸。HSI 是由Hue(色調(diào))、Saturation(飽和度)和Intensity(亮度)3個(gè)分量來表現(xiàn)圖像,圖像的飽和度和亮度是清晰度和可見度的重要參數(shù),因此圖像中的對(duì)象可以與背景明顯區(qū)分開來,避免了在RGB 模型上增強(qiáng)會(huì)引起的顏色偏移的問題。分離了圖像亮度與顏色分量,這種模型更適用于人對(duì)圖像的解釋,且對(duì)圖像的增強(qiáng)處理只需在一個(gè)維度上進(jìn)行,提升了圖像處理速度。
因?yàn)楸疚膶SI 模型拉伸與RGB 模型拉伸結(jié)合起來,所以在對(duì)圖像進(jìn)行HSI 拉伸時(shí),對(duì)下方(朝向黑暗面),上方(朝向明亮面)進(jìn)行處理,這種處理方式能夠很好地將直方圖擴(kuò)展到兩個(gè)方向。圖像中的藍(lán)色區(qū)域可以由“S”“I”來調(diào)整,從而創(chuàng)建出淺藍(lán)色和深藍(lán)色的范圍,使用這種方法可以來控制圖像的對(duì)比度。光照對(duì)于水下圖像也是極其重要的,在該模型中可以通過亮度參數(shù)來調(diào)整。
為了驗(yàn)證本文圖像增強(qiáng)算法的可行性和有效性,實(shí)施了水下海參圖像采集,圖像處理,圖像主觀、客觀對(duì)比等步驟。實(shí)驗(yàn)場(chǎng)景如圖4 所示,包括計(jì)算機(jī)、水下攝像頭、150 L 水箱。
圖4 實(shí)驗(yàn)場(chǎng)景圖Fig.4 Experimental scene
為了模擬在較深水下拍攝圖像的色偏問題,本文在原本的清水中加入了甲基藍(lán)試劑對(duì)水體進(jìn)行染色,使圖像呈現(xiàn)偏藍(lán)、偏綠,并加入少量氫氧化鈉使清水變得略渾濁一點(diǎn),更好地模擬出了海下工作環(huán)境,拍攝出的圖像如圖5 所示。
圖5 水下海參原圖Fig.5 Original picture of sea cucumber
在MATLAB 平臺(tái)上使用不同的增強(qiáng)算法分別為HE,CLAHE,單尺度的Retinex,傳統(tǒng)基于RGB 模型算法和本文算法對(duì)圖像進(jìn)行處理,通過比較主觀評(píng)價(jià)和客觀評(píng)價(jià)得出結(jié)論。
使用上述所有算法對(duì)圖像進(jìn)行處理,通過人眼主觀識(shí)別圖像質(zhì)量的好壞,觀察各圖像對(duì)比度差異,顏色是否均衡,是否存在色偏,判定算法的優(yōu)劣性,處理結(jié)果圖如圖6 所示。
圖6 不同算法的增強(qiáng)圖Fig.6 Enhancement chart of different algorithms
從圖6 明顯可以看出其他算法增強(qiáng)后的圖像存在或多或少的色偏問題,而本文增強(qiáng)算法在改善水下圖像對(duì)比度、色偏等方面更具有優(yōu)勢(shì)性。
通過客觀評(píng)價(jià)圖像質(zhì)量指標(biāo)來對(duì)處理后的圖像進(jìn)行定量分析,合理充分地驗(yàn)證本文增強(qiáng)算法的有效性常用的評(píng)價(jià)指標(biāo)有:均方誤差(MSE),峰值信噪比(PSNR),結(jié)構(gòu)相似性(SSIM)和信息熵,如表1 所示。
表1 所示圖像定量結(jié)果Tab.1 Quantitative results of the images shown
一般來說,均方誤差越小,峰值信噪比越大,說明圖像處理效果越好。信息熵的數(shù)值越大說明圖像包含的信息量越大,而對(duì)于結(jié)構(gòu)相似性指標(biāo)來說,越接近1 表明兩幅圖像的相似性越大。從表1 的分析結(jié)果可知,本文的算法能有效減少噪聲,增強(qiáng)圖像的對(duì)比度,提高圖像的有效信息。
本文以水下海參作為研究對(duì)象,針對(duì)水下圖像模糊、對(duì)比度不高、色偏甚至失真等問題,通過研究并修改色彩均衡模型中的倍增系數(shù),提高了圖像增強(qiáng)的效果,改善增強(qiáng)后圖像的質(zhì)量。對(duì)不同的水下增強(qiáng)算法進(jìn)行研究,并用這些算法對(duì)原始圖像進(jìn)行處理,得到一系列處理后的圖像。通過主觀評(píng)價(jià)和對(duì)圖像質(zhì)量的定量分析,驗(yàn)證了本文算法在水下圖像增強(qiáng)方面的有效性,并且該方法在同類圖像處理方面變現(xiàn)出更好的處理效果。