王順然
摘要 本文展示了一種在將圖片根據(jù)顏色數(shù)值進(jìn)行分割之后,使用DBSCAN算法進(jìn)行降噪的方法。本文只討論在點(diǎn)陣圖的情況下的處理方法,矢量圖并不適用。
關(guān)鍵詞 DBSCAN算法;探測(cè)點(diǎn);高斯噪點(diǎn)
中圖分類(lèi)號(hào) U2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào)2095—6363(2016)13—0002—01
數(shù)字照片含有確定行數(shù)與列數(shù)的像素。像素是點(diǎn)圖中最小的基礎(chǔ)單位,包含著表示該點(diǎn)像素顏色或者亮度的數(shù)值。在一張數(shù)字照片中,相似的像素會(huì)聚集。這也就意味著,如果有一個(gè)像素看起來(lái)明顯與附近其他的像素不同,即該像素點(diǎn)的色度值(Grey value或者RGB)與周?chē)狞c(diǎn)明顯不同,這個(gè)像素點(diǎn)很有可能被識(shí)別為一個(gè)噪點(diǎn)?,F(xiàn)在已經(jīng)有很多降噪器(noise deduction filter)的方法被發(fā)明了出來(lái),比如說(shuō),中值降噪器(median filter),會(huì)將圖片中的每個(gè)像素點(diǎn)用附近九個(gè)像素?cái)?shù)值的中位數(shù)來(lái)替換原本的數(shù)值。不同的降噪器可以用來(lái)處理不同的圖片。但是絕大多數(shù)降噪器會(huì)移除部分圖片中的信息。
為了盡量避免圖片中的部分信息被移除,本文會(huì)提供一種探測(cè)圖像噪點(diǎn)的方法,用此方法先來(lái)探測(cè)噪點(diǎn),之后可以用降噪器來(lái)對(duì)已經(jīng)探測(cè)出的噪點(diǎn)進(jìn)行處理,來(lái)盡量避免圖片信息的丟失。
1實(shí)驗(yàn)設(shè)計(jì)
為了能夠?qū)?shù)值相似的像素進(jìn)行聚類(lèi),我們要采取的方法就是將圖像根據(jù)原本像素的數(shù)值進(jìn)行分割(image segmentation),而相對(duì)孤立的點(diǎn)則意味著該點(diǎn)與周?chē)狞c(diǎn)的數(shù)值存在明顯不同。所以,出現(xiàn)在我們的聚類(lèi)算法中的噪點(diǎn),就可以被我們判斷為噪點(diǎn)。在本文中,我們將會(huì)用一種對(duì)數(shù)值進(jìn)行分割的最簡(jiǎn)單的方法,使用臨界值進(jìn)行分割(thresholding)。這種方法是一種古老、簡(jiǎn)單并且受歡迎的對(duì)圖像進(jìn)行分割的方法。
DBSCAN算法在1996年被Martin Ester,Hans Peter Kriegel,Jrg Sander和Xiaowei Xu。我們使用這種算法的主要目的是這種方法是一種基于密度的聚類(lèi)算法。在聚集中的像素的密度要大于噪點(diǎn)中像素的密度。并且DBSCAN算法并不像kmeans算法一樣需要提前給出聚集數(shù)量作為前提條件,而且可以對(duì)于任何形狀的點(diǎn)集進(jìn)行聚類(lèi)。它還可以對(duì)于一個(gè)點(diǎn)集外環(huán)繞但并不連接的另外一個(gè)點(diǎn)集進(jìn)行聚類(lèi)。DBSCAN需要兩個(gè)自定義的參數(shù):掃描半徑(eps)和最小包含的點(diǎn)數(shù)(minPts)。隨機(jī)選取一個(gè)未被訪(fǎng)問(wèn)(unvisited)的點(diǎn)開(kāi)始,找出與其距離在eps之內(nèi)(包括eps)的所有像素點(diǎn)。如果附近點(diǎn)的數(shù)量≥最小包含點(diǎn)數(shù)(minPts),則當(dāng)前點(diǎn)與其附近像素點(diǎn)形成一個(gè)簇(cluster),并且出發(fā)點(diǎn)被標(biāo)記為己訪(fǎng)問(wèn)(visited)。然后,以同樣的方法處理該簇內(nèi)所有沒(méi)有被標(biāo)記為已訪(fǎng)問(wèn)(visited)的點(diǎn),擴(kuò)展該簇。如果附近點(diǎn)的數(shù)量<最小包含點(diǎn)數(shù)(minPts),則該點(diǎn)暫時(shí)被標(biāo)記作為噪點(diǎn)。如果簇充分地被擴(kuò)展,即簇內(nèi)的所有點(diǎn)被標(biāo)記為已訪(fǎng)問(wèn)(visited),然后繼續(xù)使用DBSCAN算法去處理未被訪(fǎng)問(wèn)的其他簇。
2實(shí)驗(yàn)
高斯噪點(diǎn)。高斯噪點(diǎn)指的是一種功率譜函數(shù)是常數(shù),且幅度服從高斯分布,即正態(tài)分布的噪聲信號(hào)。因其可加性、幅度服從正態(tài)分布且功率譜函數(shù)是常數(shù)命名。
3結(jié)論
從實(shí)驗(yàn)結(jié)果中可以發(fā)現(xiàn),我們的算法成功識(shí)別出來(lái)了圖像分割后大多數(shù)的偏離值outlier,證明了本算法能夠用來(lái)探測(cè)圖像噪點(diǎn)。endprint