王燕鳳,馬 寧
(1.西北民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,甘肅 蘭州730030;2.西北民族大學(xué) 中國(guó)民族信息技術(shù)研究院,甘肅 蘭州730030)
圖像作為人類感知世界的視覺(jué)基礎(chǔ),已成為人類獲取信息、表達(dá)信息和傳遞信息的重要手段.統(tǒng)計(jì)表明:在人類獲取的各種信息中,80%以上的信息來(lái)自視覺(jué)信息,或者說(shuō)圖像信息,這包括符號(hào)、文本、圖形、圖像、視頻等信息 .隨著計(jì)算機(jī)技術(shù)和數(shù)字圖像技術(shù)的不斷成熟,圖像作為客觀世界最為直接的信息載體,已成為越來(lái)越重要的研究對(duì)象.
在計(jì)算機(jī)視覺(jué)和圖像分析中,如何把目標(biāo)物體從圖像中有效分割出來(lái),一直是個(gè)難題之一,它決定圖像的最終分析質(zhì)量和模式識(shí)別的判別結(jié)果.圖像分割是指將圖像中具有特殊意義的不同區(qū)域分開來(lái),并使這些區(qū)域相互不相交,且每個(gè)區(qū)域應(yīng)滿足特定區(qū)域的一致性條件[1].圖像一旦被分割,就可作進(jìn)一步的處理,如基于內(nèi)容的圖像檢索、分類及識(shí)別等.因此,圖像分割是圖像處理和模式識(shí)別中的一個(gè)重要研究領(lǐng)域.目前圖像分割的算法主要有閾值分割法、邊緣提取法、區(qū)域分割法、分水嶺分割法等,這些分割算法各有優(yōu)缺點(diǎn).近年來(lái),許多研究人員提出用聚類算法來(lái)分割圖像,并取得了較好的實(shí)驗(yàn)結(jié)果.但如何初始劃分(分類)樣本以及選擇代表點(diǎn)將直接影響分割的效果[2].
由于彩色圖像的大量存在,對(duì)彩色圖像的分割顯得尤為重要.本文從統(tǒng)計(jì)模式識(shí)別的角度出發(fā),將彩色圖像的各個(gè)像素點(diǎn)的色彩分量值看作待分類樣本,進(jìn)行迭代動(dòng)態(tài)聚類.ISODATA算法屬于一種動(dòng)態(tài)聚類算法[3],較C-均值算法有更好的適應(yīng)性和靈活性.由于彩色圖像含有豐富的色彩信息,從多個(gè)信息面描述了圖像中的物體特征,能夠充分發(fā)揮非監(jiān)督聚類算法的優(yōu)勢(shì) .根據(jù)色彩提供的大量信息自動(dòng)形成各個(gè)聚類,各個(gè)聚類能較好地與圖像中本來(lái)物體相吻合,并且在聚類的分析過(guò)程中就完成了物體的標(biāo)號(hào),達(dá)到分割的目的.
ISODATA 算法是統(tǒng)計(jì)模式識(shí)別中非監(jiān)督動(dòng)態(tài)聚類算法中的一種[4].通過(guò)設(shè)定初始聚類中心和聚類數(shù),定義相似度準(zhǔn)則函數(shù)將全部樣本調(diào)整完畢后重新計(jì)算樣本均值作為新的聚類中心 .在調(diào)整樣本過(guò)程中完成聚類分析,動(dòng)態(tài)地進(jìn)行類的“合并”和“分裂”,從而得到類數(shù)比較合理的各個(gè)聚類.ISODATA作為一種動(dòng)態(tài)聚類算法[5],要解決如下問(wèn)題:
1)確定樣本間的相似度函數(shù)D(x,y)=‖x-y‖.
2)確定評(píng)價(jià)聚類結(jié)果質(zhì)量的準(zhǔn)則函數(shù),在這里采用誤差平方和準(zhǔn)則函數(shù):
3)給定某個(gè)初始分類和一些初始條件,然后應(yīng)用迭代算法找出使準(zhǔn)則函數(shù)取得最小值的最好聚類結(jié)果.
算法可按如下幾步進(jìn)行:
① 確定初始控制參數(shù):K表示期望得到的聚類數(shù);θN表示個(gè)聚類中最少樣本數(shù);θs表示標(biāo)準(zhǔn)偏差參數(shù);θc表示類間合并參數(shù);L表示每次迭代允許合并的最大聚類對(duì)數(shù);I表示允許迭代的次數(shù).
② 按定義的相似度準(zhǔn)則函數(shù),將樣本歸入最有可能的類.
③ 根據(jù)步驟②的分類結(jié)果更新聚類中心.
④ 計(jì)算各類中每個(gè)樣本與其中心的相似度以及所有樣本與其相應(yīng)聚類中心的平均相似度δ,每個(gè)聚類內(nèi)樣本分量的標(biāo)準(zhǔn)偏差.
⑤ 根據(jù)步驟④的計(jì)算結(jié)果決定是否進(jìn)行分裂以及分裂策略.
⑥ 根據(jù)當(dāng)前聚類中心之間的相互相似度決定是否進(jìn)行合并以及合并策略.
⑦ 若這是最后一次迭代,則程序終止;若需按經(jīng)驗(yàn)改變參數(shù),則轉(zhuǎn)向步驟①;若不需要改變參數(shù),則轉(zhuǎn)向步驟②.
ISODATA算法的優(yōu)點(diǎn)是算法效率高、所需信息量較少,缺點(diǎn)是存在較大的不確定性,因?yàn)樗欠潜O(jiān)督的分類之前沒(méi)有一定類別的樣本集,類別數(shù)未知.
根據(jù)對(duì)ISODATA算法的分析,利用Matlab編寫程序,實(shí)現(xiàn)了對(duì)一幅典型圖像進(jìn)行分割實(shí)驗(yàn).效果如圖1所示.
圖1 基于ISODATA算法的圖像分割
本章主要采用ISODATA算法實(shí)現(xiàn)圖像分割的方法進(jìn)行了詳細(xì)的敘述,并利用Matlab編寫程序?qū)崿F(xiàn)了基于ISODATA算法的圖像分割,對(duì)以后研究圖像分割的改進(jìn)工作打下了基礎(chǔ).
[1]徐曉麗 .基于聚類分析的圖像分割算法研究[D].哈爾濱:哈爾濱工程大學(xué),2012.
[2]片兆宇.圖像分割若干問(wèn)題的研究與應(yīng)用[D].東北大學(xué),2009.
[3]葛宏立.面向類的圖像分割方法研究[D].北京林業(yè)大學(xué),2004.
[4]曹雪,柯長(zhǎng)青.基于對(duì)象級(jí)的高分辨率遙感影像分類研究[J].遙感信息,2006,5:27-30.
[5]李石華,王金亮等.遙感圖像分類方法研究綜述[J].國(guó)土資源遙感,2005,2:2-6.