范 偉,江 昕
(安徽電氣工程職業(yè)技術(shù)學(xué)院 a. 自動(dòng)化與信息工程系;b. 教務(wù)處,合肥 230051)
紋理是描述圖像分布的重要特征,它廣泛存在于自然場(chǎng)景、生物外觀和藝術(shù)作品中﹒紋理是圖像本身固有的,容易辨認(rèn)卻很難定義[1]﹒這是因?yàn)椴煌娜藢?duì)紋理的理解不同,由于圖像強(qiáng)度值在方向和規(guī)模上存在很大的局部變化,使得紋理模糊且復(fù)雜,因此紋理沒(méi)有確切的數(shù)學(xué)定義[2]﹒
紋理分析[3]是圖像處理過(guò)程中很重要的步驟,已有一些研究學(xué)者對(duì)此作了相關(guān)研究﹒通常,分析紋理主要有3 種途徑:數(shù)據(jù)法、結(jié)構(gòu)法和光譜法[4]﹒數(shù)據(jù)法將紋理的特征描述為平滑、粗糙和粒狀等;結(jié)構(gòu)法用于整理圖像基元,如基于規(guī)則空間平行線來(lái)描述紋理;光譜法是基于圖像的頻率特征,通過(guò)考慮光譜中的高能量和窄峰來(lái)全方位測(cè)定其周期性﹒文獻(xiàn)[5]在圖像紋理特征統(tǒng)計(jì)分析的基礎(chǔ)上,提出了一種基于小波變換紋理分析的圖像粗糙度提取方法﹒文獻(xiàn)[6]利用分?jǐn)?shù)維將圖像的空間信息和灰度信息有機(jī)結(jié)合,提出了一種基于分形維數(shù)的圖像紋理分析方法,此法所分割的圖像能夠體現(xiàn)圖像的紋理分布﹒文獻(xiàn)[7]研究了基于灰度共生矩陣(GLCM)的14 個(gè)紋理特征,分析了紋理特征之間的冗余﹒文獻(xiàn)[8]將Haralick 特點(diǎn)應(yīng)用于醫(yī)學(xué)圖像紋理的分析,即利用Haralick 紋理特征歸一化灰度共生矩陣不同方向的計(jì)算,該方法的核心是組合多個(gè)特征進(jìn)行紋 理分析﹒文獻(xiàn)[9]提出了基于Gabor 變換的紋理分析,利用圖割提取一些重要的紋理特征,Gabor變換用于分析和分類(lèi)﹒這些方法[5-9]適用范圍較窄,總體誤差較大,不確定性難以量化,因此它們?cè)诒碚骷y理特征的方式上有待改進(jìn)和完善﹒
對(duì)于圖像紋理分析,信息和不確定性是一個(gè)統(tǒng)一的整體,信息中的不確定性使得真實(shí)模型既可預(yù)測(cè)又不可預(yù)測(cè)﹒這種情況存在于模式識(shí)別[10]等復(fù)雜問(wèn)題的處理中﹒目前,對(duì)于復(fù)雜信息處理中的預(yù)測(cè)性或不確定性量化問(wèn)題,主要是基于無(wú)序理論[11]﹒無(wú)序理論和模糊邏輯均屬于模糊數(shù)學(xué)理論分支,可被用于處理模糊分類(lèi)、決策和控制等問(wèn)題,而紋理屬性不可預(yù)測(cè)性的量化正是基于此﹒因此,本文重點(diǎn)研究無(wú)序理論和模糊集表達(dá)紋理圖像強(qiáng)度值分布的空間排列,處理動(dòng)態(tài)不確定性問(wèn)題,在柯?tīng)柲缏宸?西奈(K-S)熵[12-13]的基礎(chǔ)上,引入了模糊K-S 熵的概念,并給出了模糊K-S 熵的估計(jì)值﹒
在無(wú)序理論分析中,K-S 熵[12]被認(rèn)為是無(wú)序性軌跡產(chǎn)生的最新信息平均時(shí)間率的指標(biāo),也稱(chēng)為測(cè)量-理論熵或測(cè)度熵﹒它有3 個(gè)重要特征:序列概率、熵率和熵界﹒為了描述動(dòng)態(tài)系統(tǒng)的狀態(tài)-空間特征,應(yīng)考慮二維狀態(tài)-空間區(qū)域,即在含有多個(gè)小單元的盒子中,小單元邊長(zhǎng)度為ε ﹒動(dòng)態(tài)系統(tǒng)的軌跡隨著時(shí)間變化,會(huì)在狀態(tài)-空間區(qū)域覆蓋一些單元,并擴(kuò)散﹒就第1 個(gè)特征而言,由于K-S 熵測(cè)量系統(tǒng)的不確定性,與此系統(tǒng)有聯(lián)系的時(shí)間單元為
其中時(shí)間步長(zhǎng)或空間步長(zhǎng)可以用步長(zhǎng)大小來(lái)分別體現(xiàn)時(shí)間或空間的演化﹒
基于模糊集熵的概念,模糊系統(tǒng)的不確定性在K-S 熵環(huán)境下通過(guò)一系列觀察測(cè)得,定義為
基于現(xiàn)有數(shù)學(xué)理論的相關(guān)文獻(xiàn)[14]對(duì)K-S 熵函數(shù)概率意義的討論,可以得出,動(dòng)態(tài)系統(tǒng)中隨機(jī)熵和模糊熵可表述為:模糊熵=高級(jí)隨機(jī)熵﹒在設(shè)定模糊集時(shí),嵌入在K-S 熵中的一系列概率和香農(nóng)熵可分別由模糊隸屬度和模糊熵替代﹒概率和模糊度是相關(guān)的,但它們的根本概念是不同的:模糊度表示一種確定的未知性,代表一個(gè)時(shí)間的模糊度,可表示一個(gè)事件發(fā)生的程度;概率是由一個(gè)事件是否會(huì)發(fā)生而產(chǎn)生的﹒基于式(5),模糊集K-S 熵的表達(dá)式為
模糊隸屬度的值與式(8)相關(guān),合并條件概率事件的乘法由模糊乘法替代,使之與模糊關(guān)系的概念一致﹒令A(yù) 和B 為2 個(gè)模糊集,每個(gè)模糊集都與n 維歐式空間 Rn中的每個(gè)x ∈ X相關(guān)聯(lián),A和B 的乘積為模糊集T=A×B,可利用模糊交叉法定義為
記熵差為m,則有
式(12)表明,在單位時(shí)間下計(jì)算,平均熵率和熵差會(huì)得出相同的平均熵率近似值;但在時(shí)間軸下m 的點(diǎn)跡更接近,并快速匯聚于一點(diǎn)﹒運(yùn)用熵差法,模糊集K-S 熵估計(jì)值的計(jì)算為
利用式(13)計(jì)算模糊集K-S 熵的步驟如下:
1)選定一個(gè)單元尺寸ε ;
2)在一個(gè)給定的時(shí)間步驟下,估算所有可能路徑的序列模糊隸屬度級(jí)別,并計(jì)算 Dm;
3)在下一個(gè)時(shí)間步驟下,重復(fù)步驟2,并得出Dm+1;
4)計(jì)算熵差m;
5)多次重復(fù)步驟2)~步驟4);
6)在時(shí)間步驟下描繪出熵差點(diǎn)跡,并估計(jì)熵差的近似值;
7)若m 變得近似于一個(gè)常量,程序終止,否則進(jìn)入下一步;
8)重復(fù)步驟1)~步驟6)得到越來(lái)越小的ε ﹒
本文的重點(diǎn)為構(gòu)建圖像的K-S 熵,利用模糊集和無(wú)序理論使傳統(tǒng)量化無(wú)序性的程序作為紋理分析的一個(gè)新特征﹒
本節(jié)構(gòu)建用于估算圖像模糊信息K-S 熵的模型﹒在很多圖像中,表示不同物體的像素很可能具有相似的像素灰度值﹒因此,不清晰物體圖像的直方圖較窄,清晰物體圖像的直方圖較寬﹒
由此可知,圖像中的不確定性是由圖像內(nèi)容的不精確描述所產(chǎn)生﹒本文使用模糊C-均值算法[15]對(duì)圖像空間進(jìn)行數(shù)學(xué)建模,即用模糊C-均值算法將一個(gè)由N 個(gè)像素組成的圖像任意分離為一系列不精確的簇,表示為
在不精確邊界或模糊類(lèi)的上下文中,基于模糊C 均值(Fuzzy C Means, FCM)的聚類(lèi)分析可用于建模圖像的不確定性﹒選擇c 的大小相當(dāng)于模糊集K-S 熵估計(jì)過(guò)程的第一步,為了構(gòu)造出圖像的序列隸屬度,利用給定的c 進(jìn)行模糊C-均值劃分;計(jì)算在每個(gè)路徑上的模糊隸屬度,以最低值所對(duì)應(yīng)的模糊隸屬度的灰度級(jí)確定FCM(即步驟2 和步驟3);然后計(jì)算熵差m(步驟4)﹒為了計(jì)算熵差,一個(gè)很實(shí)用的方法是使用模糊隸屬度來(lái)處理FCM 所獲得的每個(gè)集合﹒其中,圖像的垂直和水平方向分別指圖像中行和列的熵差,如果一個(gè)紋理圖像是等方向的,那么K-S 熵的計(jì)算是獨(dú)立于圖像方向的﹒
圖1 給出了4 個(gè)實(shí)驗(yàn)圖像,其中(a)為“Lena”標(biāo)準(zhǔn)灰度圖像(512×512);(b)為部分癌細(xì)胞圖像(603×1819);(c)為部分正常細(xì)胞圖像(678×1747);(d)為人類(lèi)腹部器官圖像(246×366)﹒
圖1 實(shí)驗(yàn)圖像
圖1 中,癌細(xì)胞和正常細(xì)胞圖像可在細(xì)胞空腔下通過(guò)技術(shù)觀察得到,人類(lèi)腹部器官圖像則通過(guò)CT 掃描獲得﹒選擇這4 個(gè)圖像的原因是:Lena圖像細(xì)節(jié)豐富,兼有平坦區(qū)域、影子和大量紋理等;2 個(gè)細(xì)胞圖像紋理細(xì)節(jié)豐富,而紋理分析可用來(lái)區(qū)分細(xì)胞空腔內(nèi)癌細(xì)胞和正常細(xì)胞;腹部器官的CT 圖像是一個(gè)典型的醫(yī)學(xué)圖像,也可作為紋理分析的測(cè)試圖像﹒
圖2~圖5 分別給出了上述4 個(gè)圖像所表達(dá)的特征,其中,每個(gè)原始圖像分為25 個(gè)大小為128×96 像素的子圖像﹒測(cè)試中,參數(shù)c=2,模糊權(quán)重指數(shù)q=2﹒
圖2 Lena 圖像熵差的變化
圖3 癌細(xì)胞圖像熵差的變化
圖4 正常細(xì)胞圖像熵差的變化
圖5 腹部器官圖像熵差的變化
表1 q=2 時(shí)圖像模糊集的熵差
表2 q=3 時(shí)圖像模糊集的熵差
本文使用的紋理數(shù)據(jù)庫(kù)是25 個(gè)圖像紋理等級(jí)的集合,每個(gè)等級(jí)都由40 個(gè)圖像樣本構(gòu)成﹒所有圖像都是灰度JPG 格式,每個(gè)圖像尺寸都是640×480 像素﹒圖7 給出了紋理數(shù)據(jù)庫(kù)中一些典型的圖像,每個(gè)圖像屬于不同的紋理等級(jí)﹒
圖6 Lena 圖像退化空間熵差的變化
表3 加噪Lena 圖像模糊集的K-S 熵
圖7 紋理圖像數(shù)據(jù)庫(kù)樣本
實(shí)驗(yàn)中,每個(gè)原始圖像分為25 個(gè)大小為128×96 像素的子圖像,模糊K-S 熵值從子圖像中提取﹒由上述實(shí)驗(yàn)結(jié)果分析可知,參數(shù)q=2 和c=2所得結(jié)果最精確,這種參數(shù)組合賦予了4 個(gè)模糊K-S 熵值特征向量:2 個(gè)行向模糊簇集和2 個(gè)列向模糊簇集﹒所提取的K-S 熵再通過(guò)LBG 向量量化進(jìn)行分離[16],其中向量可以分為4、8、16和32 維4 種﹒
本文將小波變換紋理分析[5]、分形理論[6]、多個(gè)GLCM 紋理分析[7]、Haralick 多特征組合[8]以及Gabor 變換分析方法[9]進(jìn)行了對(duì)比,分類(lèi)測(cè)試中運(yùn)用10 倍交叉檢驗(yàn)將每個(gè)數(shù)據(jù)集分為10 個(gè)大小相同的子集,生成的9 個(gè)子集用于測(cè)試剩下的子集,通過(guò)10 次重復(fù)計(jì)算得出平均精確度﹒各方法的紋理分類(lèi)準(zhǔn)確率情況如表4 所示﹒
表4 幾種紋理圖像分類(lèi)準(zhǔn)確率對(duì)比 %
從表4 可以看出,本文方法的分類(lèi)準(zhǔn)確率最高,其次是GLCM 紋理分析方法,GLCM 及其改進(jìn)方法對(duì)紋理周?chē)? 個(gè)方向均有比較敏感的特征反應(yīng);直方圖分析紋理有明顯的缺陷,因?yàn)橹狈綀D很難給出空間的灰度變化特征,只能給出一塊區(qū)域的統(tǒng)計(jì)特征;分形理論法由于其分形的固有屬性,對(duì)類(lèi)似遙感圖像的紋理分析更佳;小波變換法以及Gabor 變換法對(duì)環(huán)境變化的不變性較好,但會(huì)錯(cuò)失一些信息,特征點(diǎn)的提取對(duì)結(jié)果影響較大;Haralick 多特征組合法在理想狀態(tài)下,可以獲得非常好的結(jié)果,但這些特征組合經(jīng)常帶有一些確定性因素﹒
為便于比較,本文還使用了k-NN 分類(lèi)器進(jìn)行分類(lèi),k-NN 分類(lèi)器是較為簡(jiǎn)單的非參數(shù)方法,不同于FCM﹒2 種方法對(duì)比結(jié)果如表5 所示﹒
表5 2 種方法的k-NN 分類(lèi)精度對(duì)比 %
從表5 可以看出,本文的方法具有一定的優(yōu)勢(shì),說(shuō)明K-S 熵在處理不確定的圖像紋理分析中是一個(gè)有效特征﹒
在無(wú)序理論和模糊集框架下,提出了一種計(jì)算K-S 熵的方法,使用隊(duì)列元素等級(jí)來(lái)測(cè)定不精確系統(tǒng)的熵率,用模糊度取代確定性范式,將其用于紋理圖像的分析和分類(lèi)﹒結(jié)果表明,模糊K-S 熵能較好適用于不同類(lèi)型紋理的圖像分析﹒
由于K-S 熵是一個(gè)表達(dá)圖像空間分區(qū)模糊隸屬度非線性特征的數(shù)值,其延伸模型可有效分析模式識(shí)別問(wèn)題中的不確定性﹒因此,下一步的研究會(huì)將K-S 熵應(yīng)用到具體的模式識(shí)別問(wèn)題中,如高光譜圖像等﹒