曾長雄
(岳陽職業(yè)技術(shù)學(xué)院信息工程學(xué)院,岳陽 湖南 414000)
智能圖像識別主要是使用計算機信息系統(tǒng),做好圖像的處理、分析及理解工作。目前,在此階段圖像識別主要使用在工業(yè)層面,通過計算機軟件對于設(shè)備捕捉的圖像進(jìn)行識別處理。與此同時,還可通過智能圖像對遙感內(nèi)容進(jìn)行分類處理。這樣,不管識別對象發(fā)出怎樣的變化,計算機智能圖像識別技術(shù),都能抓住識別對象的本質(zhì)特點,進(jìn)行有效的識別。
目前,在進(jìn)行計算機智能圖像識別技術(shù)探究過程中,它從傳統(tǒng)的文字識別,一直演變成現(xiàn)階段的數(shù)字圖像識別,歷經(jīng)幾十年的發(fā)展。文字識別主要起源于20 世紀(jì)50 年代,不僅包括數(shù)字、字母,還包括符號的識別,它的起源主要是從印刷文字識別,它的智能圖像識別技術(shù)主要是從印刷文字識別一直發(fā)展到手寫文字識別和模擬圖像。通常情況下,它能對大量的數(shù)字圖像進(jìn)行壓縮和儲存,在傳遞過程中也不會出現(xiàn)失真現(xiàn)象,但是,為了充分發(fā)揮計算機智能圖像識別技術(shù)的優(yōu)勢,需要融合人工智能技術(shù)。在圖像識別過程中,需要從眾多信息中篩選有用信息,做好信息的處理,根據(jù)信息的特征進(jìn)行提取。對于所有的存儲圖像來說,計算機智能圖像識別技術(shù),能夠?qū)⒉煌愋偷男畔⑦M(jìn)行融合,推動整個過程更加的方便快捷。與此同時,它還能夠?qū)崿F(xiàn)圖像的有效壓縮,然后將其進(jìn)行整合,做好圖像分類處理工作,使得整個計算機智能圖像識別系統(tǒng)更加穩(wěn)定,能夠降低識別運作存在的誤差,全面提高計算機信息系統(tǒng)的管理能力。這時,需要對計算機智能圖像識別算法進(jìn)行研究,這能有效地解決系統(tǒng)出現(xiàn)的崩潰問題,在某種程度上來說,計算機幾乎所有的操作都是通過人工完成的,近年來隨著科學(xué),信息技術(shù)快速發(fā)展,計算機也取得突飛猛進(jìn)的進(jìn)步,這時,程序員只需要在特定的程序中,對計算機的功能進(jìn)行設(shè)定,當(dāng)計算機開始作業(yè)以后,相關(guān)的操作人員需要展開操縱。發(fā)揮計算機智能圖像識別技術(shù)的作用,存儲在系統(tǒng)上的圖像信息,通過人為操作和檢驗,能有效解決實際操作存在的識別不全面問題。因此,在進(jìn)行計算機智能圖像識別技術(shù)研究過程中,應(yīng)該采取有效的方式提高智能圖像識別的可靠性和穩(wěn)定性[1]。
計算機智能圖像識別算法的本質(zhì)就是它能在瞬息萬變的圖像形態(tài)變化中,抓到圖像的內(nèi)在特征,進(jìn)而對圖像進(jìn)行有效識別,在圖像識別過程中,為了確保圖像的不變性,需要對不同的目標(biāo)對象進(jìn)行識別。目前,在圖像識別過程中,常見的算法有Hu 不變矩算法、DS 證據(jù)推理等等。Hu 不變矩算法是最早出現(xiàn)的智能圖像識別算法之一,起源于20 世紀(jì)60 年代初期,它是以圖像中的低階歸一化中心距非線性組合為主,形成了七個變量值。
對于數(shù)字圖像,離散狀態(tài)下,對于灰度分布為f(x,y)的圖像,f(x,y)的(p+q)階普通矩定義:
與此同時,需要對(p+q)階中心矩進(jìn)行定義:
這時,質(zhì)心坐標(biāo)為(x0,y0):
其中x0=m10/m00,y0=m01/m00,x0表示圖像灰度在水平方向上的灰度質(zhì)心,y0表示圖像灰度在垂直方向上的灰度質(zhì)心。
(p+q)階歸一化中心矩定義:yp q=μp q/μr00,其中,r=(p+q+2)/2,p+q=2,3,…L。
在某種程度上,Hu 不變矩算法主要是以圖像的二階中心和三階中心理論為依據(jù),以低階歸一化中心矩的非線性組合構(gòu)造七個不變矩(M1—M7),該7 個不變矩構(gòu)成一組高度濃縮的圖像特征量,在連續(xù)圖像下具有平移、灰度、尺度、旋轉(zhuǎn)不變性。當(dāng)圖片進(jìn)行連續(xù)的平移、縮放操作時,它們的特征會保持不變[2]。
Hu 不變矩算法優(yōu)劣分析:在對圖像中物體的識別過程中,只有M1 和M2 不變性保持較好,其他幾個不變矩誤差較大。
Hu 不變矩使其在圖像識別的過程中,能減少待測圖像的大小歸一化與位置居中等預(yù)處理步驟,降低運算成本,提高運算速率,同時圖像識別準(zhǔn)確率高[3]。
Hu 不變矩一般用來識別圖像中大的物體,對于物體的形狀描述得比較好,圖像的紋理特征不能太復(fù)雜,像識別水果的形狀,或者對于車牌中的簡單字符的識別效果會相對好一些。
在計算機智能圖像識別過程中,為了實現(xiàn)多源信息處理,需要使用數(shù)據(jù)融合技術(shù)D-S 證據(jù)推理。主要是依托非空集合建立的,其中的幾何也稱之為辨別框架,通過框架對構(gòu)成的假想空間元素及進(jìn)行分析,做好信任指派函數(shù)及總信任度定義:
綜上,可以通過相關(guān)的組合規(guī)則得到兩個或者兩個以上的置信函數(shù)[4]。
將D-S 證據(jù)推理引入圖像識別中,通過灰度-相位共生矩陣法及灰度-梯度共生矩陣法得到圖像紋理特征參數(shù)并進(jìn)行D-S 信息融合,能較好包含圖像紋理信息,并能補充圖像單組特征參數(shù)識別的不足,圖像識別的準(zhǔn)確率提高,不確定性可降低[5-6]。
計算機智能圖像識別系統(tǒng)主要包括以下幾個方面的內(nèi)容:圖像壓縮處理、圖像預(yù)處理、特征識別、以及提起系統(tǒng)。預(yù)處理過程主要是為了提高圖像的識別性能,需要做好二值化、平滑去噪、以及灰度處理。圖像壓縮過程是為了方便圖像傳輸保存,在確保圖像可識別的前提之下,使用壓縮代碼將圖片中無用信息進(jìn)行刪除。一般情況下,壓縮代碼的種類多種多樣,這時需要根據(jù)圖像處理的實際情況,選擇合適的壓縮處理器。圖像特征提取識別過程要嚴(yán)格的控制圖像的顏色、形狀、紋理、特征等等。計算機智能圖像識別系統(tǒng),它是人工智能的重要研究方向,它為圖像有機識別提供有效的依據(jù)。在進(jìn)行圖像識別時需要在計算機信息系統(tǒng)中輸入可識別的圖像,然后通過計算機信息系統(tǒng)進(jìn)行圖像的匹配,按照圖像的特點進(jìn)行分類。在具體的識別過程中,需要將預(yù)處理環(huán)節(jié)作為圖像的輸入點,它也是圖像處理的鍵環(huán)節(jié)。將采集到的信息輸入到計算機信息系統(tǒng)中,這時需要做好圖像背景的分離工作。通過二值化對圖像進(jìn)行整體細(xì)化,保證系統(tǒng)后期處理的效率。在最大范圍內(nèi),提升圖像處理的準(zhǔn)確性[7-8]。
首先,計算機智能圖像識別系統(tǒng)他的信息量較大,通過計算機信息系統(tǒng)處理之后,能夠得到相關(guān)的二維信息,隨著二維信息的不斷增多,會導(dǎo)致計算機運行性能下降,這樣會降低圖像識別度。其次,圖像識別系統(tǒng)準(zhǔn)確度高,和傳統(tǒng)的圖像處理技術(shù)相比,計算機智能圖像識別技術(shù)能對模擬圖像進(jìn)行數(shù)字轉(zhuǎn)換。一般情況下,像素基本都是低于32 位,如果超過32 位,不能對模擬圖像進(jìn)行有效處理,智能圖像識別技術(shù),能夠做好圖像信息關(guān)系的有機處理,全面提高存儲數(shù)據(jù)的完整性,從而得到高精準(zhǔn)度的圖像,滿足不同用戶的使用需求。最重要的一點,使用智能圖像識別技術(shù),還能夠?qū)υ瓐D像進(jìn)行還原處理。最后,它的關(guān)聯(lián)性較強,計算機信息系統(tǒng)在運作過程中,主要是通過智能化進(jìn)行識別的,能夠?qū)Σ煌膱D像進(jìn)行分析。與此同時,還需要考慮到圖像的壓縮成本,在為了獲取和圖像相關(guān)的信息,做好圖像特點的具體分類工作,尤其是在3D 圖像輸入時,可能無法得到三維幾何圖像,這時需要對原圖像進(jìn)行重新測量。然而,使用智能圖像識別技術(shù),能有效地對3D 景物進(jìn)行還原。此外,它的靈活性較高,智能圖像識別在圖像處理過程中,能夠?qū)δ繕?biāo)圖像進(jìn)行放大,例如細(xì)胞圖、天體圖等等,可以通過數(shù)學(xué)的線性和非線性組合,全面提高信息的完整性,進(jìn)而提高圖像的清晰度[9]。
為了充分發(fā)揮計算機智能圖像識別算法技術(shù)的優(yōu)勢,需要做好如下幾個方面的歸納。首先,需要進(jìn)行數(shù)據(jù)的采集和預(yù)處理。通常情況下,在具體的圖像識別過程中,不僅要考慮到外在因素,而且還需要考慮到圖像本身的特點,對識別產(chǎn)生的影響。在圖像的具體輸入過程中,要確保提高獲取信息的準(zhǔn)確性。在進(jìn)行圖像識別之前,需要進(jìn)行圖像的預(yù)處理操作,這是最主要的步驟,能夠全面提高識別的可靠性。其次,邊緣提取。和圖像識別而言,圖像邊緣是有亮度、顏色,在某個方向上進(jìn)行變化組合形成的,圖像識別可以參考邊緣提取,因此最常使用的方式是空間梯度法、小波變換法等等,以上幾種方法都有自己的優(yōu)點和缺點。例如,空間梯度法在使用過程中,它的速度快,然而在提取過程中會受到其他外界因素的干擾,提取結(jié)果并不理想。小波變換法在進(jìn)行圖像數(shù)據(jù)提取過程中效果較好,然而它的速度過慢。因此,在對智能圖像識別技術(shù)具體分析時,要確保提取速度,還要考慮到提取的結(jié)果。最后,需要進(jìn)行區(qū)域分割。在圖像基本識別過程中要考慮到顏色、灰度等等,這是進(jìn)行圖像識別的前提,在對目標(biāo)區(qū)域進(jìn)行整體分割時,可以使用直接分割、間接分割、擴充法等等,充分發(fā)揮分割的作用,結(jié)合實際情況進(jìn)行選擇。與此同時,還需要進(jìn)行目標(biāo)定位。在進(jìn)行目標(biāo)定位過程中,它能對數(shù)據(jù)信息進(jìn)行采集,在具體的圖像定位過程中需要進(jìn)行圈定。在定位完成之后,考慮到目標(biāo)背景對定位產(chǎn)生的影響,因為背景的復(fù)雜度越高,定位的準(zhǔn)確率也就越低,所以在進(jìn)行定位時,要考慮到邊緣構(gòu)建、顏色特點紋、理特征等等[10]。
計算機智能圖像識別技術(shù)憑借著自身較大的內(nèi)存空間,被廣泛使用在各個領(lǐng)域。與相同配置規(guī)格運行系統(tǒng)的計算機相比,它具有較大的信息儲量,這為圖像特征系統(tǒng)存儲提供了有利的條件。除此之外,在計算機圖像識別過程中還可以選取特定的圖像,能有效地提升識別速率。