李立芳 大連91550部隊94分隊 116023
淺談數(shù)字圖像處理技術(shù)及應(yīng)用
李立芳 大連91550部隊94分隊 116023
從數(shù)字圖像處理的發(fā)展歷史與研究內(nèi)容出發(fā),介紹了數(shù)字圖像處理技術(shù)的優(yōu)點與發(fā)展趨勢,總結(jié)了數(shù)字圖像處理技術(shù)的廣大應(yīng)用領(lǐng)域,對數(shù)字圖像處理的發(fā)展具有借鑒意義。
數(shù)字圖像處理
數(shù)字圖像處理是將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程。 20世紀20年代,圖像處理首次得到應(yīng)用。20世紀60年代中期,隨電子計算機的發(fā)展得到普遍應(yīng)用。60年代末,圖像處理技術(shù)不斷完善,逐漸成為一個新興的學科。隨著圖像處理技術(shù)的深入發(fā)展,從70年代中期開始,隨著計算機技術(shù)和人工智能、思維科學研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展。人們已開始研究如何用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計算機視覺。利用數(shù)字圖像處理主要是為了修改圖形,改善圖像質(zhì)量,或是從圖像中提取有效信息,數(shù)字圖像處理對圖像進行體積壓縮,便于傳輸和保存。 數(shù)字圖像處理因易于實現(xiàn)非線性處理,處理程序和處理參數(shù)可變,故是一項通用性強,精度高,處理方法靈活,信息保存、傳送可靠的圖像處理技術(shù)。
數(shù)字圖像處理主要研究的內(nèi)容有以下幾個方面:
1.1 圖像變換由于圖像陣列很大,如直接在空間域中進行處理,涉及計算量很大。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進行數(shù)字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應(yīng)用。
1.2 圖像編碼壓縮 圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比特數(shù)),以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。
1.3 圖像增強和復(fù)原 圖像增強和復(fù)原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提高圖像的清晰度等。圖像增強不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節(jié)明顯;如強化低頻分量可減少圖像中噪聲影響。圖像復(fù)原要求對圖像降質(zhì)的原因有一定的了解,一般講應(yīng)根據(jù)降質(zhì)過程建立“降質(zhì)模型”,再采用某種濾波方法,恢復(fù)或重建原來的圖像。
1.4 圖像分割 圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進一步進行圖像識別、分析和理解的基礎(chǔ)。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法。因此,對圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點之一。
1.5 圖像描述 圖像描述是圖像識別和理解的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。
1.6 圖像分類(識別) 圖像分類(識別)屬于模式識別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預(yù)處理(增強、復(fù)原、壓縮)后,進行圖像分割和特征提取,從而進行判決分類。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計模式分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識別中也越來越受到重視。
2.1 目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。如一幅256×256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對高分辨率彩色512×512圖像,則要求768kbit數(shù)據(jù)量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit~22.5Mbit數(shù)據(jù)量。因此對計算機的計算速度、存儲容量等要求較高。
2.2 數(shù)字圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個數(shù)量級。如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右。所以在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本亦高,這就對頻帶壓縮技術(shù)提出了更高的要求。
2.3 數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。
2.4 由于圖像是三維景物的二維投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點圖像。在理解三維景物時需要知識導(dǎo)引,這也是人工智能中正在致力解決的知識工程問題。
2.5 數(shù)字圖像處理后的圖像一般是給人觀察和評價的,因此受人的因素影響較大。由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以及知識狀況影響很大,作為圖像質(zhì)量的評價還有待進一步深入的研究。另一方面,計算機視覺是模仿人的視覺,人的感知機理必然影響著計算機視覺的研究。例如,什么是感知的初始基元,基元是如何組成的,局部與全局感知的關(guān)系,優(yōu)先敏感的結(jié)構(gòu)、屬性和時間特征等,這些都是心理學和神經(jīng)心理學正在著力研究的課題。
3.1 再現(xiàn)性好 數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會因圖像的存儲、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化。只要圖像在數(shù)字化時準確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。
3.2 處理精度高 按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,這主要取決于圖像數(shù)字化設(shè)備的能力?,F(xiàn)代掃描儀可以把每個像素的灰度等級量化為16位甚至更高,這意味著圖像的數(shù)字化精度可以達到滿足任一應(yīng)用需求。對計算機而言,不論數(shù)組大小,也不論每個像素的位數(shù)多少,其處理程序幾乎是一樣的。換言之,從原理上講不論圖像的精度有多高,處理總是能實現(xiàn)的,只要在處理時改變程序中的數(shù)組參數(shù)就可以了。試想一下圖像的模擬處理,為了要把處理精度提高一個數(shù)量級,就要大幅度地改進處理裝置,這在經(jīng)濟上是極不合算的。
3.3 適用面寬 圖像可以來自多種信息源,它們可以是可見光圖像,也可以是不可見的波譜圖像(例如X射線圖像、射線圖像、超聲波圖像或紅外圖像等)。從圖像反映的客觀實體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠鏡圖像。這些來自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像(彩色圖像也是由灰度圖像組合成的,例如RGB圖像由紅、綠、藍三個灰度圖像組合而成)組合而成,因而均可用計算機來處理。即只要針對不同的圖像信息源,采取相應(yīng)的圖像信息采集措施,圖像的數(shù)字處理方法適用于任何一種圖像。
3.4 靈活性高 圖像處理大體上可分為圖像的像質(zhì)改善、圖像分析和圖像重建三大部分,每一部分均包含豐富的內(nèi)容。由于圖像的光學處理從原理上講只能進行線性運算,這極大地限制了光學圖像處理能實現(xiàn)的目標。而數(shù)字圖像處理不僅能完成線性運算,而且能實現(xiàn)非線性處理,即凡是可以用數(shù)學公式或邏輯關(guān)系來表達的一切運算均可用數(shù)字圖像處理實現(xiàn)。
圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應(yīng)用領(lǐng)域必然涉及人類生活和工作的方方面面。隨著人類活動范圍的不斷擴大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴大。
4.1 航天和航空技術(shù)方面的應(yīng)用
數(shù)字圖像處理技術(shù)在航天和航空技術(shù)方面的應(yīng)用,除了上面介紹的JPL對月球、火星照片的處理之外,另一方面的應(yīng)用是在飛機遙感和衛(wèi)星遙感技術(shù)中。許多國家每天派出很多偵察飛機對地球上有興趣的地區(qū)進行大量的空中攝影。對由此得來的照片進行處理分析,以前需要雇用幾千人,而現(xiàn)在改用配備有高級計算機的圖像處理系統(tǒng)來判讀分析,既節(jié)省人力,又加快了速度,還可以從照片中提取人工所不能發(fā)現(xiàn)的大量有用情報。從60年代末以來,美國及一些國際組織發(fā)射了資源遙感衛(wèi)星(如LANDSAT系列)和天空實驗室(如SKYLAB),由于成像條件受飛行器位置、姿態(tài)、環(huán)境條件等影響,圖像質(zhì)量總不是很高。因此,以如此昂貴的代價進行簡單直觀的判讀來獲取圖像是不合算的,而必須采用數(shù)字圖像處理技術(shù)。如LANDSAT系列陸地衛(wèi)星,采用多波段掃描器(MSS),在900km高空對地球每一個地區(qū)以18天為一周期進行掃描成像,其圖像分辨率大致相當于地面上十幾米或100米左右(如1983年發(fā)射的LANDSAT-4,分辨率為30m)。這些圖像在空中先處理(數(shù)字化,編碼)成數(shù)字信號存入磁帶中,在衛(wèi)星經(jīng)過地面站上空時,再高速傳送下來,然后由處理中心分析判讀。這些圖像無論是在成像、存儲、傳輸過程中,還是在判讀分析中,都必須采用很多數(shù)字圖像處理方法?,F(xiàn)在世界各國都在利用陸地衛(wèi)星所獲取的圖像進行資源調(diào)查(如森林調(diào)查、海洋泥沙和漁業(yè)調(diào)查、水資源調(diào)查等),災(zāi)害檢測(如病蟲害檢測、水火檢測、環(huán)境污染檢測等),資源勘察(如石油勘查、礦產(chǎn)量探測、大型工程地理位置勘探分析等),農(nóng)業(yè)規(guī)劃(如土壤營養(yǎng)、水分和農(nóng)作物生長、產(chǎn)量的估算等),城市規(guī)劃(如地質(zhì)結(jié)構(gòu)、水源及環(huán)境分析等)。我國也陸續(xù)開展了以上諸方面的一些實際應(yīng)用,并獲得了良好的效果。在氣象預(yù)報和對太空其它星球研究方面,數(shù)字圖像處理技術(shù)也發(fā)揮了相當大的作用。
4.2 生物醫(yī)學工程方面的應(yīng)用
數(shù)字圖像處理在生物醫(yī)學工程方面的應(yīng)用十分廣泛,而且很有成效。除了上面介紹的CT技術(shù)之外,還有一類是對醫(yī)用顯微圖像的處理分析,如紅細胞、白細胞分類,染色體分析,癌細胞識別等。此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學診斷方面都廣泛地應(yīng)用圖像處理技術(shù)。
4.3 通信工程方面的應(yīng)用
當前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。具體地講是將電話、電視和計算機以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號的速率達100Mbit/s以上。要將這樣高速率的數(shù)據(jù)實時傳送出去,必須采用編碼技術(shù)來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。除了已應(yīng)用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內(nèi)外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。
4.4 工業(yè)和工程方面的應(yīng)用
在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動裝配線中檢測零件的質(zhì)量、并對零件進行分類,印刷電路板疵病檢查,彈性力學照片的應(yīng)力分析,流體力學圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環(huán)境內(nèi)識別工件及物體的形狀和排列狀態(tài),先進的設(shè)計和制造技術(shù)中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機器人,將會給工農(nóng)業(yè)生產(chǎn)帶來新的激勵,目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。
4.5 軍事公安方面的應(yīng)用
在軍事方面圖像處理和識別主要用于導(dǎo)彈的精確末制導(dǎo),各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統(tǒng),飛機、坦克和軍艦?zāi)M訓練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復(fù)原,以及交通監(jiān)控、事故分析等。目前已投入運行的高速公路不停車自動收費系統(tǒng)中的車輛和車牌的自動識別都是圖像處理技術(shù)成功應(yīng)用的例子。
4.6 文化藝術(shù)方面的應(yīng)用
目前這類應(yīng)用有電視畫面的數(shù)字編輯,動畫的制作,電子圖像游戲,紡織工藝品設(shè)計,服裝設(shè)計與制作,發(fā)型設(shè)計,文物資料照片的復(fù)制和修復(fù),運動員動作分析和評分等等,現(xiàn)在已逐漸形成一門新的藝術(shù)——計算機美術(shù)。
數(shù)字圖像處理技術(shù)在航空航天、工業(yè)生產(chǎn)、醫(yī)療診斷、資源環(huán)境、氣象及交通監(jiān)測、文化教育等領(lǐng)域有著廣泛的應(yīng)用,創(chuàng)造了巨額社會價值;同時還遠遠不能滿足社會需求,自身也在不斷完善和發(fā)展,有很多新的方面要探索。它必將向更深入、更完善的方向發(fā)展:處理算法更優(yōu)化,處理速度更快,實現(xiàn)圖形的智能生成、處理、識別和理解。
[1]李紅俊,韓冀皖.數(shù)字圖像處理技術(shù)及其應(yīng)用.計算機測量與控制,2002.10(9):620~622
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.John wiley & Sons,inc,1978
[3]楊枝靈,王開.Visual C++數(shù)字圖像獲取、處理及實踐應(yīng)用.人民郵電出版社,2003
[4]聶穎,劉榴娣.數(shù)字信號處理器在可視電話中的應(yīng)用.光電工程,1997.24(3):67~70
[5]侯遵澤,楊文采.小波分析應(yīng)用研究.物探化探計算技術(shù),1995.17(3):1~9
[6]李道遠,常敏,袁春風.基于小波變換的數(shù)字水印綜述.計算機應(yīng)用與工程,2003.23(10):65~67
10.3969/j.issn.1001-8972.2012.03.036