何志鵬
摘要:隨著數(shù)字多媒體的不斷發(fā)展,數(shù)字多媒體圖像處理技術(shù)的應(yīng)用越來越廣泛,在各個(gè)行業(yè)和領(lǐng)域都發(fā)揮了重要作用。本文首先從圖像的數(shù)字化和壓縮編碼、增強(qiáng)與恢復(fù)、分割、分析等四個(gè)方面詳細(xì)分析了數(shù)字多媒體圖像處理技術(shù)的主要研究方向和現(xiàn)狀,然后介紹了該技術(shù)在航空航天、生物醫(yī)學(xué)工程、信息通信、工業(yè)和工程等領(lǐng)域的具體應(yīng)用。
關(guān)鍵詞:數(shù)字多媒體;圖像處理;壓縮編碼;圖像分割
中圖分類號(hào):TP393? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)02-0212-02
1 概述
隨著信息化技術(shù)的普及和應(yīng)用,多媒體處理技術(shù)得到了飛速發(fā)展,為了增強(qiáng)對(duì)圖像信息的處理效率和實(shí)用性,數(shù)字圖像處理技術(shù)應(yīng)運(yùn)而生。數(shù)字圖像處理技術(shù)主要利用計(jì)算機(jī)或其他硬件來對(duì)大量的數(shù)字圖像信息進(jìn)行高效處理,具體而言,包括對(duì)圖像進(jìn)行分割、復(fù)原、變換等等[1]。近年來,的數(shù)字多媒體圖像處理技術(shù)受到了越來越多的關(guān)注,緊隨計(jì)算機(jī)處理能力的不斷提高,數(shù)字圖像處理技術(shù)也得到了很大提升。對(duì)圖像信息的充分利用和數(shù)字化處理,可以滿足不同領(lǐng)域的應(yīng)用需求。關(guān)于數(shù)字多媒體圖像處理技術(shù)的研究范圍較廣,既包含數(shù)字分析,也涉及光學(xué)系統(tǒng)等領(lǐng)域。因此,數(shù)字多媒體圖像處理技術(shù)在軍事、工業(yè)、生物醫(yī)學(xué)、網(wǎng)絡(luò)通信、航空航天等多個(gè)領(lǐng)域都發(fā)揮了重要作用。相比于傳統(tǒng)的圖像處理技術(shù),可顯著節(jié)約時(shí)間,而且能夠簡(jiǎn)化對(duì)復(fù)雜圖像的處理過程。
2 數(shù)字多媒體圖像處理技術(shù)的主要研究方向和現(xiàn)狀
相比于傳統(tǒng)的圖像處理技術(shù),數(shù)字圖像處理技術(shù)有諸多優(yōu)點(diǎn),如再現(xiàn)性更好、處理精度更高、適用面更寬,且靈活性也更高。目前,關(guān)于數(shù)字圖像處理技術(shù)的。主要研究方向大致包括圖像的數(shù)字化和壓縮編碼、圖像增強(qiáng)與恢復(fù)、圖像分割和圖像分析等四個(gè)方面,這四個(gè)方向既是目前關(guān)于數(shù)字圖像處理技術(shù)的主流方向,同時(shí)也是對(duì)圖像進(jìn)行處理的主要流程[2]。下面分別詳細(xì)介紹這四個(gè)研究方向的主要內(nèi)容和研究現(xiàn)狀。
(1) 圖像的數(shù)字化和壓縮編碼
圖像的數(shù)字化是指對(duì)圖像進(jìn)行取樣和量化,將圖像變換為數(shù)字形式,使其適合用計(jì)算機(jī)進(jìn)行處理。在計(jì)算機(jī)內(nèi)部,圖像被表示為數(shù)字矩陣的形式,矩陣的每一個(gè)元素代表了圖像的每一個(gè)像素。圖像的壓縮編碼的目的就是要對(duì)圖像的信息量進(jìn)行壓縮,使其適合存儲(chǔ)或在信道中進(jìn)行傳輸。常用的圖像編碼方式包括模擬處理和數(shù)字處理。在采用模擬處理技術(shù)時(shí),通常需要進(jìn)行數(shù)-模轉(zhuǎn)換來得到編碼。而數(shù)字編碼技術(shù)通常對(duì)圖像進(jìn)行逐點(diǎn)加工,或者對(duì)圖像屬性進(jìn)行變換,利用圖像的特征進(jìn)行編碼等[3]。
圖像的壓縮編碼是為了盡可能地降低數(shù)據(jù)存儲(chǔ)占用的空間,同時(shí)盡量傳遞更多的信息量,從而降低傳輸圖像時(shí)所需的時(shí)間的帶寬。近年來,圖像壓縮編碼取得了很多研究成果,如EZW編碼算法和SPIHT編碼算法等,這兩種算法的結(jié)構(gòu)較為簡(jiǎn)單,且圖片在復(fù)原時(shí)候的質(zhì)量較好,但是其時(shí)間和空間復(fù)雜度較高。此后,小波變換的圖像壓縮算法發(fā)展成為主要方向,改算法適用于分析非平穩(wěn)信號(hào),具有更好的適用性。
(2) 圖像增強(qiáng)與恢復(fù)
圖像的增強(qiáng)與恢復(fù)是圖像處理的重要環(huán)節(jié)。其中,圖像增強(qiáng)的目的是使得圖像更為清晰,或?qū)⑵溥M(jìn)行轉(zhuǎn)換使其適合被人和機(jī)器分析或識(shí)別。對(duì)圖像進(jìn)行增強(qiáng)的常用方法包括邊緣銳化、干擾抵制、灰度等級(jí)直方圖處理等等。在獲得圖像過程中,難免會(huì)受到各種因素的影響,比如光學(xué)系統(tǒng)的離焦、物體的相對(duì)運(yùn)動(dòng)等。圖像恢復(fù)的目的就是為了去除這些原因所導(dǎo)致的圖像退化。
在對(duì)圖像進(jìn)行增強(qiáng)和恢復(fù)前,通常首先分析各種增強(qiáng)算法的優(yōu)缺點(diǎn)和側(cè)重點(diǎn),然后根據(jù)圖像的具體特點(diǎn)決定使用哪種或哪幾種增強(qiáng)方法。常見的處理流程是,首先根據(jù)圖像自身性質(zhì),建立相應(yīng)的數(shù)學(xué)模型;其次,實(shí)行相應(yīng)的恢復(fù)算法降低退化源造成的影響;然后,根據(jù)圖像的先驗(yàn)知識(shí),建立原始圖像的模型;最后,通過檢測(cè)原始圖像而復(fù)原圖像。
(3) 圖像分割
圖像分割是指將圖像劃分為不同的區(qū)域,這些區(qū)域相互不會(huì)重疊,而且每一個(gè)區(qū)域中的像素是連續(xù)的。目前常見的圖像分割方法是利用圖像的紋理特性來對(duì)其進(jìn)行分割,可進(jìn)一步分為區(qū)域法和邊緣法。其中,區(qū)域法是將像素劃分到特定的區(qū)域,而邊緣法是通過尋找區(qū)域之間的邊界來對(duì)圖像進(jìn)行分割。
基于區(qū)域的分割方法包括閾值法、分裂合并法等等,其基本原理是將圖像分割成多個(gè)不重疊的區(qū)域,同時(shí)保證每個(gè)區(qū)域特征的相似性是內(nèi)部大于外部,且每個(gè)區(qū)域內(nèi)部的像素滿足特征相似性準(zhǔn)則。基于邊緣的分割方法是通過檢測(cè)圖像局部特征的突變性來把圖像分割成不同的區(qū)域。典型的邊緣檢測(cè)算子包括微分算子法和邊界跟蹤法,微分算子法計(jì)算簡(jiǎn)單快速,但是對(duì)干擾噪聲較為敏感;邊界跟蹤法從梯度圖中的一點(diǎn)出發(fā),一次尋找相鄰邊緣點(diǎn),最終實(shí)現(xiàn)對(duì)邊界的檢測(cè)。在實(shí)際應(yīng)用中,通常綜合利用多種算法來對(duì)圖像進(jìn)行分割
(4) 圖像分析
在對(duì)圖像進(jìn)行上述一系列處理之后,通過對(duì)圖像進(jìn)行分析,從中提取出有用的數(shù)據(jù)和信息才是圖像處理的目的。而圖像分析就是為了獲得以數(shù)值形式所表示的數(shù)據(jù)和信息。與現(xiàn)有的模式識(shí)別、人工智能相比,圖像分析的內(nèi)容與其既有交叉也有區(qū)別。圖像分析是在利用圖像分割方法抽取圖像特征的基礎(chǔ)上,利用符號(hào)對(duì)圖像進(jìn)行描述,進(jìn)而判斷該圖像中是否存在某種信息。
圖像分析具體可包括圖像描繪和紋理分析兩個(gè)方面。其中,圖像描繪是在圖像分割的基礎(chǔ)上,利用目標(biāo)提供的信息和相互關(guān)系,對(duì)目標(biāo)進(jìn)行識(shí)別,可進(jìn)一步分為內(nèi)部描述、邊界描述和關(guān)系描述。常見的紋理分析方法主要是利用紋理圖像的結(jié)構(gòu)、紋理的不同數(shù)字特征、紋理在頻域的表現(xiàn)特點(diǎn)或某種數(shù)學(xué)模型對(duì)圖像的紋理進(jìn)行分析,與之相對(duì)應(yīng)的方法分別稱為結(jié)構(gòu)法、統(tǒng)計(jì)法、頻譜法和模型法。
3 數(shù)字多媒體圖像處理技術(shù)的應(yīng)用領(lǐng)域
在信息高速發(fā)展的今天,數(shù)字多媒體圖像已經(jīng)成為人們獲取和交換信息的重要方式,因此,數(shù)字多媒體圖像處理技術(shù)的應(yīng)用領(lǐng)域涉及人類生活的多個(gè)方面,具體而言:
在航空航天方面,較為常見的應(yīng)用場(chǎng)景是利用數(shù)字圖像處理技術(shù)對(duì)月球、火星的照片進(jìn)行處理,以及對(duì)飛機(jī)和衛(wèi)星遙感得到的圖像進(jìn)行處理[4]。尤其在遙感圖像方面,各個(gè)國(guó)家每天都利用飛機(jī)或衛(wèi)星對(duì)地球上的區(qū)域進(jìn)行空中拍照,對(duì)得到的照片如果采用人工處理則會(huì)花費(fèi)大量的人力物力,而采用數(shù)字圖像處理技術(shù)可可以高效地對(duì)得到的圖像進(jìn)行判讀分析,并從中提取出利用傳統(tǒng)人工方式無法獲得的大量有用信息。目前,各國(guó)都大量使用衛(wèi)星所獲得的圖像對(duì)地球資源進(jìn)行普查、對(duì)災(zāi)害進(jìn)行檢測(cè)或?qū)Τ鞘羞M(jìn)行規(guī)劃,在這些應(yīng)用中,數(shù)字圖像處理技術(shù)發(fā)揮了重要作用,且達(dá)到了良好效果。此外,在對(duì)太空的其他星球研究和天氣水文預(yù)報(bào)方面,數(shù)字圖像處理技術(shù)也必不可少。
在生物醫(yī)學(xué)工程方面,醫(yī)學(xué)上在對(duì)患者進(jìn)行診斷時(shí),常常利用CT、X光等技術(shù),通過對(duì)患者體內(nèi)成像來判斷患者病情。在成像過程中,常常采用數(shù)字圖像處理技術(shù)來獲得清晰的醫(yī)學(xué)圖像,包括肺部圖像、超聲波圖像、心電圖等[5]。此外,數(shù)字圖像處理技術(shù)還在醫(yī)用顯微圖像的處理分析方面發(fā)揮作用,包括細(xì)胞分類、病變細(xì)胞識(shí)別、染色體分析等。
在信息通信方面,隨著信息化的不斷發(fā)展,由于圖像可以給人直觀的感受,且傳遞的信息比文字形式更為感官,因此,利用圖像傳遞信息已經(jīng)成為非常重要的通信方式之一。但是由于圖像通信由于涉及的圖像數(shù)據(jù)量較大,也導(dǎo)致這種方式相對(duì)復(fù)雜。為了將圖像數(shù)據(jù)通過從傳統(tǒng)的信道實(shí)時(shí)發(fā)送出去,常用的解決方式是對(duì)圖像的信息進(jìn)行壓縮。目前常見的編碼方式包括自適應(yīng)網(wǎng)絡(luò)編碼、小波變換壓縮編碼等。
在工業(yè)和工程方面,零件質(zhì)量的檢測(cè)和分類,各種印刷電路板的質(zhì)量和瑕疵檢測(cè),彈性力學(xué)、流體力學(xué)相關(guān)圖片的力學(xué)分析,以及信件的識(shí)別和自動(dòng)分類等等,都使用了數(shù)字圖像處理技術(shù)[6]。此外,在一些人力無法或不宜達(dá)到的地方,如有毒區(qū)或放射性較大的區(qū)域等,可以利用數(shù)字圖像處理技術(shù)通過對(duì)工件或物體的圖像進(jìn)行分析,來對(duì)物體進(jìn)行識(shí)別和處理。
在軍事方面,數(shù)字圖像處理技術(shù)主要用于對(duì)軍事上涉及的各類圖像進(jìn)行處理和識(shí)別,包括導(dǎo)彈精確制導(dǎo)、采集照片的判讀、指揮系統(tǒng)中的圖像傳輸存儲(chǔ)和展示、模擬訓(xùn)練系統(tǒng)中的飛機(jī)坦克的建模和識(shí)別等等。在公安方面,數(shù)據(jù)圖像處理技術(shù)在圖像取證方面發(fā)揮著不可替代的作用,如利用數(shù)字圖像處理技術(shù)可以對(duì)嫌疑人的指紋和人臉進(jìn)行識(shí)別,對(duì)得到的模糊或缺損圖像進(jìn)行復(fù)原和增強(qiáng),對(duì)交通監(jiān)控和事故進(jìn)行分析等等。最為常見的用于案例是高速公路或停車場(chǎng)收費(fèi)系統(tǒng)中的車輛和車牌的自動(dòng)識(shí)別。
在文化藝術(shù)方面,典型的應(yīng)用可分為兩類,一類是視頻和多媒體系統(tǒng)中廣泛采用的數(shù)字圖像的編輯、合成、變換、靜止和動(dòng)態(tài)圖像信息的采集和處理及存儲(chǔ),同時(shí),在動(dòng)畫和電子游戲的制作方面也普遍使用了數(shù)字圖像處理技術(shù)。另一類是在文化藝術(shù)方面,數(shù)字圖像處理技術(shù)常被用于對(duì)各種工藝品進(jìn)行設(shè)計(jì)、缺失文物或歷史資料的復(fù)制和修復(fù),或?qū)悎?chǎng)上運(yùn)動(dòng)員的動(dòng)作進(jìn)行分析和評(píng)分等等,這一類應(yīng)用也相應(yīng)形成了計(jì)算機(jī)美術(shù)這一新的藝術(shù)形式。
在機(jī)器人視覺和可視化方面,將圖像處理技術(shù)和圖形學(xué)相結(jié)合,已經(jīng)在各個(gè)領(lǐng)域形成了較為成熟的研究工具,如對(duì)網(wǎng)絡(luò)態(tài)勢(shì)進(jìn)行可視化等等。在機(jī)器視覺方面,利用數(shù)字圖像處理技術(shù),機(jī)器人可以對(duì)二維和三維的物體進(jìn)行識(shí)別和理解,或?qū)娛颅h(huán)境進(jìn)行偵查等等。此外,在電子商務(wù)方面,如身份認(rèn)證、水印、產(chǎn)品真?zhèn)巫R(shí)別等方面,圖像處理技術(shù)也得到了相當(dāng)廣泛的應(yīng)用。
4 結(jié)論
數(shù)字多媒體圖像處理技術(shù)在軍事、工業(yè)、生物醫(yī)學(xué)、網(wǎng)絡(luò)通信、航空航天等多個(gè)領(lǐng)域都發(fā)揮了重要作用。隨著計(jì)算機(jī)的高速處理能力的提高,數(shù)字圖像處理技術(shù)也必將隨之迅速發(fā)展。在當(dāng)前各個(gè)學(xué)科不斷交流和融合的背景下,數(shù)字圖像處理也必將與其他相關(guān)學(xué)科彼此滲透和結(jié)合,在這種融合中,在高速處理能力的支持下,數(shù)字圖像處理技術(shù)在獲取和利用信息方面的優(yōu)勢(shì)將愈發(fā)明顯,未來也必將受到更多關(guān)注和重視。
參考文獻(xiàn):
[1] 楊宏偉.數(shù)字圖像處理技術(shù)及其應(yīng)用[J].電腦迷,2018(9):64.
[2] 周姣.基于MATLAB的數(shù)字圖像處理技術(shù)及應(yīng)用[J].大科技,2017(10).
[3] 李鄭冬.數(shù)字圖像處理技術(shù)發(fā)展探究[J].信息記錄材料,2019,20(2):99-100.
[3] 李鄭冬.數(shù)字圖像處理技術(shù)發(fā)展探究[J].信息記錄材料,2019,20(2):99-100.
[4] 楊欣程.主成分分析方法在遙感數(shù)字圖像處理中的應(yīng)用綜述[J].中國(guó)水運(yùn).航道科技,2017(3):67-71.
[5] 姚希.數(shù)字圖像處理技術(shù)及其應(yīng)用[J].電子技術(shù)與軟件工程,2017(18):87.
[6] 申賓德.數(shù)字圖像處理技術(shù)在機(jī)械工程領(lǐng)域中的應(yīng)用與研究[J].機(jī)械研究與應(yīng)用,2018,31(2):170-172.
【通聯(lián)編輯:光文玲】