鄭李強(qiáng)
摘要:數(shù)字圖像處理技術(shù)伴隨著計(jì)算機(jī)技術(shù)的發(fā)展和人們對(duì)圖像處理的需要而產(chǎn)生,在現(xiàn)代生產(chǎn)生活中扮演者重要角色。文章簡要概述了數(shù)字圖像處理技術(shù)的重要性及其發(fā)展現(xiàn)狀,重點(diǎn)介紹了數(shù)字圖像處理技術(shù)的研究內(nèi)容和應(yīng)用。最后,分析了數(shù)字圖像處理技術(shù)存在的問題和發(fā)展趨勢。目的是使人們對(duì)數(shù)字圖像處理技術(shù)有更多的了解,激發(fā)人們研究的興趣。
關(guān)鍵詞:數(shù)字圖像處理;計(jì)算機(jī)技術(shù);現(xiàn)狀;應(yīng)用;發(fā)展趨勢
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)02-0169-03
Development and Application of Digital Image Processing Technology
ZHENG Li-qiang
(Northeastern University, Shenyang 110819, China)
Abstract: With the development of computer technology and the need of image processing, digital image processing technology is produced and plays an important role in modern production and life. The paper briefly overviews the importance and development status of digital image processing technology, and focuses on the research content and applications of digital image processing technology. Finally, the existing problems and development trend of digital image processing technology are analyzed. The purpose is to provide more knowledges and stimulate the interest of digital image processing technology for people.
Key words: digital image processing; computer technology; current situation; application; development trend
我們的生活離不開圖像,圖像是我們接觸最多的信息形式之一。研究發(fā)現(xiàn),包括圖像在內(nèi)的視覺信息約占人們獲得信息量的75%[1]。圖像包含大量且不可替代的重要信息,“一目了然”和“百聞不如一見”正是這一事實(shí)的反映。隨著人們獲取圖像渠道的多樣化和生產(chǎn)生活的需要,以及計(jì)算機(jī)技術(shù)的發(fā)展,運(yùn)用計(jì)算機(jī)進(jìn)行圖像處理成為必要,數(shù)字圖像處理技術(shù)應(yīng)運(yùn)而生。本文就數(shù)字圖像處理技術(shù)的研究現(xiàn)狀、內(nèi)容、應(yīng)用和發(fā)展作了相關(guān)探討。
1 數(shù)字圖像處理技術(shù)的研究現(xiàn)狀
數(shù)字圖像處理是指利用計(jì)算機(jī)處理數(shù)字圖像。它的發(fā)展始于20世紀(jì)20年代,當(dāng)時(shí)采用數(shù)字壓縮技術(shù)傳輸了第一張數(shù)字照片。由于技術(shù)的制約,數(shù)字圖像處理技術(shù)在隨后的發(fā)展比較緩慢。20世紀(jì)60年代初,伴隨著第一臺(tái)能夠執(zhí)行數(shù)字圖像處理任務(wù)的計(jì)算機(jī)問世,這實(shí)現(xiàn)了真正意義上的圖像處理。美國噴氣推進(jìn)實(shí)驗(yàn)室在1964年對(duì)航天探測器傳回的月球照片采用了數(shù)字圖像處理技術(shù)[2],得到了更為清晰的月球表面形貌照片,這次實(shí)踐也促進(jìn)了數(shù)字圖像處理這門學(xué)科的誕生。20世紀(jì)60年代到70年代,離散數(shù)學(xué)的創(chuàng)立和完善為數(shù)字圖像處理技術(shù)的發(fā)展提供了有力的工具[3]。這一時(shí)期,數(shù)字圖像處理技術(shù)在醫(yī)學(xué)領(lǐng)域也獲得了成功的應(yīng)用,突出的表現(xiàn)是計(jì)算機(jī)軸向斷層術(shù)的發(fā)明。1975年又研制出全身用的CT裝置,CT的發(fā)明為醫(yī)學(xué)技術(shù)進(jìn)步做出了巨大的貢獻(xiàn)。20世紀(jì)80年代,得益于計(jì)算機(jī)技術(shù)的發(fā)展,人們對(duì)圖像的研究能夠從二維領(lǐng)域進(jìn)入三維領(lǐng)域。數(shù)字圖像處理技術(shù)的進(jìn)步離不開圖像處理理論和方法的發(fā)展。20世紀(jì)70年代末,Marr提出了視覺計(jì)算理論,它成為計(jì)算機(jī)視覺領(lǐng)域其后多年的主導(dǎo)思想。20世紀(jì)90年代以來,數(shù)字圖像處理技術(shù)發(fā)展的趨勢是實(shí)現(xiàn)圖像處理的實(shí)時(shí)性、智能化、網(wǎng)絡(luò)化、低成本等。
2 數(shù)字圖像處理過程
數(shù)字圖像處理系統(tǒng)通常包括圖像數(shù)字化設(shè)備、圖像處理計(jì)算機(jī)和軟件、圖像輸出設(shè)備等。
3 數(shù)字圖像處理技術(shù)的研究內(nèi)容
3.1 圖像的數(shù)字化
圖像的數(shù)字化是指將傳感器獲取的連續(xù)圖像數(shù)據(jù)轉(zhuǎn)換為離散的數(shù)字形式,并且要保持與原圖像的一致又便于計(jì)算機(jī)進(jìn)行處理。取樣和量化是圖像數(shù)字化的兩個(gè)階段。取樣是指對(duì)圖像的每個(gè)像素坐標(biāo)進(jìn)行數(shù)字化,量化是指對(duì)像素幅值的數(shù)字化。取樣的樣本數(shù)和量化所用的灰度級(jí)數(shù)決定著數(shù)字圖像的質(zhì)量。圖像提取技術(shù)的發(fā)展分為4個(gè)階段:分別是萌芽階段、初期階段、飛躍階段和分化階段。圖像的數(shù)字化技術(shù)離不開理論的發(fā)展,電影和視頻產(chǎn)業(yè)的發(fā)展產(chǎn)生了圖像提取技術(shù)[4],Porter和Duff提出了通道概念[5],新的處理方法如四元組像素,前景與背景間交界區(qū)域估計(jì)模型[6]以及借助數(shù)學(xué)工具來獲得更優(yōu)的效果。
3.2 圖像壓縮
圖像壓縮是指通過變換和組合的編碼手段對(duì)要處理的數(shù)據(jù)源進(jìn)行簡化,以更少的代碼來表示更多的信息。圖像的壓縮是利用了數(shù)字圖像的相關(guān)性和人的視覺心理特征這兩個(gè)原理。圖像壓縮系統(tǒng)有編碼器和解碼器兩個(gè)功能不同的部分組成。如果解碼后的數(shù)據(jù)和原來的數(shù)據(jù)完全一樣,則壓縮系統(tǒng)被稱為無損的或信息保持的壓縮系統(tǒng),否則稱為有損壓縮系統(tǒng)。隨著壓縮編碼技術(shù)的發(fā)展,后人根據(jù)時(shí)間將其劃分為前后兩個(gè)階段。第一代圖像壓縮編碼的研究來自于傳統(tǒng)的數(shù)據(jù)壓縮理論,典型的編碼方法有1952年提出的Huffman編碼、1977年提出的基于字典的壓縮編碼算法LZ77和后來改進(jìn)的LZ78。第二代圖像壓縮編碼由Kunt等人提出,這種編碼方法能夠克服先前編碼方法存在的壓縮比小、圖像復(fù)原質(zhì)量不理想等弱點(diǎn),如分形圖像編碼壓縮方案、基于小波變換的圖像壓縮編碼算法、EZW編碼算法和SPIHT算法。endprint
3.3 圖像增強(qiáng)與復(fù)原
圖像增強(qiáng)是指對(duì)圖像的某些特征,如邊緣、輪廓、對(duì)比度等進(jìn)行強(qiáng)調(diào)或尖銳化,以便于顯示、觀察或進(jìn)一步地分析與處理[7]。運(yùn)用一定的技術(shù)手段來提高圖像的清晰度,目的是改善圖像質(zhì)量,使圖像成為更適合人或計(jì)算機(jī)識(shí)別的形式。圖像增強(qiáng)與圖像復(fù)原不同,圖像增強(qiáng)不考慮圖像退化的原因,只是為了突出圖像中所需要的信息。根據(jù)處理所在的空間不同,圖像增強(qiáng)分為在空間域的增強(qiáng)和在頻率域的增強(qiáng)。常見的圖像增強(qiáng)方法有:直方圖修正、圖像平滑、圖像銳化、偽彩色增強(qiáng)。圖像復(fù)原是將退化的圖像恢復(fù)為原來的模樣,即是達(dá)到和原圖的一模一樣。圖像復(fù)原方法有代數(shù)復(fù)原、頻域復(fù)原和幾何校正[8]。
3.4 圖像分割
圖像分割是把圖像分成特定的區(qū)域,然后提取所需目標(biāo)的技術(shù)。從本質(zhì)上講,它是將各像素進(jìn)行分類的過程。多數(shù)分割算法是基于灰度值相似性和不連續(xù)性的性質(zhì)。圖像分割方法分為4類:基于閾值的分割、基于區(qū)域的分割、基于邊緣的分割和圖像運(yùn)動(dòng)目標(biāo)分割。近年來,研究者將其他學(xué)科的新理論和新方法應(yīng)用在圖像分割中,提出了許多新的分割方法。比如,1975年提出遺傳算法[9],它是一種具有全局搜索能力的迭代式優(yōu)化算法。基于小波分析的邊緣檢測算法,利用小波的多尺度性可以實(shí)現(xiàn)較高精度的分割。1987年提出Snake模型[10],該模型在提取和跟蹤特定區(qū)域內(nèi)目標(biāo)輪廓方面具有良好的效果。在實(shí)際應(yīng)用中,常將各種方法結(jié)合使用來取得最佳的效果。
3.5 圖像分析
圖像分析是圖像處理的高級(jí)階段,是利用計(jì)算機(jī)來分析圖像,輸出的結(jié)果是描述圖像的數(shù)值或符號(hào)。比如在醫(yī)學(xué)圖像處理中,不僅要檢測出異變的存在,而且還要檢查其尺寸大小。圖像分析可以從圖像描繪和紋理分析兩個(gè)方面入手。其中,圖像描繪通常有區(qū)域內(nèi)部描述、區(qū)域邊界描述和關(guān)系描述;紋理分析的研究方法有結(jié)構(gòu)法、統(tǒng)計(jì)法、頻譜法和模型法。過去的圖像分析幾乎完全是兩維的圖像處理,而隨著共聚焦顯微鏡和其他先進(jìn)成像技術(shù)的出現(xiàn),圖像分析能夠擴(kuò)展到三維圖像處理。
4 數(shù)字圖像處理技術(shù)的應(yīng)用
隨著計(jì)算機(jī)技術(shù)的高速發(fā)展以及圖像處理理論和方法的完善進(jìn)步,數(shù)字圖像處理系統(tǒng)的性能也隨之提高。數(shù)字圖像處理在各個(gè)行業(yè)中的應(yīng)用更加廣泛,如生物醫(yī)學(xué)、航天遙感、工業(yè)和工程、軍事和安全等領(lǐng)域。
4.1 生物醫(yī)學(xué)工程
在生物醫(yī)學(xué)方面,數(shù)字圖像處理技術(shù)有著廣闊的應(yīng)用前景。在醫(yī)學(xué)領(lǐng)域利用圖像處理技術(shù)可以實(shí)現(xiàn)對(duì)疾病直觀和非接觸無痛的診斷和治療。醫(yī)學(xué)圖像的三維重建還原組織、器官的形態(tài)結(jié)構(gòu),對(duì)外科手術(shù)制定、病灶定位、組織容積測量有重要的臨床意義。除此之外,圖像處理也應(yīng)用在DNA顯示分析,超聲圖像成像、增強(qiáng)及偽彩色處理,內(nèi)臟大小形狀及異常檢查,心肌活動(dòng)的動(dòng)態(tài)分析,在研究生物進(jìn)化的圖像分析上有很廣泛的應(yīng)用。
4.2 航天遙感領(lǐng)域
在航空航天遙感領(lǐng)域,數(shù)字圖像處理技術(shù)發(fā)揮著重要作用。在航空航天方面,數(shù)字圖像處理技術(shù)能夠?qū)教炱鞑杉恼掌幚硪垣@取所需的信息。20世紀(jì)70年代初到90年代末,美國太空總署發(fā)射了多顆資源遙感衛(wèi)星,并對(duì)衛(wèi)星采集的圖像運(yùn)用了很多數(shù)字圖像處理技術(shù)。2008年11月,我國第一幅全月影像圖正式發(fā)布,它是由“嫦娥一號(hào)”衛(wèi)星拍攝并經(jīng)過各種處理、校正和鑲嵌拼接以后的合成照片[11]。在衛(wèi)星遙感方面,如森林工作者根據(jù)對(duì)周期性的森林遙感圖像的分析,掌握森林長勢、氣候干旱程度等信息,還可以提前預(yù)知森林火災(zāi)的發(fā)生。在國土方面,利用遙感技術(shù)掌握本國的土地資源。在農(nóng)業(yè)方面,應(yīng)用遙感技術(shù)對(duì)農(nóng)作物估產(chǎn)及病蟲害調(diào)查,以及對(duì)大片草場的調(diào)查和檢測。在自然災(zāi)害的檢測上,遙感圖像為大面積的洪澇災(zāi)害和干旱提供準(zhǔn)確的信息,對(duì)抗災(zāi)救災(zāi)發(fā)揮重要作用。在海洋遙感方面,涉及海浪觀測、漁業(yè)資源監(jiān)測、海洋環(huán)境污染等。
4.3 工業(yè)和工程領(lǐng)域
圖像處理在工業(yè)生產(chǎn)和工程中的應(yīng)用十分廣泛,可以實(shí)現(xiàn)對(duì)產(chǎn)品的快速及無損檢測,促進(jìn)生產(chǎn)效率的提高并取得了巨大的經(jīng)濟(jì)效益。比如浮法玻璃生產(chǎn)中,在玻璃生產(chǎn)流水線上進(jìn)行在線檢測,以檢查是否含有劃痕、雜質(zhì)、裂紋等缺陷。在紡織方面,采用數(shù)字圖像處理技術(shù)可以檢測紡織品是否存在孔洞等疵點(diǎn)。其他方面的應(yīng)用還有晶振元件缺陷檢測、流水線零件的自動(dòng)檢測識(shí)別、郵件和包裹的分揀、焊縫及內(nèi)部缺陷的檢查、彈性力學(xué)照片的應(yīng)力分析、軋鋼廠軋制中的鋼坯位置的確定和尺寸的測量等。
4.4 軍事和安全領(lǐng)域
圖像處理在軍事、道路交通、人臉識(shí)別等方面發(fā)揮著重要作用,大大提高了技術(shù)的進(jìn)步。在軍事方面,導(dǎo)彈的精確制導(dǎo)需要借助對(duì)地形和目標(biāo)物圖像的分析和識(shí)別。在導(dǎo)彈發(fā)射后的飛行過程中,對(duì)采集到的地形地貌和目標(biāo)信息進(jìn)行及時(shí)處理判斷,選擇正確的飛行路徑,實(shí)現(xiàn)自主制導(dǎo)。偵察衛(wèi)星可以對(duì)敵方位置進(jìn)行拍照,根據(jù)照片信息對(duì)目標(biāo)進(jìn)行精確識(shí)別。在交通領(lǐng)域,高速公路收費(fèi)站通過安裝的高清車牌識(shí)別系統(tǒng),實(shí)現(xiàn)識(shí)別車輛牌照,并能和數(shù)據(jù)庫中的可疑車輛信息進(jìn)行對(duì)比,為破案提供參考。道路交通視頻監(jiān)控圖像識(shí)別的應(yīng)用也十分廣泛,如西門子公司的交通監(jiān)控系統(tǒng),不僅能探測隧道中慢行或停止的汽車,還可探測在U形轉(zhuǎn)彎處的違規(guī)汽車[12]。人臉識(shí)別是指對(duì)給定的包括人臉的輸入圖像,通過某種方式與已知人臉庫中存儲(chǔ)的模型進(jìn)行匹配比較,確定是否是庫中某一人物。人臉識(shí)別技術(shù)在身份驗(yàn)證中得到廣泛應(yīng)用,如支付寶采用人臉識(shí)別作為密碼保護(hù)手段,智能手機(jī)使用人臉進(jìn)行解鎖等。
4.5 其他方面
數(shù)字圖像處理在其他方面的應(yīng)用主要有圖像通信、光學(xué)字符識(shí)別、人臉表情、圖片社交應(yīng)用等。20世紀(jì)70年代后,人們的信息交流更多地轉(zhuǎn)變?yōu)槭褂脠D像通信的方式,包括電視、可視電話和傳真等。隨著VLSI的發(fā)展,極大地促進(jìn)了圖像通訊的進(jìn)步。光學(xué)字符識(shí)別是指利用電子設(shè)備采集文字圖像并借助計(jì)算機(jī)技術(shù)對(duì)紙面上的文字進(jìn)行自動(dòng)識(shí)別;還有針對(duì)圖像/視頻的內(nèi)容進(jìn)行檢索,從圖像中分析提取底層視覺特征,利用這些特征來衡量圖像之間的相似程度。人臉表情的識(shí)別,計(jì)算機(jī)對(duì)采集到的人臉表情信息作出判斷,從而實(shí)現(xiàn)人機(jī)之間的信息交流。著名的圖片社交應(yīng)用有“Instagram”、“美圖秀秀”、“圖釘”等終端手機(jī)軟件?!懊缊D秀秀”兼具圖像處理和分享功能,深受用戶喜愛。endprint
5 存在問題和發(fā)展方向
5.1 存在問題
目前,數(shù)字圖像處理存在以下幾個(gè)方面的問題:1)數(shù)字圖像的信息量大,圖像占據(jù)的頻帶寬,因而需要提高處理速度和改善頻帶壓縮技術(shù);2)由于圖像反映的是三維事物的二維投影,因此要由二維圖像去理解三維事物的信息需要其他相關(guān)知識(shí)的引導(dǎo)。在這個(gè)方面需要進(jìn)一步探究;3)圖像處理的結(jié)果是由人來判斷的,因此帶有很強(qiáng)的主觀色彩;4)數(shù)字圖像處理技術(shù)需要多方面的知識(shí),綜合性強(qiáng)。需要數(shù)學(xué)、物理學(xué)等理論的基礎(chǔ)知識(shí),還要利用計(jì)算機(jī)技術(shù)、通信技術(shù)等技術(shù)的支撐。
5.2 發(fā)展方向
圖像處理技術(shù)未來的發(fā)展表現(xiàn)在以下4個(gè)方面:1)圖像處理技術(shù)將向著高速、實(shí)時(shí)化、智能化和標(biāo)準(zhǔn)化方向發(fā)展;2)由二維向三維或多維成像的方向發(fā)展;3)從靜止圖像向動(dòng)態(tài)圖像發(fā)展,從單態(tài)圖像向多態(tài)圖像發(fā)展;4)將其他學(xué)科的理論和方法運(yùn)用到圖像處理領(lǐng)域,開拓新的理論算法。
參考文獻(xiàn):
[1] 章毓晉. 圖像處理和分析技術(shù)[M]. 北京: 高等教育出版社, 2014.
[2] Rafael C. Gonzalez, Richard E. Woods. 數(shù)字圖像處理[M]. 阮秋琦, 阮宇智, 譯. 3版. 北京: 電子工業(yè)出版社, 2011: 3.
[3] 孫正. 數(shù)字圖像處理與識(shí)別[M]. 北京: 機(jī)械工業(yè)出版社, 2014: 2.
[4] FIELDING R. The Technique of Special Effects Cinematography (Third Edition) [M]. London: Focal/Hastings House, 1972.
[5] PORTER T, DUFF T. Compositing Digital Images [J]. Computer Graphics (ACM), 1984, 18(3):253-259.
[6] 陳炳權(quán). 數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向[J]. 吉首大學(xué)學(xué)報(bào):自然科學(xué)版, 2009, 30(1):63-70.
[7] 趙榮椿. 數(shù)字圖像處理導(dǎo)論[M]. 西安: 西北工業(yè)大學(xué)出版社, 2000: 74.
[8] 楊帆. 數(shù)字圖像處理與分析[M]. 北京: 北京航空航天大學(xué)出版社, 2010: 59.
[9] 周銘, 周惠. 基于遺傳算法的自適應(yīng)聚類圖像閾值分割方法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2005(18):73-76.
[10] KASS M, WITKIN A, TERZOPOULOS D. Snake: Active Contour Models [J]. International Journal of Computer Vision, 1987, 1(4):321-331.
[11] 胡學(xué)龍. 數(shù)字圖像處理[M]. 北京: 電子工業(yè)出版社, 2011: 4.
[12] 曹建. 圖像目標(biāo)的表示與識(shí)別[M]. 北京: 機(jī)械工業(yè)出版社, 2012: 3.endprint