劉艷梅
摘要:數(shù)字圖像處理即是計算機圖像處理,也就是說把圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程。本文將重點介紹數(shù)字圖像處理研究的主要內(nèi)容和一些常見常用的計算機圖形圖像文件格式以及獲得高質(zhì)量視頻素材的方法。
關(guān)鍵詞:計算機圖像;圖像文件格式;視頻素材;研究
數(shù)字圖像處理(Digital Image Processing)是通過計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等處理的方法和技術(shù)。開始的時候圖像處理的目的是增加圖像的清晰度,調(diào)整圖像的亮度,剪裁圖像的大小等質(zhì)量問題。輸入的是質(zhì)量低的圖像,輸出的是改善后的令人滿意的圖像。近年來,隨著計算機和其它各有關(guān)領(lǐng)域的迅速發(fā)展,例如在圖像表現(xiàn)、科學計算可視化、多媒體計算技術(shù)等方面的發(fā)展,數(shù)字圖像處理已從一個專門的研究領(lǐng)域變成了科學研究和人機界面中的一種普遍應用的工具。因此計算機圖像處理是一個有待人們進一步探索的新領(lǐng)域。
當今隨著INTERNET及多媒體技術(shù)的高速,Web上或多媒體光盤中存在的大量生動逼真的數(shù)字化圖形圖像,給電視節(jié)目制作人員帶來了許多非常優(yōu)美直觀的信息源,也使利用他人的靈感、作品來豐富電視節(jié)目的制作,包裝成為可能,因而倍受人們的喜愛。但多數(shù)電視制作人員對種類繁多的機圖形圖像文件知之甚少,本文將重點介紹數(shù)字圖像處理研究的主要內(nèi)容和一些常見常用的計算機圖形圖像文件格式以及獲得高質(zhì)量視頻素材的方法。
1 數(shù)字圖像處理研究的主要內(nèi)容
圖像獲取和圖像表現(xiàn)階段主要是把模擬圖像信號轉(zhuǎn)化為計算機所能接受的數(shù)字形式,以及把數(shù)字圖像用所需要的形式顯示出來。
圖像復原當造成圖像退化的原因已知時,復原技術(shù)可用來進行圖像的校正。復原技術(shù)是基于模型和數(shù)據(jù)的圖像恢復,其目的是消除退化的影響,從而產(chǎn)生一個等價于理想成像系統(tǒng)所獲得的圖像。
圖像增強當無法知道與圖像退化有關(guān)的定量信息時,可以使用圖像增強技術(shù)較為主觀地改善圖像的質(zhì)量。
圖像分析對圖像中的不同對象進行分割、特征提取和表示,從而有利于計算機對圖像進行分類、識別、理解或解釋。
圖像重建由圖像的多個一維投影重建該圖像,可看成是特殊的圖像復原技術(shù)。
圖像編碼和壓縮對圖像進行編碼的主要目的是為了壓縮數(shù)據(jù),便于存儲和傳輸。
2 圖形圖像的存儲格式
BMP文件:是Microsoft Windows所定義的圖像文件格式,最早應用在Microsoft公司的Microsoft Windows窗口系統(tǒng)。眾所周知,Microsoft Windows 現(xiàn)今已成為PC機環(huán)境下窗口系統(tǒng)的事實上的標準,因而BMP圖像文件格式也越來越受到人們關(guān)注,在Windows環(huán)境中運行的圖形圖像軟件都支持BMP圖像格式。
GIF文件:GIF文件是“Graphics Interchange Format”(圖形交換格式)的縮寫,是由CompuServe公司為了方便和BBS使用者傳送圖像數(shù)據(jù)而制定的一種圖像文件格式。,GIF圖像文件已經(jīng)成為網(wǎng)絡和BBS上圖像傳輸?shù)耐ㄓ酶袷?經(jīng)常用于像動畫、透明等特技制作。
TIF(TIFF)文件:TIFF文件是“Tag Image File Format”的縮寫,是由Aldus公司與微軟公司共同開發(fā)設(shè)計的圖像文件格式。它的最大特點就是與計算機的結(jié)構(gòu)、操作系統(tǒng)以及圖形硬件系統(tǒng)無關(guān),它可以處理黑白、灰度、彩色圖像。在存儲真彩色圖像時和BMP格式一樣,直接存儲RGB三原色的濃度值而不使用彩色映像(調(diào)色板)。對于介質(zhì)之間的交換,TIF可以稱得上是位圖格式的最佳選擇之一。
PCX文件:PCX圖像文件是由Zsoft公司在80年代初期設(shè)計的,專用于存儲該公司開發(fā)的PC Paintbrush繪圖軟件所生成的圖像畫面數(shù)據(jù)。目前PCX文件已成為PC機上較為流行的圖像文件。對存儲繪圖類型的圖像(例如大面積非連續(xù)色調(diào)的圖像)合理而有效,而對于掃描圖像和視頻圖像,其壓縮方式可能是低效率的。
JPEG格式:JPEG格式一般用來顯示照片和WWW以及在線服務的HTML(超文本標記語言)文件,它能保存RGB圖象中的所有顏色信息。JPEG也是一種帶壓縮的文件格式,但在壓縮時文件有信息損失。當需要在INTERNET上發(fā)布新聞圖片時,一般以 .jpg格式的圖片上載,不能太大,一般為180*160像素,以免文件過大。
TGA格式:是由Truevision公司為視頻攝像機圖像而設(shè)計,用于幀捕捉的最主要的24位圖像格式,其典型的圖象尺寸為400*512個像素,每像素16、24或32位彩色。目前各電視臺節(jié)目制作時疊加的臺標和欄目標花多是以.tga圖片文件引入字幕機的。在電視臺節(jié)目的制作中,制作人員有時也需要利用非線性編輯設(shè)備從錄像帶上抓取畫面(抓幀),然后將所抓畫面用于印刷或上網(wǎng)發(fā)布新聞圖片。這時抓幀所得的圖像就是TGA文件格式,可以利用PhotoShop進行格式轉(zhuǎn)換。
3 ImageJ不同的運行版本
目前,關(guān)于圖像處理和分析的軟件或者函數(shù)庫,很多采用的都是c和c語言,對很多常見的圖像處理函數(shù)都有現(xiàn)成的代碼和成熟的工具。然而,針對java這一面向?qū)ο蟪绦蛟O(shè)計語言,卻沒有能很好地利用起來,在這上面開展的工作也較少,相關(guān)的工具也很少。ImageJ的出現(xiàn)在一定程度上改變了這一局面。ImageJ是目前世界上最快的純java圖像處理程序。它能在0.1秒內(nèi)對一張2048x2048的圖片進行過濾。 ImageJ不同的版本可以在Windows,MacOS,MacOSX和Linux系統(tǒng)上運行。它能讀入許多種圖片格式,包括TIFF,GIF,JPEG,BMP,DICOM和FITS。它支持“?!?也就是一系列的圖片共用一個窗口。它還是多線程的,所以像在處理讀入圖片這種費時的操作時,還可以并行進行其他的操作。它提供一些標準的圖像處理函數(shù),比如銳化、平滑、邊緣檢測和中值濾波等,能對圖片進行縮放、旋轉(zhuǎn)和反轉(zhuǎn)等。更重要的是,ImageJ采用了一種開放式的結(jié)構(gòu),通過加入java語言的插件來完成它的擴展。這樣,使用ImageJ的內(nèi)置編輯器和java編譯器就能得到各種插件。這樣的機制就使開發(fā)人員自己編寫的插件能解決他所需要解決的任何圖像處理和分析的問題。與之配合使用的macro語言,也為ImageJ帶來了更多的方便。
4 獲得高質(zhì)量視頻素材的幾種方法
采用序列幀的方式:這是最傳統(tǒng)、最有效也是使用最廣泛的一種方法。具體作法是在一些CG素材創(chuàng)作軟件系統(tǒng)中完成制作工作后,將CG素材輸出成一系列大孝格式相同而以一組連續(xù)數(shù)字編號命名的圖片,為了能很好地在其它剪輯或合成軟件中使用該素材,一般采用支持Alpha通道的圖片格式,如tga、tif等。現(xiàn)在幾乎所有的后期剪輯軟件、合成軟件及專業(yè)視頻板卡系統(tǒng)都具有將序列幀轉(zhuǎn)換成單一素材的功能,由于輸出時選用的一般是不壓縮的圖片格式,因此就實現(xiàn)了素材的無損傳遞,但其最大的缺陷是所得到的素材的數(shù)據(jù)量非常大。
采用帶Alpha通道的AVI格式:普通的AVI格式的視頻文件一般是不支持Alpha通道的,因此這種方法一般是在CG素材創(chuàng)作軟件系統(tǒng)中完成素材的制作后,在視頻硬件板卡的支持下將素材輸出成壓縮的、包含Alpha通道的AVI格式,例如在MatroxDigiSuiteLX板卡的支持下可以輸出成MPEG-2IFrame格式。這種方式通常也能獲得較好的視頻質(zhì)量,因為有硬件板卡支持所以輸出速度很快,其數(shù)據(jù)量也不是很大。
采用無損壓縮的方法:這種方法也能做到素材的無損傳遞,通常是采用無損編碼器將CG素材輸出成VideoforWindows格式或QuicktimeMovie格式。由于MOV格式可以很好的支持Alpha通道,而沒有板卡支持的AVI格式中無法包含Alpha通道,板卡支持的AVI格式又都是有損壓縮,因此這種方法中AVI格式應用不是太多,主要以輸出成MOV格式為主。特別是隨著最近新的、高水平的Quicktime無損編碼器的出現(xiàn),很好的解決了序列幀數(shù)據(jù)量大而AVI對Alpha通道支持不好的問題,成為一種在各軟件系統(tǒng)之間無損傳遞素材的好方法。