辛齊 山東水文水資源局
多媒體視頻文件格式研究與應用
辛齊 山東水文水資源局
隨著計算機技術的發(fā)展和互聯(lián)網(wǎng)的普及,多媒體信息也因其強大的直觀可信性、超大的信息存量、方便的存放傳輸、簡單的操作而越來越受到人們的重視,進而帶動了多媒體文件技術的發(fā)展。
多媒體視頻文件是多媒體的核心組成,它是音頻流和視頻流經(jīng)過一定的封裝技術而生成的可以進行媒體播放的文件,按照應用環(huán)境分影像視頻文件和流式視頻文件。
1.1 影像視頻文件
影像視頻文件是適合本地播放的視頻文件,文件本身包含了大量的圖像和聲音信息,常用的影像視頻文件格式主要有AVI、MPEG等。
AVI是一種獨立于硬件設備且運動圖像和伴音交織存儲的文件,MPEG是運動圖像壓縮算法的國際標準,包括MPEG視頻、MPEG音頻和MPEG系統(tǒng)三個部分。
1.2 流式視頻格式
流媒體是指在Internet/Intranet中使用流式傳輸技術連續(xù)播放的視頻文件,它不需要下載整個文件,而是隨著數(shù)據(jù)流隨時傳送隨時播放。目前Internet上使用較多的流式視頻格式主要有RM格式、MOV格式、ASF格式、WMV格式等。
RM格式,是一種能夠在低速率網(wǎng)上實時傳輸視音頻信息的文件格式。它可以根據(jù)網(wǎng)絡數(shù)據(jù)傳輸速率的不同制定不同的壓縮比率,從而實現(xiàn)在低速率廣域網(wǎng)上進行影像數(shù)據(jù)的實時傳送和實時播放;MOV是能夠通過Internet提供實時數(shù)字化信息流、工作流與文件回放功能的文件格式;WMV是一種獨立于編碼方式的在Internet上實時傳播多媒體的技術標準,主要特點包括本地或網(wǎng)絡回放、可擴充媒體類型、部件下載、可伸縮媒體類型、流的優(yōu)先級化、多語言支持、環(huán)境獨立性、豐富的流間關系以及擴展性等。
采集的原始視頻文件由于數(shù)據(jù)量大,無法直接播放,因此需要對其進行壓縮編碼,并進行數(shù)據(jù)打包后才能進行播放,這就是視頻編碼和視頻文件封裝。
2.1 視頻編碼
為了使計算機能方便的處理并播放這些視頻文件,通過壓縮技術,去掉視頻編碼數(shù)據(jù)中的冗余信息,產(chǎn)生一個其視頻信號帶寬在計算機使用范圍內的一個新的編碼文件,這就是視頻編碼。
傳統(tǒng)的壓縮編碼是以Shannon信息論和集合論為基礎,用統(tǒng)計概率模型來描述信源的一種編碼技術標準,該標準有兩大系統(tǒng):MPEG和ITU-T。
2.2 視頻封裝
一個完整的媒體文件由音頻和視頻組成,將視頻編碼和音頻編碼按照一定的格式打包放到一個文件中,就是封裝。本文將目前常用的幾種視頻文件格式的封裝原理做簡單介紹。
2.2.1 AVI格式
AVI容器是成熟的老技術,它的視頻編碼格式和音頻編碼格式組合分別為Xvid、mp3或Divx、mp3,它的文件結構分為頭部,主體和索引三部分,主體中圖像數(shù)據(jù)和聲音數(shù)據(jù)交互存放。從尾部的索引可以跳到任意位置;AVI可以實現(xiàn)同步控制和實時播放以及無硬件視頻回放,實現(xiàn)硬盤和光盤的高效存儲,數(shù)字視頻的文件結構開放特點,支持多種編碼。
2.2.2 MOV格式
MOV格式文件是媒體描述和媒體數(shù)據(jù)分開存放,媒體描述單元包括軌道數(shù)目、視頻壓縮格式和時間信息,同時包含媒體數(shù)據(jù)存儲區(qū)域的索引;MOV格式的視頻文件支持領先的集成壓縮技術,提供多種視頻效果,配有多種MIDI兼容音響和設備的聲音裝置,具有跨平臺、省空間的特點。
2.2.3 MPEG格式
MPEG格式主要采用運動補償技術(預測編碼和插補碼)實現(xiàn)時間上的壓縮,變換域(離散余弦變換DCT)壓縮技術實現(xiàn)空間上的壓縮。該格式具有壓縮率高、圖像和音響的質量好,兼容性強的特點。
2.2.4 DivX格式
該格式采用了MPEG4的壓縮算法同時又綜合了MPEG-4與MP3各方面的技術,畫質逼真體積小。
3.1 影響視頻質量的因素
影響視頻質量的主要因素有三個,片源、分辨率、碼率、幀速,其中分辨率和碼率影響視頻影像的清晰度,幀速影響視頻播放的流暢度。
片源就是通過攝像頭錄入的原始視頻文件,它是決定視頻質量高低的必要因素,一個優(yōu)質的片源,是做出優(yōu)質多媒體基本條件。
碼率就是數(shù)據(jù)傳輸時單位時間傳送的數(shù)據(jù)位數(shù),通俗一點的理解就是取樣率,單位時間內取樣率越大,精度就越高,處理出來的文件就越接近原始文件,
3.1.1 分辨率
分辨率實際上就是畫面的大小,以像素點表示,通常由寬乘高像素總點數(shù)來計算,分辨率高的視頻,能反映的圖像就越細致,越清楚。
3.1.2 幀數(shù)
幀數(shù)就是在1秒鐘時間里傳輸?shù)膱D片的幀數(shù),也可以理解為圖形處理器每秒鐘能夠刷新幾次。高幀率可以得到更流暢、更逼真的動畫。
3.2 影響視頻質量因素之間的關系
3.2.1 分辨率與碼率對視頻質量的影響
分辨率越高,就需要越高的編碼率,所以,在分辨率一定的情況下,碼率越高視頻質量越高,在碼率一定的情況下,分辨率越高視頻的質量越低,圖像的馬賽克就越明顯。
3.2.2 碼率與幀數(shù)對視頻質量的影響
理論上講,碼率越高視頻質量越高,幀數(shù)越高視頻質量也越高,但是當碼率和幀數(shù)增高到一定數(shù)值后,由于文件體積的增大,較低配置的用戶會有卡頓現(xiàn)象,因此,一般幀數(shù)在50幀/秒就能滿足絕大多數(shù)用戶的要求了。
視頻文件格式對多媒體文件質量沒有直接的影響,但是,如何進行影像編碼和音頻編碼的組合,從而產(chǎn)生相對科學的碼率、分辨率以及幀數(shù)的組合,則是視頻文件格式完全可以做到的,從而對多媒體的質量產(chǎn)生較大影響。
[1]胡曉峰等著,《多媒體技術教程》(第三版),人民郵電大學出版社
[2]劉峰編著,《視頻圖像編碼技術及國際標準》,北京郵電大學出版社
[3]高文等著,《數(shù)字視頻編碼技術原理》,科學出版社出版