劉羽飛
基于離散余弦變換的數(shù)字圖像壓縮算法實(shí)現(xiàn)
劉羽飛
隨著互聯(lián)網(wǎng)通訊技術(shù)和數(shù)字媒體技術(shù)的快速發(fā)展,現(xiàn)代社會(huì)處于一種信息化時(shí)代,各種語(yǔ)音、文字、數(shù)字圖像等大量的信息處于高速流通中。其中數(shù)字圖像技術(shù)在各領(lǐng)域被廣泛使用,對(duì)于數(shù)字圖像的處理技術(shù)也得到迅速發(fā)展。但是一般數(shù)字圖像都具有數(shù)據(jù)量大的特點(diǎn),給圖像傳輸、圖像加密、圖像存儲(chǔ)等數(shù)字圖像處理中的常見(jiàn)問(wèn)題的解決增加了難度。數(shù)字圖像這一特點(diǎn)是數(shù)字圖像處理技術(shù)發(fā)展中必須克服的因素。
目前,數(shù)字圖像壓縮技術(shù)的研究與發(fā)展前景,受到更多學(xué)者專家的關(guān)注,越來(lái)越多的數(shù)字圖像壓縮技術(shù)被提出。數(shù)字圖像的壓縮也被稱為數(shù)字圖像編碼,通過(guò)用少量的有效像素值將數(shù)字圖像有損或者無(wú)損表示原來(lái)的數(shù)字圖像技術(shù)。數(shù)字圖像壓縮技術(shù)的目的是要將原始數(shù)據(jù)量較大數(shù)字圖像通過(guò)壓縮技術(shù)后數(shù)字圖像的數(shù)據(jù)量減少,但是壓縮后的數(shù)字圖像基本達(dá)到原始圖像的效果,并包含主要信息,這樣方便數(shù)字圖像的傳輸、顯示、交換等。目前,數(shù)字圖像壓縮處理技術(shù)領(lǐng)域常用的壓縮方法有離散余弦變換理論、小波變換理論、圖像壓縮感知理論等。在國(guó)際上數(shù)字圖像處理的JPEG的標(biāo)準(zhǔn)既通過(guò)使用離散余弦變換將獲得的一幅數(shù)字圖像各圖像塊的離散余弦變換DCT的系數(shù),接下來(lái)通過(guò)對(duì)系數(shù)的量化,再對(duì)其進(jìn)行熵編碼得到壓縮后的數(shù)字圖像。圖像在壓縮后用于傳輸,因此圖像在傳輸后需要解碼,數(shù)字圖像的解碼就是壓縮過(guò)程的逆變換。由于利用離散余弦變換對(duì)數(shù)字圖像壓縮具有較好的壓縮效果,JPEG的圖像壓縮標(biāo)準(zhǔn)在各領(lǐng)域被廣泛使用,目前在通訊及網(wǎng)絡(luò)傳輸大部分的圖像都是采用的JPEG的壓縮標(biāo)準(zhǔn)[1-3]。數(shù)字圖像小波變換壓縮原理是將數(shù)字圖像進(jìn)行小波變換,在變換的過(guò)程中選擇合適的小波基進(jìn)行小波變換分解,進(jìn)行小波變換后會(huì)產(chǎn)生小波系數(shù)矩陣,壓縮過(guò)程就對(duì)變換后的小波系數(shù)矩陣進(jìn)行量化。最后得到量化后的小波系數(shù)矩陣進(jìn)行編碼。在利用小波變換算法對(duì)數(shù)字圖像壓縮過(guò)程中最關(guān)鍵和最核心的是小波系數(shù)矩陣的量化過(guò)程,量化方式將直接導(dǎo)致和影響數(shù)字圖像的壓縮效果。數(shù)字圖像的壓縮感知理論是基于對(duì)數(shù)字圖像進(jìn)行直接隨機(jī)觀測(cè),隨機(jī)觀測(cè)即隨機(jī)采集數(shù)字圖像中的隨機(jī)數(shù)據(jù)信息,通過(guò)隨機(jī)采集到的數(shù)字圖像數(shù)據(jù)信息作為圖像壓縮的數(shù)據(jù)。在解碼過(guò)程中對(duì)隨機(jī)采集到壓縮圖像數(shù)據(jù)進(jìn)行壓縮感知信號(hào)的重組及重構(gòu)還原出壓縮前的數(shù)字圖像信息。本文通過(guò)對(duì)數(shù)字圖像進(jìn)行離散余弦變換后進(jìn)行頻域壓縮的方法,通過(guò)Matlab仿真實(shí)現(xiàn)與結(jié)果分析。通過(guò)仿真結(jié)果得出DCT變換在數(shù)字圖像壓縮應(yīng)用中以下優(yōu)點(diǎn)能進(jìn)行快速壓縮處理,壓縮后圖像質(zhì)量較高,壓縮過(guò)程中的計(jì)算效率高,有效地獲得了更好的壓縮效果[4]。
在數(shù)字圖像處理中通常會(huì)將圖像從空間域轉(zhuǎn)換到頻率域上進(jìn)行分析處理。通過(guò)簡(jiǎn)單的積分變換就可以得到圖像的空間頻率成分,進(jìn)而對(duì)圖像在頻域上進(jìn)行處理。離散余弦變換也被看作為傅里葉變換的一種相關(guān)的頻域變換方法,可以簡(jiǎn)稱為DCT,其中離散余弦變換有具體的數(shù)學(xué)推導(dǎo)公式及過(guò)程,在不同的應(yīng)用領(lǐng)域也分別會(huì)代表不同的物理意義[5-6]。
一維離散余弦變換:
(1)
(2)
二維離散余弦變換如下:
(3)
其中u=0,1,2…M-1;v=0,1,2…N-1
(4)
(5)
其二維離散余弦變換的反變換如:
(6)
基于離散余弦變換DCT圖像壓縮方法的流程如圖1所示,其算法步驟主要分為以下幾步:第一步要將被壓縮的圖像進(jìn)行分塊處理,通常將圖像分為8×8的圖像子塊。接下來(lái)第二步將對(duì)分好的每個(gè)子塊進(jìn)行離散余弦變換,變換后的圖像低頻部分都大部分集中在圖像頻譜圖中的左上角處,而高頻部分基本集中在頻譜圖的右下角區(qū)域中。由于數(shù)字圖像中的主要數(shù)據(jù)信息都是低頻的信息,主要存在低頻部分,所以對(duì)應(yīng)的離散余弦變換后的低頻系數(shù)較大。高頻部分包含的信息量小,對(duì)應(yīng)的DCT系數(shù)比較小可以忽略。在數(shù)字圖像壓縮中,對(duì)圖像的頻譜圖像的低頻部分進(jìn)行保留處理,及保存CDT變換后系數(shù)較大的部分,將高頻系數(shù)較小的那部分舍棄,通常情況下人的眼睛對(duì)高頻的信息不敏感,從而當(dāng)高頻部分被舍棄,人眼也很難察覺(jué)到有失真。在數(shù)字圖像傳輸過(guò)程中,就是利用這個(gè)壓縮特點(diǎn),將圖像變換后的高頻信號(hào)系數(shù)舍去進(jìn)行壓縮數(shù)據(jù)的傳輸,當(dāng)接收到圖像壓縮數(shù)據(jù)后需要還原圖像,將壓縮的圖像數(shù)據(jù)進(jìn)行離散余弦反變換恢復(fù)到原有的圖像數(shù)據(jù)值。在這過(guò)程中圖像會(huì)有一定的數(shù)據(jù)丟失,但是人眼還是無(wú)法直接看出。這就實(shí)現(xiàn)了數(shù)字圖像壓縮傳輸?shù)哪康摹F浯问沁M(jìn)行DCT系數(shù)的量化,對(duì)圖像進(jìn)行量化將會(huì)導(dǎo)致圖像的質(zhì)量下降,圖像經(jīng)過(guò)DCT變換后,DCT系數(shù)的幅度可能較大,因此需要量化系數(shù)不為零的系數(shù)項(xiàng)減小其系數(shù)的幅度,有些高頻系數(shù)可以量化為零,增加系數(shù)為零項(xiàng)的數(shù)目。在量化過(guò)程中,通常將低頻部分的量化閾值系數(shù)設(shè)為較小的數(shù)值,最大限度地保留數(shù)字圖像原有的主要數(shù)據(jù)信息。在高頻部分設(shè)置系數(shù)閾值時(shí),一般都將高頻系數(shù)值設(shè)為零。一般情況下量化的閾值選定直接導(dǎo)致壓縮的效果,即在圖像的壓縮比與圖像質(zhì)量之間的取舍,量化的閾值越大,圖像的壓縮比越高。通常情況下想要獲得更好的圖像壓縮質(zhì)量,則需要綜合考慮設(shè)置合理的量化閾值對(duì)圖像進(jìn)行壓縮處理。在量化編碼過(guò)程中,其中DC為圖像的直流分量,DC分量包含了圖像頻譜的主要部分,也包含了圖像的主要信息,對(duì)其系數(shù)進(jìn)行編碼的系數(shù)一般取值較大。
圖1 壓縮過(guò)程
在實(shí)驗(yàn)仿真中選取了一幅灰度級(jí)為0到255,圖像大小為488×360像素的鮮花圖像作為壓縮處理的圖像,對(duì)圖像先進(jìn)行二維離散余弦變化后的頻譜圖如圖2所示,從實(shí)驗(yàn)仿真結(jié)果圖可以明顯看出二維離散余弦變化后圖像左上角較亮,說(shuō)明左上角數(shù)字較大,能量信息基本集中在左上角,通過(guò)舍棄右下角的高頻數(shù)據(jù)將可以實(shí)現(xiàn)圖像的壓縮。
(a)
(b)
(a)
(b)
(c)
(d)
(e)
(f)
實(shí)驗(yàn)過(guò)程中采用保留不同個(gè)數(shù)的量化系數(shù)實(shí)現(xiàn)不同的壓縮比進(jìn)行壓縮,實(shí)驗(yàn)結(jié)果如圖3所示。為了直觀地看清楚不同壓縮比下的壓縮圖像效果,在圖3中給出了六幅不同壓縮比下的壓縮圖像,在圖(a)(b)(c)三幅圖像中分別保留了21,15,10個(gè)量化系數(shù),在這三幅圖像中還是可以清晰看到圖像整體輪廓和細(xì)節(jié),保存了較多原有的圖像信息。圖(d)(e)(f)三幅壓縮圖像分別保留了7,5,3個(gè)量化系數(shù)。從圖中可以明顯看到與前三幅壓縮圖像的壓縮效果不同,后三幅圖像出現(xiàn)了模糊的現(xiàn)象,保留了大致的輪廓,其中一些細(xì)節(jié)的東西顯示不明顯,圖像出現(xiàn)了失真,圖像的質(zhì)量出現(xiàn)了下降。
通常用峰值信噪比(PSNR)來(lái)評(píng)價(jià)一幅圖像壓縮后和原圖像相比質(zhì)量的好壞, PSNR越高,壓縮后失真越小。公式如下:
(7)
(8)
其中MNS表示均方差,MAX表示圖像的灰度級(jí)。
其中圖(a)(b)(c)(d)(e)(f)對(duì)應(yīng)的PSNR值分別為81.054 8、76.383 5、70.235 8、50.487 2、42.698 1、36.584 2。雖然圖5(f)壓縮后的圖像有些模糊,但PSNR值仍能達(dá)到36.5842,人眼在一定的誤差范圍內(nèi)仍能接受。
通過(guò)仿真結(jié)果得知當(dāng)圖像要想獲得較低的壓縮比,就要保留較多的量化系數(shù)個(gè)數(shù),這樣通過(guò)DCT變換壓縮后的圖像質(zhì)量較高。當(dāng)圖像量化系數(shù)個(gè)數(shù)保留較少時(shí),獲得較高的壓縮比,但是數(shù)字圖像的信息量會(huì)減少導(dǎo)致圖像的質(zhì)量下降。因此在實(shí)際的圖像壓縮處理中,則需要合理選擇適合的壓縮比對(duì)圖像進(jìn)行壓縮處理以達(dá)到所要滿足的圖像質(zhì)量要求。
本文通過(guò)利用離散余弦變換DCT對(duì)數(shù)字圖像表示從空間域變換到頻域表示,根據(jù)離散余弦變換圖像頻譜分布的特點(diǎn)。通過(guò)舍棄部分?jǐn)?shù)據(jù),用較少的數(shù)據(jù)信息量來(lái)表示壓縮后的圖像,能較大地減少原始圖像信息冗余的情況,從而實(shí)現(xiàn)了保留主要信息的同時(shí)較好地壓縮了數(shù)字圖像的數(shù)據(jù)量。使用MATLAB實(shí)驗(yàn)仿真,對(duì)數(shù)字圖像進(jìn)行了不同程度的壓縮,給出了保留不同量化個(gè)數(shù)下圖像的壓縮效果圖,對(duì)壓縮圖像進(jìn)行了分析。通過(guò)實(shí)驗(yàn)仿真結(jié)果表明離散余弦變換DCT應(yīng)用在數(shù)字圖像壓縮中取得了較好的效果,表明該方法有很高的可行性,其操作簡(jiǎn)單,壓縮處理計(jì)算快,壓縮后的圖像質(zhì)量較高,能有效減少圖像的數(shù)據(jù)量,便于圖像的保存及傳輸。
[1] 劉雅莉.二維DCT 變換在JPEG圖像壓縮中的應(yīng)用及其MATLAB實(shí)現(xiàn)[J]. 理論與算法, 2014(5): 33-35.
[2] 武瑛.DCT變換在圖像壓縮中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化, 2013(4): 103-106.
[3] 陳一虎.基于離散余弦變換的圖像壓縮研究[J]. 現(xiàn)代電子技術(shù), 2011, 34(21): 86-88.
[4] 陳波, 王紅霞, 成禮智. 圖像壓縮中的快速方向離散余弦變換[J]. 軟件學(xué)報(bào), 2011, 22(4): 826-832.
[5] 姚軍財(cái).一種基于DFT 的數(shù)字圖像壓縮算法[J]. 陜西理工學(xué)院學(xué)報(bào)( 自然科學(xué)版), 2012, 28(3): 22-25.
[6] 王新年, 張濤. 數(shù)字圖像壓縮技術(shù)實(shí)用教程[M]. 北京: 機(jī)械工業(yè)出版社, 2009.
責(zé)任編輯 陳桂梅
(韶關(guān)學(xué)院 物理與機(jī)電工程學(xué)院,廣東 韶關(guān) 512005)
隨著互聯(lián)網(wǎng)技術(shù)及通訊技術(shù)的快速發(fā)展,數(shù)字圖像被廣泛使用。對(duì)數(shù)字圖像的壓縮技術(shù)是數(shù)字圖像處理技術(shù)中的關(guān)鍵技術(shù)之一。本文介紹了一種基于離散余弦變換(DCT)頻域變換方法,使用該方法對(duì)數(shù)字圖像進(jìn)行圖像數(shù)據(jù)的壓縮。該方法用MATLAB仿真軟件對(duì)實(shí)驗(yàn)測(cè)試的數(shù)字圖像進(jìn)行壓縮,對(duì)比不同壓縮比下的壓縮圖像進(jìn)行分析,通過(guò)實(shí)驗(yàn)仿真結(jié)果得出離散余弦變換應(yīng)用在數(shù)字圖像壓縮中有良好的效果。該方法具有操作簡(jiǎn)單,處理速度快,易于操作,壓縮圖像質(zhì)量高等優(yōu)點(diǎn)。
圖像壓縮; 離散余弦變換
Digital Image Compression Based on Discrete Cosine Transformative Algorithm
LIUYufei
(School of Physics and Electrical and Mechanical Services, Shaoguan University,Shaoguan 512005, China)
With the rapid development of Tnternet and communication technology, digital image is widely used. The digital image compression is one of the key technologies of digital image processing techniques. This paper introduces a method in digital image compression, which based on using discrete cosine transform (DCT) frequency domain. The processes of compare and analysis the compressed images are done by the MATLAB simulation software in different compression ratio. The result shows the discrete cosine transform gains great effect than others. The advantages of the DCT method are easy operation, fast processing and high quality compression image.
image compression; discrete cosine transform
10.13750/j.cnki.issn.1671-7880.2017.01.012
2016-09-15
劉羽飛(1989— ),男,廣東韶關(guān)人,碩士,研究方向:自動(dòng)化裝置及檢測(cè)技術(shù),數(shù)字圖像處理。
TN 911.73
A
1671-7880(2017)01-0043-04