摘要:數(shù)字信號的頻域變換一直是教學(xué)中的難點(diǎn),原因在于缺少必要的引入。本文給出了頻域變換的引入方法,從學(xué)生熟知的笛卡爾坐標(biāo)開始,經(jīng)過以圖示的方式給出的信號的合成與分解,逐步將學(xué)生引入到頻域變換的公式、定理和性質(zhì)上。實(shí)踐證明,該引入方法符合學(xué)生的認(rèn)知規(guī)律,顯著提高了教學(xué)效果。
關(guān)鍵詞:頻域變換;限失真信源編碼;信息論與編碼理論;信息安全
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:B
1引言
數(shù)字信號的頻域變換(或者叫做時(shí)頻變換),即時(shí)域數(shù)據(jù)與頻域數(shù)據(jù)之間的相互轉(zhuǎn)換,在信息安全專業(yè)的“信息論與編碼”,計(jì)算機(jī)專業(yè)的“數(shù)字信號處理”、“數(shù)字圖像處理”等課程中都涉及到了。這個概念是信息處理理論的基礎(chǔ)概念,透徹理解該概念對于這些專業(yè)的學(xué)生,尤其是從事音頻、視頻、圖像等多媒體數(shù)據(jù)處理的研究生來講至關(guān)重要。
然而從作者求學(xué)的切身經(jīng)歷以及多年的教學(xué)經(jīng)驗(yàn),我們感到“頻域變換”這個概念很難理解,學(xué)生掌握起來有一定困難。只有找到一個合適的切入點(diǎn),將此概念與學(xué)生熟悉的知識聯(lián)系起來,才能深入淺出,讓學(xué)生輕松掌握。
2現(xiàn)有方法及其問題
現(xiàn)有講解方法在介紹了時(shí)域離散信號、時(shí)域離散系統(tǒng)等概念之后,就開始講頻域變換。頻域變換有很多種,一般從Z變換或者離散付里葉變換(Discrete Fourier Transform,DFT)講起,講解方法如下(以DFT為例):
設(shè)x(n)是一個長度為N的有限長序列,則定義x(n)的N點(diǎn)離散付里葉變換為
1) 理論性過強(qiáng)。無論是講DFT的定義,還是DFT的性質(zhì)、采樣等內(nèi)容,基本上是一個公式接著一個公式,而且公式還都比較復(fù)雜,缺少對公式必要的解釋。這使得很多學(xué)生失去了學(xué)習(xí)興趣,“看不懂”是學(xué)生的普遍反映。
2) 缺少必要的引入。一開始就是DFT的定義,那么這個定義是怎么來的呢?為什么會出現(xiàn)這樣一個定義呢?公式中各個變量的作用是什么?有了這個公式有什么好處呢?它都在哪些地方發(fā)揮作用呢?等等一系列的問題都沒有答案。而實(shí)際上,知道一個概念的來龍去脈對于理解該概念是大有好處的。
3頻域變換的引入
由于現(xiàn)有的頻域變換講解方法存在一定的問題,因此有必要研究新的講解方法,尤其是引入方法。從學(xué)生熟知的內(nèi)容開始,先讓學(xué)生有感性認(rèn)識,然后逐步過渡到公式、定理和性質(zhì)上,這樣才是真正的深入淺出。作者在多年的教學(xué)過程中,總結(jié)了一套頻域變換的引入方法,其過程是“笛卡兒坐標(biāo)#61664;信號的合成與分解#61664;各種常用變換的公式、定理和性質(zhì)”。
3.1笛卡爾坐標(biāo)
笛卡兒坐標(biāo),這是一個在初中就學(xué)過的概念,任何一個學(xué)生對它都不會感到陌生。在這個簡單概念中就蘊(yùn)含了頻域變換的基本特點(diǎn)。如圖1所示,講解時(shí)按如下步驟進(jìn)行:
1) 坐標(biāo)中的那個小黑點(diǎn)就是空域數(shù)據(jù),之所以稱為空域數(shù)據(jù),是因?yàn)樗强臻g中的一個點(diǎn)。在信號處理領(lǐng)域時(shí)間和空間不嚴(yán)格區(qū)分,因此空域(空間域)數(shù)據(jù)和時(shí)域(時(shí)間域)數(shù)據(jù)兩個名詞經(jīng)?;煊谩?/p>
2) x軸和y軸說白了就是空間中的兩個向量,在頻域變換中把它們叫做“基”,直觀上這兩個基互相垂直,頻域變換中“垂直”叫做正交,因此x軸和y軸就組成了一組正交基。
3) 空間中的小黑點(diǎn)在x軸上的坐標(biāo)為1,在y軸上的坐標(biāo)為2,因此它的坐標(biāo)為(1,2),這段話用頻域變換的語言描述就是空域數(shù)據(jù)在基x上的系數(shù)為1,在基y上的系數(shù)為2,因此(1,2)就是頻域數(shù)據(jù)。
圖1笛卡爾坐標(biāo)中的時(shí)頻變換
這樣,通過笛卡爾坐標(biāo)這樣一個簡單的例子,使學(xué)生對頻域變換中的空域(時(shí)域)、頻域、基、正交、系數(shù)等概念有了初步的感性認(rèn)識。
3.2信號的合成與分解
雖然學(xué)生已經(jīng)有了對頻域變換的初步認(rèn)識,但這種認(rèn)識建立在笛卡爾坐標(biāo)之上,離信號處理領(lǐng)域有一定距離,如果此時(shí)直接開始講各種常用變換的公式、定理和性質(zhì),學(xué)生難以將兩者直接聯(lián)系起來,會破壞學(xué)生剛剛建立起來的概念和興趣,因此我們以圖示的方式描述信號的合成與分解,作為頻域變換的第二個引入。如圖2所示,講解時(shí)按如下步驟進(jìn)行:
1)(a)~(d)表示的是四種信號(時(shí)域數(shù)據(jù)),橫軸表示的是時(shí)間,縱軸表示的是信號的幅度(或者叫做強(qiáng)度)。
2)(a)表示的是一個幅度不隨時(shí)間發(fā)生變化的信號,它的強(qiáng)度是5,像這樣的幅度不隨時(shí)間發(fā)生變化的信號叫做直流信號。
3)(b)表示的是信號5sin(x),(c)表示的信號是0.5sin(6x),這兩個信號相比較來說:
#61548;(b)變化的慢,是低頻信號;(c)變化的快,是高頻信號。
#61548;(b)的幅度大(為5),表示該信號能量大;(c)的幅度小(為0.5),表示該信號能量小。
4)(d)是將(a)、(b)、(c)三個信號相加之后的信號,叫做(a)、(b)、(c)的合成信號,可以看到該信號的大體趨勢與(b)信號相同,但是在細(xì)節(jié)上又不是很平滑,這是由(c)信號造成的,因此我們說低頻分量表示的是信號的主體,而高頻分量表示的是信號的細(xì)節(jié)。
5) 信號的合成講完了,反過來考慮信號的分解,(d)信號可以被分解為5、5sin(x)、0.5sin(6x)三個信號,即它可以表示為5+5sin(x)+0.5sin(6x),這其實(shí)就是一個頻域變換公式。其中的sin(x)和sin(6x)是一組正交基,之所以兩者正交,是因?yàn)閮烧叩膬?nèi)積為0,內(nèi)積為0在笛卡爾坐標(biāo)中的直觀幾何意義就是互相垂直。5sin(x)中的5是基sin(x)的系數(shù),0.5sin(6x)中的0.5是基sin(6x)的系數(shù)。因此如(e)所示,(d)信號對應(yīng)的頻域數(shù)據(jù)就是(5,5,0.5),其中第一個5是直流分量。
6) 總結(jié)上述過程可以看到,所謂的頻域變換,需要先確定一組正交基,然后將信號用這組正交基表示出來,直流分量和基的系數(shù)放在一起就是頻域數(shù)據(jù)。選擇的正交基不同,就產(chǎn)生了不同的頻域變換。通常,由時(shí)域到頻域的變換叫做頻域變換,由頻域到時(shí)域的變換叫做逆頻域變換。
講到這里,學(xué)生已經(jīng)對信號的頻域變換有了一個定性的基本認(rèn)識,進(jìn)一步了解了強(qiáng)度、直流、交流、高頻、低頻、能量、正交、變換、逆變換等概念,在此基礎(chǔ)上就可以定量地講解公式、定理和性質(zhì)了。
4在限失真信源編碼中的應(yīng)用
限失真信源編碼是“信息論和編碼理論”中一個非常重要的內(nèi)容,又叫做有損壓縮,它指的是通過對信號進(jìn)行編碼來壓縮信號的數(shù)據(jù)量,這種壓縮會引起信號一定程度的失真,但是這種失真被控制在一定的范圍之內(nèi)。限失真信源編碼應(yīng)用范圍非常廣泛,尤其在多媒體編碼領(lǐng)域,像常見的JPEG、MPEG等都屬于限失真信源編碼。有了前面的兩個引入,再講限失真信源編碼原理就比較容易了,如圖3所示。
圖3限失真信源編碼
接著“信號的合成與分解”中的信號(d),該信號經(jīng)過頻域變換之后的數(shù)據(jù)為(5,5,0.5),其中的0.5是高頻分量的系數(shù),前面已經(jīng)講過,高頻分量僅影響信號的細(xì)節(jié),因此可以將高頻分量去掉而不影響信號的大體趨勢,對應(yīng)在這三個系數(shù)上就是保留前兩個系數(shù),丟棄高頻系數(shù)0.5,這樣(d)這樣一個比較復(fù)雜的信號就被編碼成了兩個實(shí)數(shù)(5,5)。
由(5,5)經(jīng)過逆變換得到被還原后的信號,可以看到被還原后的信號和編碼之前的(d)信號大體趨勢相同,但是被還原后的信號舍棄了細(xì)節(jié)。兩者不同,說明編碼過程有失真,但這種失真僅表現(xiàn)在細(xì)節(jié)上。
原理講完之后,我們還講了該原理在JPEG中的應(yīng)用。數(shù)碼相機(jī)拍攝的照片一般都是“.jpg”格式,該后綴表示采用了JPEG壓縮標(biāo)準(zhǔn)來壓縮照片的數(shù)據(jù)量。JPEG的基本原理與圖3所示的過程基本相同,它采用的頻域變換為離散余弦變換,根據(jù)人眼視覺特點(diǎn)舍棄頻域系數(shù)中人眼感覺不到的系數(shù),被保留下來的系數(shù)保存成“.jpg”文件,當(dāng)我們看照片的時(shí)候,照片瀏覽器對“.jpg”文件進(jìn)行譯碼,顯示被還原后的信號。不過此時(shí)的信號與原始信號相比,質(zhì)量已經(jīng)降低了,不過人眼感覺不到這種差別。
5結(jié)束語
本文中提到的頻域變換的引入是作者結(jié)合自己的科研經(jīng)驗(yàn),在教學(xué)過程中不斷總結(jié)最終設(shè)計(jì)出來的。該引入一經(jīng)在課堂上講解,立刻引起了學(xué)生的興趣,大家進(jìn)行了熱烈的討論,并促使學(xué)生主動鉆研課程內(nèi)容,收到了很好的教學(xué)效果。
參考文獻(xiàn)
[1] 姜楠. “信息論”課程本科教學(xué)探索與實(shí)踐[J]. 計(jì)算機(jī)教育,2007,(24):52-54.
[2] 姜楠. 中美“信息論”課程教學(xué)的比較和啟示[J]. 計(jì)算機(jī)教育,2008,(13):120-122,117.