丁光亮, 楚紀正, 王 琦
(①北京化工大學 信息科學與技術學院,北京100029;②北京瑞光極遠數(shù)碼科技有限公司,北京100085)
隨著數(shù)字化進程的不斷推進,PCM設備在多路話音通信中得到了越來越廣泛的應用,同時對信號穩(wěn)定性和清晰度有了更高的要求。在通話過程中,由于模擬語音信號音量大小不同,會導致數(shù)字信號的電平大小不同。如果信號電平值計算不準確,會導致其與門限電平的差值誤差較大,從而降低系統(tǒng)的整體指標,既體現(xiàn)不出數(shù)字設備動態(tài)大、失真小的特點,還可能造成嚴重的削波失真,降低通話質量。因此,音頻電平的計算對通信設備的運行維護有著非常重要的意義。
傳統(tǒng)的電平測量都采用電壓表測量電壓電平,但是在實際操作中,誤差較大且實現(xiàn)起來較為繁瑣,筆者在前人研究的基礎上,采用由即時功率求功率電平的算法,具有操作簡單、準確性高、實時性強的特點。這里介紹了模擬與數(shù)字設備連接時音頻電平的基本概念,提出了數(shù)字信號電平算法,即適用于純音頻系統(tǒng),也適用于視頻系統(tǒng)中的音頻部分。
電平是電路中兩點或幾點在相同阻抗下電量的相對比值,反映了電路中的功率、電壓、電流的相互關系。對于音樂、語音這種非正弦信號,可以用音頻電平來描述它的大小。音頻電平有功率電平和電壓電平之分[1]。以600 Ω電阻上消耗 1 mW的功率作為基準功率,任意功率與之相比求常用對數(shù)乘以10稱為絕對功率電平,單位為dBm,其數(shù)學表達式如公式(1)所示:
式中 LP代表絕對功率電平(單位:dBm),Px為任意功率,P0為零電平功率。
電路中某測試點電壓和標準比較電壓0.775 V之比取常用對數(shù)的20倍稱為電壓電平,單位為dBu,其數(shù)學表達式如公式(2)所示:
式中LU代表電壓電平值(單位:dBu),Ux為任意功率。
功率電平和電壓電平之間有著非常密切的關系,從實質上講,它們是一致的,但是它們并不是完全相等的,功率電平和電壓電平之間可用公式(3)來換算:
由上式可見,當Rx=600 Ω時,電阻Rx的絕對功率電平等于它的絕對電壓電平,而當Rx≠600 Ω時,電阻Rx的絕對功率電平不等于它的絕對電壓電平,而相差10lg(600/Rx)。
用數(shù)字通信系統(tǒng)傳輸語音信號,首先要在發(fā)送端把語音信號數(shù)字化,即模/數(shù)變換;再用數(shù)字通信的方式進行傳輸;最后在接收端把數(shù)字信號還原為模擬信號[2]。模擬信號數(shù)字化有多種方法,最常用的是符合G.703標準的脈沖編碼調制(PCM)[3]。這種方法通過取樣、量化、編碼三個步驟將模擬信號轉變?yōu)閿?shù)字信號,其原理如圖1所示。
圖1 PCM通信系統(tǒng)原理圖
抽樣定理是任何模擬信號數(shù)字化的理論基礎,它也是時分多路復用及數(shù)字信號處理技術的理論依據(jù)之一。抽樣是指把幅度隨時間連續(xù)變化的模擬信號按一定的時間間隔來切取,得到是時間上不連續(xù)的連續(xù)脈沖列,每個脈沖列均表示各時刻的幅值。
量化是把取樣得到的幅度連續(xù)變化的脈沖信號,用設定一定間隔的有限個不連續(xù)電平來表示。通常是將抽樣值壓縮后再進行均勻量化,ITU-T推薦兩種壓縮方式,即A壓擴律和μ壓擴律。對于語音信號,中國采用2.048 MHz的取樣時鐘,以8 kHz的速率進行8位取樣,取樣數(shù)據(jù)按A律壓縮13折線編碼,偶數(shù)位交替反轉[4]。
PCM編碼是指用二進制代碼來表示有限個量化電平的過程。為了便于編碼,常采用分段折線來近似表示壓擴特性曲線,中國和歐洲采A=87.6的A律13折線編碼。A律13折線編碼給出相應的8位二進制折疊碼,其中第一位極性碼外,其它7位為幅度碼。這8位碼的排列如表1所示。
表1 8位碼定義表
由于PCM的采樣頻率是8 000 HZ,如果每幀的語音信號的電平都計算的話會產(chǎn)生較大的誤差。通過有效值求即時功率,即計算在極短的時間內通過所有幀的平均功率。由于采樣時間極短,人耳感覺不到時間差異,可視為即時功率。如將采樣時間t暫定為20 ms,采樣點數(shù)N=0.02×8 000=160。在計算出采樣時間間隔內信號的平均功率后,根據(jù)功率電平的定義可求出語音信號的電平值。其算法流程圖如圖2所示。
圖2 算法流程
算法描述如下:
① 初始化,將采樣點數(shù)N置0。即將緩沖區(qū)內數(shù)據(jù)清0,以確保采樣時間內采樣到160幀數(shù)字信號;
②采樣。順序地對數(shù)據(jù)幀進行采樣,當采樣點數(shù)達到160以后開始計算。打開中斷后,信號以幀為單位進入中斷,采樣數(shù)據(jù)存入緩沖區(qū),當一幀信號通過后,立即關閉中斷,采樣點數(shù)N加1;
③解碼。由于假定的采樣點數(shù)N為160,接下來要判斷N是否等于 160。如果 N <160,重復步驟②,直到 N達到160為止。當采樣點數(shù)N達到160以后,DSP芯片上的解碼器對其進行解碼,把收到的PCM信號碼字還原成量化電平。由公式(4)可得到每幀信號的量化電平值:
式中XBi表示段落碼對應的段落起始電平,△i表示該段落內的量化間隔。
④計算有效功率。為了減小對語音信號進行分幀計算產(chǎn)生的誤差,筆者采用RMS算法[5]來計算采樣時間內信號的有效功率。RMS算法是計算AC波形功率一種最普遍有效的方法,其公式如下所示:
式中P表示平均功率,Xi表示每幀信號的量化電平值,N表示采樣時間t內傳送的幀數(shù);
⑤計算功率電平。在求得音頻信號的平均功率之后,代入公式(1)即可求得音頻信號的即時電平值。
當語音信號經(jīng)過PCM編碼完成模/數(shù)轉換后在數(shù)字系統(tǒng)中傳輸,由于噪聲的存在,往往需要判斷聽筒收到的聲音是否為語音信號。如果不是語音信號時,語音信道關閉,使噪聲信號不能到達語音終端。當語音信號到來時,語音信道打開,這時雖然噪聲和語音一起送到語音終端,但是由于聲音屏蔽效應,噪聲可以忽略。由于聲音的大小在數(shù)字階段是用電平描述的,需要計算語音信號的電平值并和門限電平值作比較,在門限電平值之下的信號認為是噪聲,關閉語音信道;在門限電平值之上的信號則認為是語音,打開語音信道。
在該算法研究和仿真過程中采用了專用數(shù)字信號處理芯片TMS320C5402作為處理器,該芯片具有處理速度快、靈活、精確、抗干擾能力強、體積小及可靠性高等優(yōu)點,滿足了對信號快速、精確、實時處理及控制的要求,在語音處理有巨大的優(yōu)越性。筆者采用基于TMS320C5402芯片的DSP仿真器以及和IDM-120 PCM設備組成一套音頻信號實時采集與處理系統(tǒng),并已作為相關音頻算法的驗證平臺。
圖3 系統(tǒng)方案框圖
系統(tǒng)方案框圖如圖3所示。語音信號在IDM-120設備內進行高速高精度的PCM編碼后得到一串數(shù)字信號,分幀輸入到TMS320C5402芯片的MCB多功能緩沖口中并進行采樣,當采樣點數(shù)達到160以后,在TMS320C5402芯片的內部進行運算,計算出該信號的電平值。如果電平值大于門限電平,則該芯片的I/O口打開;如果小于門限電平值,則I/O口關閉。經(jīng)過處理的數(shù)字信號,再輸入到ADM-120設備中,還原成模擬語音信號。
在信號電平超過門限電平值或門限電平值之下時,需要一定的時間延遲。當語音信號在超過門限電平值后到語音信道打開會有一定的延時。這一時間太長將造成語音的起始音素被切除,是不允許的。但這一時間又不能太短,太短的話任何幅度超過噪聲抑制閾值的突發(fā)的短暫干擾都會立刻打開語音通道并將這干擾送到語音終端,破壞靜音效果。為盡可能地吸收這類干擾又不至于造成“頭切”[6],根據(jù)語音聲學特征的有關統(tǒng)計資料與經(jīng)驗數(shù)值,這一時間可在0.5~4 ms之間選擇。
當語音信道被打開并傳送語音時,從語音信號電平值回落至門限電平值之下到語音信道關閉同樣會有時間延遲。由于語音信號波形的動態(tài)范圍很大,講話時又隨著語氣的變化而起伏停頓,因此后延時時間太短會造成語音的斷續(xù),影響語音傳送質量。后延時時間太長,則造成語音停頓時噪聲拖尾,同樣影響語音質量。為兼顧這兩方面,這一時間的量值范圍約為0.5~2 s左右。
經(jīng)過仿真后可以得出:當語音信號通過PCM設備之后,當語音音量達到一定程度時,語音通道打開,在對端還原成模擬信號,同時人耳感覺不到時間差異的存在,體現(xiàn)了算法即時性的特點;當音量較小的語音信號通過時,語音通道關閉,對端無信號,體現(xiàn)了算法準確性的特點。
筆者提出的語音信號實時電平有效值算法,對語音信號電平進行了準確的計算,并建立仿真系統(tǒng)進行仿真。該算法具有失真小,清晰度高,實時性強的優(yōu)點,符合SJ/T11180-1998標準的基本要求,是一種有效可行的算法,具有很強的實用價值。
[1] 李正本.模擬與數(shù)字設備混用系統(tǒng)中的音頻電平設置[J].演藝設備與科技,2006,68(01):18-21.
[2] 陸珉,季曉勇.多媒體通訊系統(tǒng)中的靜音檢測[J].通信技術,2001(07):29-30.
[3] 柴曉東,劉紅.利用isp 器件實現(xiàn)可編程PCM采編器[J].通信技術,2001(06):103-104.
[4] 李明,鄧家梅,曹家麟.一種新型的信道糾錯編碼——之型碼[J].2001(03):17-18.
[5] 何志遠,李顯文. G_169自動電平控制裝置標準及其實現(xiàn)[J].電聲技術,2003,58(03): 9-14.
[6] 陳演平.語音信號的數(shù)字化噪聲抑制技術[J].電子應用技術, 2002,48(10):76-79.