范 超,袁 瓊,孫 瑩,李曉峰
(1.北京電子科技學(xué)院,北京 100070;2.中安網(wǎng)脈(北京)技術(shù)股份有限公司,北京 100070)
隨著公共交換網(wǎng)絡(luò)(Public Switched Telephone Network,PSTN)網(wǎng)IP化和三網(wǎng)融合工程的推進(jìn),傳統(tǒng)的電話(huà)通信網(wǎng)已經(jīng)逐步由原有的電路交換向IP包交換網(wǎng)絡(luò)轉(zhuǎn)變,導(dǎo)致原有的一些通信保密技術(shù)逐漸無(wú)法適應(yīng)當(dāng)前的通信網(wǎng)絡(luò),尤其對(duì)電話(huà)加密技術(shù)提出了重大挑戰(zhàn)。
現(xiàn)有的電話(huà)加密設(shè)備,大多采用基帶編碼加密結(jié)合高頻調(diào)制方式傳輸加密信號(hào),即必須通過(guò)調(diào)制解調(diào)器建立載波通信后,方可傳輸加密信息。這種方式不符合IP包交換網(wǎng)絡(luò)設(shè)備的電氣特性和通信特性,因此通信失敗率極高。由于IP包交換網(wǎng)絡(luò)不再像電路交換那樣為通信雙方建立電路連接,而是采用解析封裝和轉(zhuǎn)發(fā)方式,因此信號(hào)的連續(xù)性被大大降低,且異構(gòu)網(wǎng)絡(luò)的數(shù)據(jù)封裝格式也各有所異,單一的載波信號(hào)很難通過(guò)異構(gòu)網(wǎng)絡(luò)正常通信,因此傳統(tǒng)的加密方式在異構(gòu)網(wǎng)絡(luò)中部署,必須在網(wǎng)絡(luò)邊界部署編碼轉(zhuǎn)換設(shè)備,這無(wú)疑增加了部署的難度和成本,使得電話(huà)加密通信更加困難。
針對(duì)上述問(wèn)題,國(guó)內(nèi)一直研究利用非加密語(yǔ)音業(yè)務(wù)通道傳輸信息的方法,其主要問(wèn)題是如何保證經(jīng)過(guò)聲碼器編解碼后能基本還原語(yǔ)音數(shù)據(jù)[1]。但是,其核心技術(shù)如具有加密功能的類(lèi)語(yǔ)音調(diào)制解調(diào)算法研究還不成熟,具有很大的研究空間。
本文通過(guò)研究聲碼器信道模型幅頻特性,分析抗聲碼器傳輸調(diào)制解調(diào)特性,提出基于正交頻分復(fù) 用(Orthogonal Frequency Division Multiplexing,OFDM)技術(shù)的類(lèi)語(yǔ)音調(diào)制解調(diào)方法。該方法將加密后的語(yǔ)音數(shù)據(jù)調(diào)制成具有語(yǔ)音特征的類(lèi)語(yǔ)音信號(hào),使其通過(guò)聲碼器壓縮/解壓處理過(guò)程,得到較小的誤碼率,并在接收端解調(diào)回加密數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)還原。
聲碼器的工作是基于人的聲音特征的,經(jīng)過(guò)加密處理后的數(shù)據(jù)具有隨機(jī)性,不滿(mǎn)足語(yǔ)音編解所需要的語(yǔ)音特征,易被聲碼器中的語(yǔ)音活動(dòng)檢測(cè)(Voice Activity Detection,VAD)機(jī)制認(rèn)為是噪音而被過(guò)濾掉[2]。所以加密處理后的具有隨機(jī)化的數(shù)據(jù)想要在語(yǔ)音信道中進(jìn)行傳輸,必須將其調(diào)制成具有語(yǔ)音功能的類(lèi)語(yǔ)音信號(hào),同時(shí),接收端要將接收到的數(shù)據(jù)解調(diào)回加密數(shù)據(jù),這就要求必須采用調(diào)制解調(diào)技術(shù)。
調(diào)制解調(diào)技術(shù)是將數(shù)字信號(hào)變換成另一種形式,以適應(yīng)信道傳輸。一般是改變正弦波信號(hào),用載波的典型特征(包括振幅、頻率和相位)承載數(shù)字?jǐn)?shù)據(jù)。語(yǔ)音編解碼的主要目的是減少表示語(yǔ)音所需的比特,同時(shí)保持合格的語(yǔ)音質(zhì)量[3]。這種方法在得到類(lèi)似輸入語(yǔ)音的合成語(yǔ)音的同時(shí),抽樣波形卻可能明顯不同,這使得調(diào)制解調(diào)器輸出的承載數(shù)據(jù)的特征發(fā)生畸變。因此,大部分調(diào)制解調(diào)器不能直接在使用語(yǔ)音編解碼的信道上工作,需要重新設(shè)計(jì)一種調(diào)制解調(diào)方案。
圖1是基于OFDM的類(lèi)語(yǔ)音調(diào)制解調(diào)傳輸原理框圖,輸入數(shù)據(jù)經(jīng)過(guò)基于OFDM的類(lèi)語(yǔ)音調(diào)制技術(shù)調(diào)制到類(lèi)語(yǔ)音載波上,形成可以在語(yǔ)音信道中傳輸?shù)念?lèi)語(yǔ)音信號(hào),然后通過(guò)聲碼器進(jìn)行傳輸;接收端將類(lèi)語(yǔ)音信號(hào)進(jìn)行解調(diào),還原得到原始數(shù)據(jù);由于聲碼器多為壓縮編解碼,類(lèi)語(yǔ)音信號(hào)通過(guò)聲碼器后會(huì)出現(xiàn)誤碼情況,故通過(guò)卷積糾錯(cuò)減少輸出數(shù)據(jù)的誤碼情況,實(shí)現(xiàn)更好的抗聲碼器壓縮傳輸效果。
圖1 基于OFDM的類(lèi)語(yǔ)音調(diào)制解調(diào)傳輸原理框圖
設(shè)計(jì)使用基于OFDM的類(lèi)語(yǔ)音調(diào)制解調(diào)技術(shù)進(jìn)行加密語(yǔ)音數(shù)據(jù)傳輸時(shí),需要考慮多種因素,首先是調(diào)制后的語(yǔ)音幀格式。因?yàn)榻?jīng)過(guò)調(diào)制后的語(yǔ)音信號(hào)經(jīng)過(guò)信道并在接收端進(jìn)行重新對(duì)齊和解調(diào),因此幀結(jié)構(gòu)的設(shè)計(jì)至關(guān)重要重要。其次,需要考慮單個(gè)子載波調(diào)制方式的選擇,OFDM對(duì)于各路子載波的調(diào)制參數(shù)主要包括幅度和相位,不同的參數(shù)調(diào)節(jié)會(huì)影響到生成信號(hào)的信號(hào)以及解調(diào)的準(zhǔn)確性。本文中采用了QPSK的方法進(jìn)行實(shí)驗(yàn),并對(duì)通過(guò)全球移動(dòng)通信系統(tǒng)(Global System For Mobile Communications,GSM)全速率聲碼器的信號(hào)進(jìn)行了解調(diào)、映射。最后是載波數(shù)量和位置的選擇,載波數(shù)量及位置會(huì)影響生成信號(hào)的頻率范圍,通過(guò)對(duì)GSM全速率聲碼器進(jìn)行頻譜特性分析得知,GSM全速率聲碼器可以等效為一個(gè)帶通濾波器,其通過(guò)的頻率范圍為0.1~1.5 kHz,超過(guò)該頻率范圍的信號(hào)經(jīng)過(guò)聲碼器后畸變嚴(yán)重。
由于GSM全速率聲碼器采用的編碼方式為RPE-LTP,其對(duì)語(yǔ)音信號(hào)的處理是8K采樣,分幀處理,每20 ms為一幀,因此,本文中生成的語(yǔ)音幀長(zhǎng)度也以20 ms為單位,子載波間隔為50 Hz。由于信號(hào)可以通過(guò)的頻率范圍為0.1~1.5 kHz,即子載波的最高頻率為1.5 kHz,并且每個(gè)正交相移鍵控(Quadrature Phase Shift Keying,QPSK)子載波能承載2 bit的信息,因此我們可以得到最高調(diào)制速率(即子載波頻率上限)在3 000 bit左右。子載波數(shù)量乘以子載波的間隔即為子載波的最高上限,因此,在最高調(diào)制速率3 000 bit下,子載波數(shù)量最多 為30。
上述分析只是限制了最高子載波數(shù)和最高調(diào)制速率的大致范圍,本文使用的子載波數(shù)量為24,這些子載波成為有效子載波,為了能使用快速傅里葉變換(Fast Fourier Transformation,F(xiàn)FT),對(duì)映射后的數(shù)據(jù),還需要通過(guò)補(bǔ)零的方式將其擴(kuò)展成2的次冪數(shù)量,補(bǔ)零的子載波稱(chēng)之為虛擬子載波[4]。具體的參數(shù)設(shè)計(jì)和載波分配方式如表1和圖2所示。
表1 參數(shù)選擇
圖2 QPSK方式下子載波選擇和分配
分配時(shí),根據(jù)快速傅里葉逆變換(Inverse Fast Fourier Transform,IFFT)的性質(zhì),為了得到實(shí)信號(hào)方便進(jìn)行傳輸,在完成比特的映射之后還需在后面填補(bǔ)其共軛對(duì)稱(chēng)部分,從而使經(jīng)過(guò)IFFT生成的信號(hào)為實(shí)信號(hào)。在實(shí)際傳輸語(yǔ)音幀是需要在數(shù)據(jù)前加入循環(huán)前綴和幀頭,循環(huán)前綴是將數(shù)據(jù)的最后一部分添加到數(shù)據(jù)前段,從而使接收端即使存在延時(shí)的情況下[5],仍然可以取得完整的周期數(shù)據(jù)。在有效數(shù)據(jù)前添加幀頭的目的是為了為符號(hào)同步留下足夠的空間。在8 kHz的采樣率下,20 ms長(zhǎng)的一幀數(shù)據(jù)點(diǎn)數(shù)為160,本文使用的幀結(jié)構(gòu)如圖3所示。
圖3 QPSK調(diào)制下的幀結(jié)構(gòu)
為了方便考慮,本次仿真實(shí)驗(yàn)省略了導(dǎo)頻的插入,此外,在輸入端使用隨機(jī)二進(jìn)制數(shù)(加密后的數(shù)據(jù)具有隨機(jī)性)作為傳輸數(shù)據(jù)。調(diào)制后得到的語(yǔ)音波形和頻譜圖如圖4和圖5所示。從圖5中可以看出,該信號(hào)的頻率范圍在0.1~1.5 kHz之間,基本滿(mǎn)足通過(guò)GSM聲碼器的頻譜要求。
圖4 類(lèi)語(yǔ)音調(diào)制得到的語(yǔ)音信號(hào)波形
圖5 類(lèi)語(yǔ)音調(diào)制得到的語(yǔ)音信號(hào)頻譜圖
將調(diào)制信號(hào)經(jīng)過(guò)聲碼器信道進(jìn)行傳輸,得到的接收端信號(hào)如圖6所示。
圖6 接收端語(yǔ)音信號(hào)波形
首先通過(guò)對(duì)調(diào)制語(yǔ)音信號(hào)和接收端語(yǔ)音信號(hào)的時(shí)域波形進(jìn)行直接觀(guān)察,可以發(fā)現(xiàn)總體上波形具有很高的相似性,可見(jiàn)信號(hào)在傳輸后保持了完整性,沒(méi)有被VAD機(jī)制所過(guò)濾,保證數(shù)據(jù)不被丟失。將得到的數(shù)據(jù)經(jīng)過(guò)判決映射表示成比特的形式得到比特流,與原始的隨機(jī)二進(jìn)制數(shù)進(jìn)行對(duì)比并計(jì)算得到誤碼率。經(jīng)計(jì)算,QPSK下的平均誤碼率為0.5%,之后采用卷積碼進(jìn)行糾錯(cuò),誤碼率為0。
通過(guò)不斷測(cè)試,得到不同調(diào)制速率下的誤碼率情況,統(tǒng)計(jì)得到圖7所示的誤碼率波形圖。
圖7 不同調(diào)制速率下誤碼率
從圖7可以看到,隨著調(diào)制速率的提高,誤碼率也在提高。調(diào)制速率低于2 700 bit時(shí),可以通過(guò)卷積碼進(jìn)行糾正,最終得到誤碼率為0。這由于調(diào)制速率的提高是通過(guò)增加有效子載波的個(gè)數(shù)來(lái)實(shí)現(xiàn),而子載波個(gè)數(shù)增加后,會(huì)占用更多的頻帶資源,當(dāng)最高頻率超出GSM聲碼器的最高頻率時(shí),誤碼率會(huì)急劇上升。因此不能同時(shí)得到高調(diào)制速率和低誤碼率。
實(shí)驗(yàn)結(jié)果表明,本文提出的類(lèi)語(yǔ)音調(diào)制解調(diào)算法具有很好的抗聲碼器壓縮性能,能保證調(diào)制語(yǔ)音信號(hào)通過(guò)聲碼器后保持較高的調(diào)制速率和低誤碼率。但是本實(shí)驗(yàn)是在理想環(huán)境下進(jìn)行的仿真,在實(shí)際信道中情況會(huì)更加復(fù)雜,有待進(jìn)一步研究。