吳藝彬 邵高平 汪 洋
(中國人民解放軍戰(zhàn)略支援部隊信息工程大學(xué),河南鄭州 450001)
隨著衛(wèi)星技術(shù)和星上有效載荷技術(shù)的發(fā)展,衛(wèi)星所需傳輸?shù)臄?shù)據(jù)量急劇增加,使得地面接收系統(tǒng)向高速寬帶數(shù)字處理發(fā)展。但是受常用數(shù)字處理器(如FPGA)穩(wěn)定工作時鐘頻率的限制[1],傳統(tǒng)的串行處理技術(shù)顯然無法滿足高達(dá)Gsps采樣率數(shù)據(jù)流的實時處理,因此要想突破處理器時鐘頻率的限制,提高系統(tǒng)通信速率,就必須采用并行處理技術(shù)。
一般來說,常用的并行解調(diào)架構(gòu)可分為時域并行結(jié)構(gòu)、頻域并行結(jié)構(gòu)。由于頻域并行結(jié)構(gòu),具有運算量低、實現(xiàn)簡單的特點,更適用于高速通信,因此高速環(huán)境下一般選用該結(jié)構(gòu)[2]。但是伴隨系統(tǒng)調(diào)制符號速率的提升和并行路數(shù)的增加,傳統(tǒng)的頻域并行架構(gòu)已經(jīng)無法滿足實時通信的需求,需要對系統(tǒng)算法和系統(tǒng)架構(gòu)做改進。文獻[3]參照Gardner算法提出了一種改進的插值結(jié)構(gòu),不僅提高了精度,還降低了實現(xiàn)難度。目前算法改進研究較多且較為成熟,優(yōu)化空間較有限。文獻[4- 6]從系統(tǒng)架構(gòu)入手,通過采用免混頻、并行濾波器的簡化等方式,有效降低了系統(tǒng)的實現(xiàn)復(fù)雜度和硬件資源使用。該種方法的優(yōu)點在于通過使用快捷算法,在不改變系統(tǒng)性能的前提下簡化系統(tǒng)實現(xiàn),但是未能考慮到模塊間的算法特點,充分復(fù)用模塊間的公共資源。因此文章圍繞系統(tǒng)模塊間資源的復(fù)用問題,對該架構(gòu)進行了進一步改進,改進后的并行架構(gòu)計算量更低、適用性更強。
為避免NCO(數(shù)字控制振蕩器)模塊的不穩(wěn)定性,降低架構(gòu)實現(xiàn)的復(fù)雜度,文獻[4]將免混頻結(jié)構(gòu)引入到傳統(tǒng)的并行解調(diào)架構(gòu)中去,并對匹配濾波器模塊進行了改進。改進后的架構(gòu)可表示為如圖1所示。
設(shè)I(t)、Q(t)分別是發(fā)送信號符號的I、Q分量,fc表示載波頻率,fs表示采樣率,則接收到的中頻信號為:
s(t)=I(t)cos(2πfct)-Q(t)sin(2πfct)
(1)
取4fc=fs,采樣后信號表示為:
s(n)=I(n)cos(2πfcn/fs)-Q(n)sin(2πfcn/fs)=
-I(2),Q(3),I(4),-Q(5),...]
(2)
由式(2)可以看出,只需要對采樣后中頻信號進行分路、插零、取反,便可以得到I、Q兩路的基帶信號:I(n)=[I(0),0,I(2),0,…],Q(n)=[0,Q(1),0,Q(3),…]。而后將兩路基帶信號分別通過低通濾波器便可以得I、Q兩路的基帶信號。將這種不需要進行數(shù)字下變頻的特殊結(jié)構(gòu)稱為免混頻結(jié)構(gòu)[5]。
(3)
(4)
圖1 并行解調(diào)架構(gòu)系統(tǒng)流程圖Fig.1 The flow chart of parallel demodulation architecture system
圖2 頻域匹配濾波簡化實現(xiàn)結(jié)構(gòu)Fig.2 The simplify structure of frequency domain matched filters
通過分析可知,上述簡化結(jié)構(gòu)的優(yōu)點在于實現(xiàn)簡單,資源消耗少,但是該結(jié)構(gòu)也有明顯的不足,當(dāng)濾波器系數(shù)較短時,濾波器需要補零的位數(shù)也隨之增加,易引起資源利用率不高[8]。而高速通信系統(tǒng)中,過采樣倍數(shù)一般較低,濾波器系數(shù)也隨之較短,采用并行解調(diào)架構(gòu)并不具有優(yōu)勢,因此,在實際應(yīng)用中還需要對該架構(gòu)進行改進。
為解決系統(tǒng)資源利用率不高、避免反饋回路等問題,本文擬從系統(tǒng)結(jié)構(gòu)入手,一方面降低系統(tǒng)復(fù)雜度,另一方面減少資源使用。而匹配濾波器作為運算量最大的模塊,能否將其通過復(fù)用以達(dá)到簡化成為了本文研究的重點。
通過對圖1分析可以知,系統(tǒng)是先完成匹配濾波后再進行同步估計的,可以說不論是在時間上還是資源使用上這兩個模塊都是完全獨立的。同時匹配濾波和定時同步模塊都是充分利用頻域算法的優(yōu)勢,基于頻域?qū)崿F(xiàn)的,實現(xiàn)過程中都需要用到DFT/IDFT算法,因此在運算過程中如果能夠充分利用兩個模塊間公共的資源,便可以在一定程度上減小不必要的計算。基于該思路,本文提出了一種免混頻條件下定時同步與匹配濾波器聯(lián)合實現(xiàn)的并行解調(diào)架構(gòu),其解調(diào)流程如圖3所示。
由圖3可得,系統(tǒng)將免混頻信號部分調(diào)整后,采用重疊保留法的方式,分段將數(shù)據(jù)送進DFT模塊中,然后利用信號的時域卷積特性分別完成I、Q兩路的濾波和定時同步工作,最后從恢復(fù)時鐘的信號中篩選出最佳采樣點進行離散傅里葉反變換(IDFT),并將結(jié)果輸出到后續(xù)的模塊中去。該系統(tǒng)利用免混頻信號的特殊結(jié)構(gòu),不僅實現(xiàn)了DFT和定時同步模塊間資源的復(fù)用,最后還可以通過篩選最佳采樣點方式,有效的降低了輸出數(shù)據(jù)速率,為系統(tǒng)硬件資源的節(jié)約、復(fù)雜度的降低、計算量的減少提供了有效途徑。
匹配濾波器與定時同步模塊聯(lián)合實現(xiàn)的關(guān)鍵在于實現(xiàn)模塊間資源的復(fù)用,也就是將匹配濾波器模塊的運算結(jié)果復(fù)用到定時同步模塊中去。基于該思路,本文主要對匹配濾波器模塊和同步算法模塊進行了改進,以確保通過一次FFT便可實現(xiàn)信號的濾波和同步處理。
3.2.1 DFT模塊的改進
在傳統(tǒng)架構(gòu)中,I、Q兩路是分開進行處理的,需要兩個DFT/IDFT模塊和兩個濾波器模塊,消耗資源較多。在免混頻架構(gòu)中,I、Q兩路是混合交替的,若直接做DFT變換,其結(jié)果顯然無法直接被定時同步模塊復(fù)用。若對其進行分路、插零、取反后,再做DFT變換,雖然結(jié)果可復(fù)用,但卻帶來了運算量和資源上的浪費。因此為減少DFT/IDFT模塊和濾波器模塊的多次使用,實現(xiàn)DFT模塊和定時同步模塊的復(fù)用,文章利用I、Q兩路混合交替的特點,對DFT模塊結(jié)構(gòu)進行調(diào)整,使得通過一次變換便能得到I、Q兩路分別的頻域值,具體實現(xiàn)如下。
圖3 聯(lián)合結(jié)構(gòu)流程圖Fig.3 The flow char of joint structure
假設(shè)輸入信號為并行的64點免混頻信號,采用計算量最小的基- 4 FFT/IFFT算法作為基本架構(gòu)[9],64點DFT可表示為:
(5)
記X(k)=X(k2,k1,k0),x(n)=x(n0,n1,n2),經(jīng)分解,式(5)可以表示為:
(6)
其算法實現(xiàn)流程如圖4所示。該流程的最小運算單元是4點FFT運算單元,第一級由16組相互獨立的最小運算單元組成,第二級由4組4并行的最小運算單元組成,第三級由1組16并行的最小運算單元組成。通過觀察可知,在到達(dá)第三級之前,基數(shù)點(I路)和偶數(shù)點(Q路)的處理是相互獨立的,也就是說只需要改變第二級與第三級間的級間旋轉(zhuǎn)因子,同時讓偶數(shù)下標(biāo)的數(shù)進行相加減,讓奇數(shù)下標(biāo)的數(shù)進行相加減,便可得到序列I(n)=[I(0),I(2),I(4)…]、Q(n)=[Q(1),Q(3),Q(5)…]的FFT結(jié)果,最后根據(jù)離散信號整數(shù)倍內(nèi)插的性質(zhì),可得過低通濾波器后序列[I(0),0,I(2),0,…],[0,Q(1),0,Q(3),…]的FFT結(jié)果。改進后實現(xiàn)流程如圖5所示。和DFT模塊相似,IDFT模塊只需要改變級間旋轉(zhuǎn)因子,并將最小運算單元換成4點IFFT運算單元即可。
3.2.2 同步算法的選擇及實現(xiàn)
當(dāng)前常用的頻域同步算法主要有SLN(平方律非線性)、AVN(絕對值非線性)、FLN(四次方律非線性)和LONG(對數(shù)非線性)等算法,文獻[10]指出,在加性高斯白噪聲信道下,四種算法均能夠?qū)崿F(xiàn)大頻偏條件下的定時參數(shù)估計,其中SLN算法對滾降和信號調(diào)制方式相對不敏感,性能相對較穩(wěn)定。因此基于上述的分析比較,結(jié)合文章的高速解調(diào)架構(gòu)特點,本文擬采用SLN算法作為定時同步估計算法。
圖4 64點基- 4FFT算法流圖Fig.4 The flow char of 64-point base- 4 FFT algorithm
通過近似和簡化,最終SLN算法中的時延τ可以表示為:
(7)
其中s(n)為輸入的免混頻信號,T為符號速率,P為一個符號內(nèi)的采樣點數(shù),即P=Ts/T。
圖5 改進后64點基- 4FFT算法流圖Fig.5 The flow char of improved 64-point base- 4 FFT algorithm
為滿足同步模塊對頻域濾波結(jié)果的復(fù)用,需要從頻域的角度對式(7)進行理解:|s(i)|2序列在最佳采樣點處含有時延信息,時域的傳輸時延相當(dāng)于頻域頻譜分量的相位旋轉(zhuǎn),因此可以通過將|s(i)|2進行離散傅里葉變化后求得傳輸時延τ。
(8)
I(n)=[I(0),0,I(2),0,…]
(9)
Q(n)=[0,Q(1),0,Q(3),…]
(10)
由式(8)、(9)、(10)易得:
|s(n)|2=|I(n)|2+|Q(n)|2
(11)
因此可以將序列|s(n)|2頻域值求解的問題轉(zhuǎn)化為|I(n)|2、|Q(n)|2頻域值求解的問題。利用DFT的頻域循環(huán)卷積特性和線性性質(zhì)可得:
(12)
(13)
基于式(13)的思路,式(7)的物理意義最終可理解為,求解序列|I(n)|2+|Q(n)|2以LP為長度的短時傅里葉變換后,第L條譜線的相位值,也可以看作對序列|I(n)|2+|Q(n)|2做P點短時傅里葉變換后,對第1條譜線做L個周期的平均統(tǒng)計。而DFT[I(n)] 和DFT[Q(n)]均已求得,可以直接將運算結(jié)果運用到定時同步模塊中去。而后將求出的時延通過相位旋轉(zhuǎn)因子的形式,在頻域完成輸入序列的時延校正,最后再將恢復(fù)結(jié)果通過IDFT反變換,輸出到下一步的處理流程中。
由此分析可得SLN算法的頻域并行實現(xiàn)結(jié)構(gòu)如圖6所示。對匹配濾波器輸出的I/Q各32路的信號進行循環(huán)卷積計算,求得第L條譜線的值,而后對所求的相位角進行算數(shù)平均便得到定時誤差的估計值。和傳統(tǒng)的時域并行實現(xiàn)結(jié)構(gòu)相比(如圖7所示),完成一次32路并行的數(shù)據(jù)的處理,頻域并行算法大概需要1次乘法、1次加法以及1次相位求解的時鐘周期,而時域并行的算法大概需要1次乘法、4次加法以及1次相位求解的時鐘周期。由此可得,采用頻域并行結(jié)構(gòu)并不會帶來系統(tǒng)上的時延。
圖6 SLN算法頻域并行實現(xiàn)結(jié)構(gòu)Fig.6 SLN algorithm frequency domain parallel implementation structure
圖7 SLN算法時域并行實現(xiàn)結(jié)構(gòu)Fig.7 SLN algorithm time domain parallel implementation structure
利用MATLAB軟件,對估計量的均方誤差和信號解調(diào)前后的星座圖進行仿真分析。仿真中采用QPSK信號,信號符號速率為600 Msps,采樣率為2.4 GHz,中頻信號頻率為600 MHz,每個符號4個采樣點,發(fā)送端和接收端采用的滾降系數(shù)均為0.35的33階根升余弦濾波器。
仿真中估計性能由傳輸時延τ的均方誤差和時延恢復(fù)前后的信號星座圖來描述。假設(shè)信號的傳輸時延分別為T/8和3T/8,觀察長度為64個符號時,在不同信噪比下聯(lián)合算法的估計性能和修改后克拉美羅界(modified Cramer-Rao bound,MCRB)對比如圖8所示。
圖8 不同信噪比條件下的均方誤差Fig.8 Mean square error at different SNR
圖8是在不同信噪比條件下,不同定時估計的均方誤差曲線與修正克拉美羅界間的比較。由圖8可以看出,在加性高斯白噪聲信道下,大時延和小時延的均方誤差線基本重合,聯(lián)合較為接近克拉美羅界,說明該算法對大時延和小時延都具有較好的估計性能。
圖9顯示了在0~14 dB的信噪環(huán)境中文中算法與Gardner算法的誤比特性能,由圖可以看出,在信噪比為6~14 dB時Gardner算法具有較低的誤碼率曲線,其中在誤比特率為10-4時,文中算法較Gardner算法有約0.5 dB的性能損失。在實際應(yīng)用中,雖然Gardner算法精度高,但是估計時延長,不適合實時信號處理,而文中算法無反饋回路,即便精度差點也是可以接受的。
圖9 Gardner算法與SLN算法誤碼率仿真Fig.9 The BER simulation of Gardner algorithm and SLN algorithm
圖10(a)~(d)給出了時延誤差為T/8和3T/8、信噪比為25 dB時接收信號時延恢復(fù)前后的星座圖。圖10(e)~(f)給出了時延誤差為3T/8、信噪比為15 dB時接收信號時延恢復(fù)前后的星座圖。
從圖10(a)~(d)可以知,在信噪比為25 dB的大時延環(huán)境下,接收端的相位信息基本被破壞,已經(jīng)完全看不到4個基準(zhǔn)相位點了,但是經(jīng)過時延恢復(fù)后,可以明顯的看出基準(zhǔn)相位點,可見該算法在信噪比較好的解調(diào)環(huán)境中能夠準(zhǔn)確的實現(xiàn)時延恢復(fù)。從圖10(e)~(f)可以看出在低信噪比、大時延的解調(diào)環(huán)境中,信號基準(zhǔn)點已經(jīng)完全模糊不清,但是該算法依舊有較好的時延恢復(fù)性能,能夠較準(zhǔn)確的恢復(fù)時延信號,說明該算法適用于低信噪比的通信環(huán)境。
圖10 信號星座圖Fig.10 Signal constellation
本文并行解調(diào)架構(gòu)的特點在于通過資源的復(fù)用有效降低了系統(tǒng)實現(xiàn)的復(fù)雜度、減少系統(tǒng)資源的使用,相對于其他解調(diào)架構(gòu)具有一定的優(yōu)勢。為進一步量化說明,擬通過不同解調(diào)方案乘法運算的次數(shù)為比較標(biāo)準(zhǔn),分析不同方案的運算量。選擇方案如下:
方案1 Gardner定時同步算法(閉環(huán)算法)+FIR濾波器。該結(jié)構(gòu)主要包含匹配濾波器、內(nèi)插濾波器、定時誤差檢測器、數(shù)控振蕩器(NCO)和環(huán)路濾波器等。為方便比較,假設(shè)系統(tǒng)中匹配濾波器、內(nèi)插濾波器和本文的濾波器階數(shù)相同,均為M階,同時忽略NCO和環(huán)路濾波器等較小的部件的運算量,因此得到方案的運算量如表1所示。
方案2 最大平均功率定時同步算法(開環(huán)算法)+FIR濾波器。該結(jié)構(gòu)主要包括平均功率計算模塊和匹配濾波器模塊,算法均基于時域?qū)崿F(xiàn)。
方案3 SLN同步算法+FIR濾波器(FFT實現(xiàn))。該結(jié)構(gòu)主要包含定時同步模塊和匹配濾波器模塊,其中同步模塊基于時域?qū)崿F(xiàn),使用時域乘法運算,匹配濾波器模塊基于頻域?qū)崿F(xiàn),使用復(fù)數(shù)乘法運算。由于輸入信號均為實數(shù),因此可以根據(jù)實信號的傅里葉變換具有共模偶對稱性,降低一半的運算量[11]。為方便比較,按照一次復(fù)數(shù)乘法等價于3次實數(shù)乘法快捷方式進行換算[12],最終可得該結(jié)構(gòu)的運算量。
方案4 定時同步與匹配濾波器聯(lián)合實現(xiàn)。方案中匹配濾波器計算方式和方案3的類似,不同的是方案中將定時同步嵌入到濾波器模塊中去,因此在定義模塊計算量時,可以將其分別等效為總運算量的1/2。
表1給出了四種方案所需要的乘法器次數(shù)的估量值。
表1 不同方案所需要乘法運算次數(shù)比較
假設(shè)碼元的長度L=512,分成m=64段,系統(tǒng)采用P=4倍過采樣,濾波器階數(shù)M=33,利用重疊保留法對數(shù)據(jù)進行分段處理,每段長度為64點,濾波后長度為N=64。
從表1可以看出,方案1和方案2計算量差別不大,因此在選擇時主要考慮同步算法的精度和適用場合。方案3相比于方案1和方案2,濾波器的計算量減少明顯,說明簡化后的匹配濾波器不論是在硬件資源使用上還是實現(xiàn)復(fù)雜度上都有較大的改進。方案4通過模塊的融合,極大的減少了系統(tǒng)計算量。和方案1相比,方案4的計算量大約是方案1計算量的30%,說明該方案適用于高速場合。
針對高速并行解調(diào)的應(yīng)用需求提出了一種高效的實現(xiàn)架構(gòu),即基于免混頻的定時同步與匹配濾波的聯(lián)合實現(xiàn)架構(gòu),該架構(gòu)通過模塊間算法的復(fù)用,有效的降低了系統(tǒng)的復(fù)雜度,大大減小了系統(tǒng)的硬件資源使用,經(jīng)仿真分析該方案在低信噪比、大時延的條件下都具有較好的跟蹤性能,具有較好的應(yīng)用前景。