曹陽(yáng),張祖鵬,彭小峰
(重慶理工大學(xué) 電氣與電子工程學(xué)院 重慶 400054)
攜帶軌道角動(dòng)量(Orbital Angular Momentum,OAM)的光束可提高系統(tǒng)信道容量和頻譜利用率,成了眾多學(xué)者的研究對(duì)象[1]。目前,在實(shí)驗(yàn)室條件下通過(guò)對(duì)OAM 光束復(fù)用,已經(jīng)實(shí)現(xiàn)了Tbit/s 級(jí)別的數(shù)據(jù)傳輸[2]。然而在自由空間光通信(Free Space Optical Communications,F(xiàn)SO)系統(tǒng)中,大氣湍流引起的大氣折射率變化,使得大氣傳輸?shù)募す馐霈F(xiàn)振幅隨機(jī)起伏以及相位扭曲,導(dǎo)致無(wú)線光通信系統(tǒng)的性能下降[3]。自適應(yīng)光學(xué)(Adaptive Optics,AO)是可通過(guò)校正光束動(dòng)態(tài)波前畸變來(lái)提升通信系統(tǒng)性能的技術(shù),已成為無(wú)線光通信系統(tǒng)的研究熱點(diǎn)[4]。AO 系統(tǒng)一般包括波前傳感器、波前控制器和波前校正器,而根據(jù)AO 系統(tǒng)是否使用波前傳感器可將其分為常規(guī)AO 和無(wú)波前探測(cè)AO 兩類[5]。常規(guī)AO 系統(tǒng)在天文觀測(cè)、生物醫(yī)學(xué)領(lǐng)域取得了廣泛應(yīng)用,但是受到系統(tǒng)結(jié)構(gòu)復(fù)雜性和工作原理本身的制約,其應(yīng)用范圍具有局限性[6]。無(wú)波前探測(cè)AO系統(tǒng)可直接利用探測(cè)到的光強(qiáng)信息設(shè)計(jì)控制算法,產(chǎn)生波前校正器所需要的控制信號(hào),即根據(jù)畸變光強(qiáng)圖像進(jìn)行波前重構(gòu)[7]。
經(jīng)典無(wú)波前探測(cè)的波前重構(gòu)方法包括Gerchberg-Saxton 相位恢復(fù)算法[8]、隨機(jī)并行梯度下降算法[9]、模擬退火算法以及遺傳算法[10]等,這些算法多需要通過(guò)迭代計(jì)算求解,難以實(shí)現(xiàn)實(shí)時(shí)的波前重構(gòu)?;谏疃葘W(xué)習(xí)(Deep Learning,DL)的無(wú)波前探測(cè)是將CCD 相機(jī)捕捉到的光強(qiáng)圖像作為神經(jīng)網(wǎng)絡(luò)輸入,將波前像差或Zernike 系數(shù)作為輸出,然后再將輸出轉(zhuǎn)化為控制信號(hào),最終控制變形鏡實(shí)現(xiàn)波前校正。文獻(xiàn)[11]中應(yīng)用點(diǎn)擴(kuò)展函數(shù)的深度學(xué)習(xí)方式實(shí)現(xiàn)波前重構(gòu),獲得了比隨機(jī)重構(gòu)更低的誤差,但對(duì)于較大尺寸圖像的復(fù)原實(shí)時(shí)性較差。文獻(xiàn)[12]針對(duì)現(xiàn)有搜索算法迭代次數(shù)過(guò)多的問(wèn)題,提出基于深度神經(jīng)網(wǎng)絡(luò)的模型,從而獲取Zernike 系數(shù)進(jìn)行波前校正,并減少了時(shí)間開銷。上述研究表明了DL 技術(shù)在AO 中可有效應(yīng)用,但通常存在計(jì)算成本高的問(wèn)題。為降低計(jì)算復(fù)雜度,文獻(xiàn)[13]使用卷積神經(jīng)網(wǎng)絡(luò)模型,直接從單個(gè)光強(qiáng)圖像估計(jì)波前Zernike 系數(shù),通過(guò)實(shí)驗(yàn)驗(yàn)證了過(guò)曝光、離焦和散射等預(yù)處理方式的有效性。文獻(xiàn)[14]同樣使用卷積神經(jīng)網(wǎng)絡(luò)模型,使其學(xué)習(xí)畸變渦旋光強(qiáng)分布與前20 項(xiàng)Zernike 系數(shù)之間的映射關(guān)系,縮短了計(jì)算時(shí)間。這些研究表明DL 具有巨大的潛力,另有相關(guān)文獻(xiàn)從幾何光學(xué)方面提升系統(tǒng)性能,如文獻(xiàn)[15]中用相位差異思想,提出將焦平面和離焦平面的光強(qiáng)圖作為神經(jīng)網(wǎng)絡(luò)輸入,并將其對(duì)應(yīng)的Zernike 系數(shù)作為標(biāo)簽,輸出波前Zernike 系數(shù)。文獻(xiàn)[16]探討了訓(xùn)練數(shù)據(jù)的一致性對(duì)波前復(fù)原性能的影響,仿真結(jié)果表明,使用單一訓(xùn)練數(shù)據(jù)集的模型魯棒性不強(qiáng)。文獻(xiàn)[17]同樣根據(jù)相位差的思想,采集空間光調(diào)制器生成的真實(shí)相位,使用卷積神經(jīng)網(wǎng)絡(luò)建立了真實(shí)圖像與其Zernike 系數(shù)的映射,并由于模型參數(shù)少,顯著提升了模型的實(shí)時(shí)性。文獻(xiàn)[18]把殘差網(wǎng)絡(luò)應(yīng)用于波前重構(gòu),將遠(yuǎn)場(chǎng)光強(qiáng)圖作為輸入,波前Zernike 系數(shù)作為輸出,驗(yàn)證了神經(jīng)網(wǎng)絡(luò)魯棒性強(qiáng)的特性。與傳統(tǒng)波前探測(cè)算法相比,深度卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在無(wú)波前探測(cè)AO 系統(tǒng)上表現(xiàn)出了優(yōu)越性,但仍然存在對(duì)光斑特征感知和表達(dá)不足的問(wèn)題。隨著網(wǎng)絡(luò)不斷加深,易出現(xiàn)梯度消失、爆炸甚至過(guò)擬合的現(xiàn)象,難以完成實(shí)時(shí)精確的重構(gòu)任務(wù),過(guò)多的池化操作也會(huì)導(dǎo)致小目標(biāo)信息丟失,重構(gòu)誤差過(guò)大。
針對(duì)上述問(wèn)題,本文引入殘差網(wǎng)絡(luò)作為主干網(wǎng)絡(luò),利用其跳層連接的特點(diǎn),使網(wǎng)絡(luò)學(xué)習(xí)更深層次的特征表示,并在網(wǎng)絡(luò)中嵌入帶有多尺度特征提取的混合注意力結(jié)構(gòu),利用空洞卷積來(lái)提取光斑的不同感受野信息,在擴(kuò)大特征尺度的同時(shí)避免網(wǎng)格偽影現(xiàn)象;應(yīng)用通道注意力加權(quán)融合不同尺度的特征,并向后傳播,通過(guò)空間注意力對(duì)特征圖像素間的依賴性進(jìn)行聚合,得到更具分辨率的特征圖;定義網(wǎng)絡(luò)損失函數(shù)為多個(gè)指標(biāo)的加權(quán)和,從而增加重構(gòu)Zernike 系數(shù)的真實(shí)性。
基于深度學(xué)習(xí)的無(wú)波前探測(cè)AO 系統(tǒng)中通常用神經(jīng)網(wǎng)絡(luò)模型代替?zhèn)鹘y(tǒng)校正算法,從畸變光強(qiáng)圖像中反演出波前像差或是其Zernike 系數(shù),結(jié)合神經(jīng)網(wǎng)絡(luò)模型的無(wú)波前探測(cè)AO 系統(tǒng)框架如圖1 所示??臻g光調(diào)制器法是常見(jiàn)的渦旋光束生成法之一,激光器發(fā)射的光束經(jīng)過(guò)擴(kuò)束準(zhǔn)直后,入射到搭載了叉形光柵的空間光調(diào)制器上,即可生成預(yù)校正的渦旋光束。在大氣傳輸時(shí),光波發(fā)生波前畸變,其相位面不是平面,此時(shí)的畸變波前被分光鏡分為兩部分,一部分聚焦到波前校正系統(tǒng),另一部分用于信息傳輸。波前控制器接收到波前畸變信息之后,將進(jìn)行波前重構(gòu),得到波前系數(shù),并據(jù)此生成控制電壓系數(shù),由變形鏡(Deformable mirror)產(chǎn)生共軛波前,補(bǔ)償接收到的光束,校正完后再將光束送到信息接收端。
圖1 無(wú)波前探測(cè)AO 系統(tǒng)原理Fig.1 Schematic diagram of AO system without wavefront detection
在自由空間光通信中,渦旋光束與普通光束相比,具有連續(xù)螺旋形波前,在光束傳播的方向上相位具有不確定性,該處即為相位奇點(diǎn)。渦旋光束中拉蓋爾-高斯(Laguerre-Gauss,LG)光束是一種具有代表性的光束,在自由空間下其光場(chǎng)分布為
式中,l為渦旋光束的拓?fù)浜蓴?shù),可以取為任意整數(shù);p表示LG 光束的徑向指數(shù);r為空間點(diǎn)到傳輸軸的徑向距離;φ為方位角;,w0為光束束腰半徑,z0=kw0/λ為瑞利距離,k=2π/λ為波數(shù),λ為光波長(zhǎng);為拉蓋爾多項(xiàng)式。假設(shè)光束發(fā)射點(diǎn)位于z=0 處,且為了在研究方便的情況下不影響結(jié)果,令p=0,則發(fā)射光束光場(chǎng)分布表示為
根據(jù)式(2)可以模擬出LG 光束在大氣湍流中的傳輸過(guò)程,考慮光束傳輸中存在衍射效應(yīng),因此經(jīng)過(guò)衍射光闌后的光場(chǎng)分布為
式中,x-y為入射平面坐標(biāo),x1-y1為接收平面坐標(biāo),T(x,y)為圓孔光闌透過(guò)率函數(shù),u(x,y,0)為z=0 時(shí)的光場(chǎng)分布,設(shè)置圓孔半徑rc=w0。
當(dāng)光波通過(guò)多個(gè)相位屏?xí)r,只有相位變化而振幅不變,在Rytov 近似下,可以得到傳輸距離為Δz時(shí)的光場(chǎng)分布為
式中,F(xiàn)-1和F 分別表示傅里葉逆變換和傅里葉變換;?(r,zi)表示大氣湍流相位屏函數(shù);kx和ky分別表示x和y方向上的空間波數(shù),且。因此,只需模擬出大氣湍流的相位屏模型就可以計(jì)算出接收端處光場(chǎng)的大小,選用Noll 定義的Zernike 多項(xiàng)式來(lái)模擬湍流相位屏?(r),可表示為
式中,Zi為第i項(xiàng)多項(xiàng)式對(duì)應(yīng)不同相差,Zeveni為第偶數(shù)項(xiàng),Zoddi為第奇數(shù)項(xiàng),為徑向函數(shù)表達(dá)式,r和θ為極坐標(biāo),n和m分別為徑向和角向級(jí)次,始終是整數(shù)并且滿足m≤n,n-|m|=even,even 為偶數(shù)。Zernike 多項(xiàng)式的第一項(xiàng)表示平移,對(duì)圖像成像質(zhì)量沒(méi)有影響,更高階的多項(xiàng)式可以表示更高的頻率成分,因此本文不考慮第一項(xiàng)式,并選取36 階的多項(xiàng)式生成符合實(shí)際情況的大氣湍流相位屏。
由于捕獲到的光強(qiáng)圖中包含波前像差信息,因此基于深度卷積神經(jīng)網(wǎng)絡(luò)的模型能夠從畸變光強(qiáng)圖中提取出波前Zernike 系數(shù),甚至直接提取大氣湍流相位,其權(quán)重共享的特性,可在減少學(xué)習(xí)參數(shù)量的同時(shí)實(shí)現(xiàn)實(shí)時(shí)波前重構(gòu)。然而一味地增加網(wǎng)絡(luò)深度,不僅容易過(guò)擬合,還極容易陷入局部最優(yōu),且卷積操作會(huì)由于感受野大小的不同,導(dǎo)致本具有聯(lián)系的像素間提取出的特征存在差異,這些差異會(huì)導(dǎo)致重構(gòu)的像差較大。針對(duì)上述問(wèn)題,用殘差網(wǎng)絡(luò)的思想構(gòu)建特征圖的恒等映射,使得后面的層能學(xué)習(xí)到網(wǎng)絡(luò)的殘差,減少過(guò)擬合風(fēng)險(xiǎn),并結(jié)合全局上下文信息,加入注意力機(jī)制,在特征之間建立聯(lián)系,增加網(wǎng)絡(luò)的波前重構(gòu)能力?;跉埐罹W(wǎng)絡(luò)的波前重構(gòu)系統(tǒng)如圖2 所示。
圖2 網(wǎng)絡(luò)整體結(jié)構(gòu)Fig.2 Overall network structure
骨干網(wǎng)絡(luò)為ResNet50 模型,首先通過(guò)7×7 的下采樣卷積操作將輸入的光強(qiáng)圖轉(zhuǎn)變?yōu)樘卣鲌D像,大尺度卷積核在盡可能保留特征信息的情況下減小計(jì)算量。之后采用過(guò)濾器大小為3×3 的最大池化操作減少特征映射的參數(shù),將其降維至初始圖像的1/4 大小。然后將混合注意力模塊嵌入到ResNet 模型中,充分捕獲特征信息,每個(gè)混合注意力模塊包含兩次卷積操作和一次混合注意力計(jì)算操作,每次卷積操作的通道數(shù)如圖2 所示。最后經(jīng)過(guò)全連接層將特征從三維空間映射到一維空間中,并加入Dropout 防止過(guò)擬合,最終的輸出為輸入光強(qiáng)圖中波前像差對(duì)應(yīng)的Zernike 系數(shù)。
為了彌補(bǔ)深度ResNet 感受野有限,跨通道交互缺乏,小目標(biāo)信息易丟失的問(wèn)題,在網(wǎng)絡(luò)中添加空間注意力(Spatial Attention,SA)機(jī)制與動(dòng)態(tài)選擇機(jī)制網(wǎng)絡(luò)(Selective Kernel Neural Networks,SKNet)[19]相結(jié)合的混合注意力結(jié)構(gòu),主要采用卷積操作提取特征映射的相關(guān)信息,加入殘差跳連結(jié)構(gòu)根據(jù)輸入的特征的重要程度來(lái)為模型合理地分配計(jì)算資源。提出的混合注意力結(jié)構(gòu)包括帶有通道注意力機(jī)制(Channel Attention,CA)的SKNet 與空間注意力機(jī)制,其結(jié)構(gòu)如圖3 所示。
圖3 混合注意力結(jié)構(gòu)Fig.3 Structure diagram of mixed attention
對(duì)于光強(qiáng)圖像中不同大小的光斑,其特征的尺度同樣變化,如果采用大小相同的卷積核,小光斑特征信息的表達(dá)能力逐漸變?nèi)?,?dǎo)致重構(gòu)像差誤差增加。針對(duì)此,用多尺度特征提取網(wǎng)絡(luò)SKNet,使模型增強(qiáng)淺層特征的表達(dá),有利于網(wǎng)絡(luò)中較小目標(biāo)的回歸,讓模型把注意力更加聚焦在目標(biāo)本身。
SKNet 可以分為分解、融合和選擇三個(gè)部分。在分解部分,選取不同大小的卷積核進(jìn)行特征映射操作,雖然多分支結(jié)構(gòu)能夠挖掘更豐富的語(yǔ)義信息,增強(qiáng)網(wǎng)絡(luò)的表達(dá)能力,但同時(shí)也加大了網(wǎng)絡(luò)訓(xùn)練的難度。因此選用3×3 和5×5 大小的雙流網(wǎng)絡(luò)結(jié)構(gòu),表示為
式中,X∈Rh×w×C為輸入的特征圖,f代表卷積操作,這樣不僅可以通過(guò)多分支結(jié)構(gòu)獲取光強(qiáng)圖像中高低頻部分的特征表示,而且可以避免過(guò)多的網(wǎng)絡(luò)分支造成訓(xùn)練難以收斂。其中5×5 的卷積采用空洞卷積操作。
在融合部分,通過(guò)求和操作控制特征圖相加,然后由全局平均池化統(tǒng)計(jì)卷積層每個(gè)通道攜帶的信息得到s,最后進(jìn)行特征降維得到z。整體過(guò)程表示為
式中,F(xiàn)gp是全局池化操作,F(xiàn)fc是全連接操作,δ為線性整流函數(shù)(Rectified linear unit,relu),B 為Batch normalization 層,Ws∈Rd×C,d=max(C/τ,L)表示全連接之后的特征維度,C為通道維度大小,τ為壓縮因子,L表示d的最小值。全局注意力模塊用于整合深層和淺層特征,以緩解深層特征分辨率低而引起的較小光斑信息丟失的問(wèn)題。
選擇部分,使用softmax 函數(shù)計(jì)算各個(gè)通道的權(quán)重分布。計(jì)算方式為
式中,a和b分別為和的軟注意力權(quán)重矩陣,ac為a的第c行元素,bc同理。A和B同為注意力權(quán)重矩陣,Ac為A的第c行元素,Bc同理。由于池化層的存在,高頻信息量會(huì)進(jìn)一步減少,導(dǎo)致深層特征對(duì)小目標(biāo)的表達(dá)能力較弱。引入空間注意力機(jī)制對(duì)目標(biāo)區(qū)域的特征加以權(quán)重,尋找網(wǎng)絡(luò)中特征間的聯(lián)系,使特征提取網(wǎng)絡(luò)有選擇性地關(guān)注包含重要信息的目標(biāo)區(qū)域。最后的輸出矩陣計(jì)算公式為
式中,c表示拼接操作,σ為sigmoid 激活函數(shù),F(xiàn)avg與Fmax分別表示沿著通道軸執(zhí)行的平均池化操作和最大池化操作。與通道注意力不同的是,空間注意力可以將高低頻信息區(qū)分開來(lái),這與通道注意力是互補(bǔ)的[20],經(jīng)過(guò)優(yōu)化空間信息的特征圖可以有效表達(dá)像素點(diǎn)間的特征相似度,空間注意力可以很好地獲得上下文語(yǔ)義信息。
為了讓波前像差的Zernike 系數(shù)重建更合理,結(jié)合常用的波前評(píng)價(jià)指標(biāo)來(lái)改進(jìn)網(wǎng)絡(luò)的損失函數(shù)。常用的AO 系統(tǒng)評(píng)價(jià)指標(biāo)有波前峰谷值(Peak to Valley,PV)和波前均方根值(Root Mean Square,RMS)等,PV 用來(lái)表示波前最高點(diǎn)與最低點(diǎn)的差值,RMS 表征被測(cè)光束波前相較于理想波前的偏離程度[21],其公式分別為
式中,Δ?為波前像差,為其均值,ρ和θ為光瞳面的極坐標(biāo)。可以看出,PV 值反映的波前信息不夠全面,RMS 值則更注重波前的整體信息,結(jié)合兩者能更準(zhǔn)確地表現(xiàn)波前情況。因此結(jié)合均方誤差(Mean Squared Error,MSE)的損失函數(shù)為
式中,zact和zpre分別為實(shí)際與估計(jì)的Zernike 系數(shù),長(zhǎng)度為N,γ為各損失的權(quán)重,L 為各個(gè)損失函數(shù)的加權(quán)和,損失函數(shù)的縮小代表著重構(gòu)精度的提高。
為驗(yàn)證提出的殘差注意力網(wǎng)絡(luò)的可行性,模擬渦旋光束在不同湍流強(qiáng)度下的傳輸,展開波前復(fù)原仿真。根據(jù)Taylor 凍結(jié)湍流假設(shè)理論,大氣湍流在短時(shí)間內(nèi)其空間結(jié)構(gòu)保持不變,因此假設(shè)湍流凍結(jié)時(shí)間為10~20 ms。渦旋光束在經(jīng)過(guò)大氣湍流之后發(fā)生了相位失真,其大小與D/r0比值相關(guān),其中D是系統(tǒng)孔徑直徑,r0是大氣相干長(zhǎng)度。采用大氣相干長(zhǎng)度r0表述湍流強(qiáng)度的影響,r0越大表示湍流強(qiáng)度越小。對(duì)于光束束腰半徑為3 cm 的系統(tǒng),D/r0=2 可以表示弱湍流,D/r0=10 可以表示中湍流,D/r0=20 可以表示強(qiáng)湍流。其余參數(shù)設(shè)置如表1 所示。
表1 仿真參數(shù)Table 1 Parameter of simulation
同時(shí)為使仿真更加合理,設(shè)置比值范圍為D/r0=2~20,間隔為2,每個(gè)比值生成5 000 組隨機(jī)Zernike 系數(shù)和對(duì)應(yīng)的光強(qiáng)圖作為訓(xùn)練數(shù)據(jù),其中訓(xùn)練集、驗(yàn)證集與測(cè)試集的比值為8∶1∶1,訓(xùn)練圖像的大小調(diào)整為224×224 像素,網(wǎng)絡(luò)的輸出為36 位Zernike 系數(shù)。為使實(shí)驗(yàn)對(duì)比更清晰,將從輸出的Zernike 系數(shù)中生成對(duì)應(yīng)的波前相位進(jìn)行對(duì)比,并從預(yù)測(cè)相位與真實(shí)相位之間的殘差來(lái)測(cè)試網(wǎng)絡(luò)準(zhǔn)確性。由式(3)、(5)和表1 中參數(shù)可生成如圖4 所示的湍流相位屏和光強(qiáng)分布。圖4(a)為弱湍流強(qiáng)度下Zernike 系數(shù)模擬的湍流相位屏,單位為度(°),以及拓?fù)浜蓴?shù)為3 的LG 光束經(jīng)過(guò)圓孔光闌后的光強(qiáng)分布,圖中PV 值和RMS 值的單位為rad,其值較小,代表大氣環(huán)境良好。圖4(b)~(c)為中湍流和強(qiáng)湍流下的相位屏圖和光強(qiáng)圖,隨著PV 值和RMS 值變大,相位屏的起伏變大,表示大氣信道環(huán)境變差,光強(qiáng)分布發(fā)生畸變。
圖4 湍流相位分布和光強(qiáng)分布Fig.4 Turbulent phase distribution and light intensity distribution
仿真環(huán)境采用python 語(yǔ)言的keras 深度學(xué)習(xí)庫(kù),離線訓(xùn)練迭代次數(shù)epoch 設(shè)為100,每個(gè)批次大小Batchsize 設(shè)為50。采用自適應(yīng)學(xué)習(xí)率Adam 算法,設(shè)置初始學(xué)習(xí)率為0.001,當(dāng)網(wǎng)絡(luò)精確度在10 個(gè)批次內(nèi)未增加時(shí)學(xué)習(xí)率下降為0.000 1,在全連接層中使用Dropout 層來(lái)防止網(wǎng)絡(luò)過(guò)擬合,并使用tanh 函數(shù)作為網(wǎng)絡(luò)激活函數(shù)。綜合評(píng)估后損失函數(shù)各個(gè)部分的權(quán)重設(shè)置為γMSE=1,γPV=0.8,γRMS=0.5。訓(xùn)練過(guò)程中的損失函數(shù)值與準(zhǔn)確率大小如圖5 所示,圖5(a)中損失函數(shù)隨著迭代次數(shù)增加而減小,圖5(b)中準(zhǔn)確率逐漸增加,最終整體準(zhǔn)確率能達(dá)到97%左右。
圖5 模型的損失函數(shù)與精確度Fig.5 Loss function and accuracy of the model
為驗(yàn)證殘差注意力網(wǎng)絡(luò)模型的有效性和魯棒性,仿真中在不同湍流強(qiáng)度下隨機(jī)生成了5 組Zernike 系數(shù),并生成對(duì)應(yīng)的相位屏如圖6(a)所示。通過(guò)提出的混合注意力網(wǎng)絡(luò)模型預(yù)測(cè)Zernike 系數(shù),估計(jì)的結(jié)果和其殘差相位如圖6(b)~(c)所示,文獻(xiàn)[12]的結(jié)果如圖6(d)所示??梢钥闯鎏岢龅臍埐钭⒁饬W(wǎng)絡(luò)模型預(yù)測(cè)的殘差最小,僅使用卷積神經(jīng)網(wǎng)絡(luò)的模型預(yù)測(cè)的結(jié)果不夠準(zhǔn)確,其殘差相位的PV、RMS 值如表2 所示,本文方法預(yù)測(cè)的畸變相位殘差值較小,相較于之前的工作能得到更符合實(shí)際的相位屏。因此從圖6 和表2 可知,在不同湍流強(qiáng)度下混合注意力網(wǎng)絡(luò)均有很好的重構(gòu)效果,且復(fù)原的相位屏與實(shí)際相位屏相似度高。圖7 為5 種不同湍流強(qiáng)度下預(yù)測(cè)的Zernike 系數(shù)與實(shí)際系數(shù)的對(duì)比,可以看出本文方法的預(yù)測(cè)結(jié)果與實(shí)際系數(shù)較為接近。
圖6 預(yù)測(cè)的湍流相位與實(shí)際對(duì)比Fig.6 Comparison of the predicted turbulence phase with the actual phase
表2 不同湍流強(qiáng)度下殘差相位的PV 值和RMS 值Table 2 PV and RMS values of the residual phase at different turbulence intensities
圖7 預(yù)測(cè)的Zernike 系數(shù)與實(shí)際對(duì)比Fig.7 Comparison of the predicted Zernike coefficient with the actual coefficient
根據(jù)預(yù)測(cè)的Zernike 系數(shù)重構(gòu)波前之后,向畸變光束加載反相波前,即可實(shí)現(xiàn)湍流相位的校正。為驗(yàn)證殘差注意力網(wǎng)絡(luò)模型的魯棒性,在不同信噪比下進(jìn)行仿真。不同信噪比下的光強(qiáng)如圖8 所示,隨著湍流強(qiáng)度增加,LG 光束的輪廓逐漸變形,噪點(diǎn)分布也隨著信噪比減小而增加。預(yù)測(cè)的結(jié)果如圖9 所示,在高信噪比條件下預(yù)測(cè)效果與無(wú)噪聲相近,在低信噪比,如5 dB 的情況下,殘差相位的起伏仍比較平緩,具體結(jié)果如表3所示。通過(guò)表3 和圖9 的結(jié)果可知,提出的混合注意力網(wǎng)絡(luò)能重建準(zhǔn)確的波前相位,并具有較高的魯棒性。
表3 不同信噪比下殘差相位的PV 值和RMS 值Table 3 PV and RMS values of the residual phase at different SNR
圖8 不同信噪比下的光強(qiáng)Fig.8 Light intensity map at different SNR
圖9 不同信噪比下的殘差相位Fig.9 Residual phase at different SNR
為驗(yàn)證提出的混合注意力結(jié)構(gòu)的有效性,仿真中訓(xùn)練了幾種不同模型,包括基礎(chǔ)骨干網(wǎng)絡(luò)ResNet50、添加CA 的網(wǎng)絡(luò)、添加SA 的網(wǎng)絡(luò)以及添加混合注意力結(jié)構(gòu)的網(wǎng)絡(luò),得到了如表4 所示的準(zhǔn)確率結(jié)果。
表4 不同模型的準(zhǔn)確率與計(jì)算時(shí)間對(duì)比Table 4 Comparison of accuracy and calculation time of different models
表4 表明,添加了注意力機(jī)制的網(wǎng)絡(luò)在重構(gòu)Zernike 系數(shù)上的精度最高,且與單一注意力結(jié)構(gòu)相比,混合注意力結(jié)構(gòu)的準(zhǔn)確率更高,達(dá)到了97.1%。在運(yùn)行時(shí)間上,測(cè)試了1 000 次后取其平均值,從表中可知,添加注意力網(wǎng)絡(luò)的計(jì)算時(shí)間均在10 ms 以下,可以滿足實(shí)時(shí)波前校正的要求,隨著硬件性能的增加,運(yùn)行時(shí)間可以繼續(xù)降低?;旌献⒁饬Y(jié)構(gòu)的運(yùn)行時(shí)間比ResNet50 稍長(zhǎng),但綜合準(zhǔn)確率來(lái)評(píng)估后,本文提出的殘差注意力網(wǎng)絡(luò)性能最好。
為驗(yàn)證注意力機(jī)制在網(wǎng)絡(luò)中的作用,在原數(shù)據(jù)集的基礎(chǔ)上,設(shè)計(jì)以下消融仿真,將提出的混合注意力機(jī)制作為基礎(chǔ)訓(xùn)練模型,然后分別移除CA 和SA 訓(xùn)練得到2 個(gè)不同模型,訓(xùn)練中所有參數(shù)設(shè)置均相同。在相同湍流條件下隨機(jī)生成一個(gè)相位屏,其結(jié)果如圖10(a)所示,不同模型測(cè)試的結(jié)果如圖10(b)所示。圖10(c)左圖為完整模型復(fù)原的波前殘差,相較于單一注意力機(jī)制得到的結(jié)果,其重構(gòu)相似度最高。從圖10(c)中可知,移除CA 會(huì)導(dǎo)致特征之間的關(guān)聯(lián)性下降,重構(gòu)波前的相似度變低,移除SA 導(dǎo)致特征提取能力下降,特征表達(dá)的能力變?nèi)?。該消融?shí)驗(yàn)得到的評(píng)價(jià)指標(biāo)對(duì)比如表5 所示,完整模型的殘差PV 值為0.145 1 rad,RMS值為0.052 7 rad,相比其他兩種模型更小。綜上,混合注意力機(jī)制具有實(shí)際有效性。
圖10 去除部分注意力機(jī)制與完整模型的預(yù)測(cè)結(jié)果對(duì)比Fig.10 Comparison of prediction results between the model with partial attention mechanism removed and the complete model
表5 去除部分注意力機(jī)制的評(píng)價(jià)指數(shù)對(duì)比Table 5 Comparison of evaluation indexes of removing partial attention mechanism
為驗(yàn)證各種損失函數(shù)在模型中的作用,在原數(shù)據(jù)集上進(jìn)行消融仿真。完整模型為聯(lián)合3 種損失函數(shù)的網(wǎng)絡(luò),分別移除其中一種損失函數(shù)訓(xùn)練不同模型進(jìn)行測(cè)試,訓(xùn)練中所有參數(shù)的設(shè)置均相同。在相同湍流條件下隨機(jī)生成一個(gè)相位屏,結(jié)果如圖11(a)~(c)所示,不同模型測(cè)試的結(jié)果如圖11(b)所示。完整模型復(fù)原的波前殘差如圖11(c)左圖所示,可以看出,移除PV 時(shí),得到的波前殘差畸變幅度較大;移除RMS 時(shí),波前殘差結(jié)果在內(nèi)容上發(fā)生了失真,導(dǎo)致整體相似度較低。各個(gè)模型生成的評(píng)價(jià)指標(biāo)對(duì)比如表6 所示,完整模型的殘差PV 值為0.164 9 rad,RMS 值為0.039 5 rad,因此結(jié)合實(shí)際評(píng)價(jià)指標(biāo)的損失函數(shù)是合理有效的。
表6 去除部分損失函數(shù)的評(píng)價(jià)指數(shù)對(duì)比Table 6 Comparison of evaluation indexes of partial loss function
圖11 去除部分損失函數(shù)的模型與完整模型的預(yù)測(cè)結(jié)果對(duì)比Fig.11 Comparison of partial loss function with complete model
本文針對(duì)大氣湍流引起渦旋光束畸變,導(dǎo)致FSO 通信質(zhì)量降低的問(wèn)題,提出了結(jié)合殘差注意力網(wǎng)絡(luò)的AO 系統(tǒng)反演波前相位,從而實(shí)現(xiàn)有效的波前校正。訓(xùn)練后的模型建立了前36 階Zernike 系數(shù)與畸變光強(qiáng)分布之間的準(zhǔn)確映射關(guān)系。在不同湍流條件下進(jìn)行仿真,得到的波前殘差PV 值和RMS 值優(yōu)于現(xiàn)有研究,表明網(wǎng)絡(luò)具有強(qiáng)魯棒性。在D/r0=2 的情況下PV=0.045 rad,RMS=0.011 rad;在D/r0=10 的情況下PV=0.226 rad,RMS=0.046 rad;在D/r0=20 的情況下PV=0.275 rad,RMS=0.071 rad。預(yù)測(cè)的Zernike 系數(shù)與實(shí)際系數(shù)相近,通過(guò)系數(shù)重構(gòu)的相位與實(shí)際相位相似度高。驗(yàn)證了混合注意力網(wǎng)絡(luò)在重構(gòu)波前相位任務(wù)中的有效性,在較少增加時(shí)間復(fù)雜度的情況下準(zhǔn)確率達(dá)到最高。殘差注意力網(wǎng)絡(luò)精確度高、實(shí)時(shí)性好和靈活性強(qiáng)的特點(diǎn),可為深度學(xué)習(xí)在AO 系統(tǒng)中的實(shí)際應(yīng)用提供保障。