鄭崇輝,王天樞*,劉哲綺,楊翹楚,劉顯著
1 長春理工大學(xué)空間光電技術(shù)國家地方聯(lián)合工程研究中心,吉林 長春 130022;
2 長春理工大學(xué)光電工程學(xué)院,吉林 長春 130022
軌道角動(dòng)量(Orbital angular momentum,OAM)是渦旋光束(vortex beam)具有的特殊性質(zhì),具有相位因子e xp(ilθ) (θ 為方位角,l為拓?fù)浜蓴?shù))、不同拓?fù)浜蓴?shù)的OAM 光束之間相互正交。因此OAM 為光通信領(lǐng)域提供了波長、頻率、時(shí)間、偏振態(tài)以外的新的自由度,自1992 年由Allen 等人[1]提出,就在自由空間光(free space optical,F(xiàn)SO)通信領(lǐng)域得到了廣泛關(guān)注,2012 年王健[2]等人利用OAM 復(fù)用實(shí)現(xiàn)了Tbit/s 級(jí)信道容量通信。在FSO-OAM 通信系統(tǒng)中,有一種OAM 光束應(yīng)用機(jī)制是將不同OAM 光與特定二進(jìn)制碼直接對(duì)應(yīng),令數(shù)字信號(hào)與OAM 模式之間建立映射關(guān)系,該方法稱為OAM 鍵控[3-5](OAM shift keying,OAM-SK)。OAM-SK使OAM通信問題轉(zhuǎn)化為了OAM 光束的識(shí)別問題。
隨著計(jì)算機(jī)與人工智能技術(shù)的發(fā)展,出現(xiàn)了基于機(jī)器學(xué)習(xí)的OAM-SK-FSO 系統(tǒng)解碼方法。2014 年,Krenn 等人[6]使用人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)對(duì)16 種不同疊加態(tài)OAM 光束進(jìn)行識(shí)別,每種光束代表特定4 bit 二進(jìn)制碼,在維也納的3 km 真實(shí)大氣環(huán)境下對(duì)兩幅圖片進(jìn)行數(shù)據(jù)傳輸,分別得到1.2%與0.8%的誤碼率。利用機(jī)器學(xué)習(xí)的OAM 解調(diào)方案具有結(jié)構(gòu)簡(jiǎn)單、識(shí)別范圍廣、識(shí)別精度高等優(yōu)勢(shì)。而深度學(xué)習(xí)的發(fā)展使得OAM 的識(shí)別精度進(jìn)一步提高。2017 年,Doster 等人[7]使用疊加貝塞爾光束進(jìn)行編碼,并利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)中的Alexnet 架構(gòu)對(duì)其進(jìn)行識(shí)別,在強(qiáng)湍流環(huán)境下得到了99%以上的識(shí)別率,由此開啟了CNN-OAM 解碼方案的研究[8-22]。
Doster 等人的工作表明了更大的訓(xùn)練集、更高的圖片像素?cái)?shù)對(duì)提高CNN-OAM 識(shí)別系統(tǒng)的識(shí)別率有幫助,并且為了映射n位二進(jìn)制數(shù)據(jù),需要 2n種不同OAM 光束與其對(duì)應(yīng),這也需要層數(shù)更深、分類能力更強(qiáng)的CNN 架構(gòu)。而上述需求大大增加了CNNOAM 識(shí)別系統(tǒng)的時(shí)間復(fù)雜度和空間復(fù)雜度,使建立識(shí)別模型的成本大幅上升。
針對(duì)上述問題,本文提出將遷移學(xué)習(xí)應(yīng)用到CNN-OAM 識(shí)別方法中,采用反射式液晶空間光調(diào)制器(liquid crystal spatial light modulator,LC-SLM)生成16 種不同疊加態(tài)OAM 光束。利用次諧波法(subharmonic method)生成大氣湍流相位屏,以SLM 加載相位屏的方式,模擬疊加態(tài)OAM 光束在弱湍流和中湍流環(huán)境下的傳輸。建立了基于VGG16 架構(gòu)的遷移學(xué)習(xí)模型,對(duì)湍流環(huán)境下不同OAM 光束進(jìn)行識(shí)別,并與未使用遷移學(xué)習(xí)的VGG16 模型在識(shí)別率與模型訓(xùn)練速度等方面進(jìn)行了性能對(duì)比。
本文選取拉蓋爾高斯(Laguerre-Gaussian,LG)光束作為編碼光束,LG 光束是一種OAM 光束,其光場(chǎng)表達(dá)式為
其中:l為拓?fù)浜蓴?shù),p為徑向指數(shù),k為波數(shù),,ω0為 束腰半徑,z為傳播距離,為締合拉蓋爾多項(xiàng)式。LG 光束在光強(qiáng)分布上表現(xiàn)為圓環(huán)狀,隨著拓?fù)浜蓴?shù)的增大,其圓環(huán)半徑也隨之增大,圖1 所示分別為拓?fù)浜蓴?shù)l=+2與l=+5 時(shí)的LG 光束光強(qiáng)分布。
圖1 拓?fù)浜蓴?shù)為+2 與+5 的LG 光束。(a) 拓?fù)浜蓴?shù)為+2;(b) 拓?fù)浜蓴?shù)為+5Fig.1 LG beams with topological charges of +2 and +5.(a) Topological charge is +2;(b) Topological charge is +5
CNN-OAM 識(shí)別系統(tǒng)需要利用不同光強(qiáng)分布的光束映射不同的數(shù)據(jù),因此需要識(shí)別并分類不同光束的光強(qiáng)圖。相較于單態(tài)LG 光束相似度較高、不易區(qū)分的圓環(huán)狀分布,疊加態(tài)LG 光束擁有特殊的光強(qiáng)分布,更容易被識(shí)別。其中異號(hào)疊加態(tài)LG 光束,即具有拓?fù)浜蓴?shù)分別為+l與 -l的兩束LG 光束的疊加光場(chǎng),該疊加態(tài)OAM 光束具有獨(dú)特且有規(guī)律的花瓣?duì)罟鈴?qiáng)分布,每種疊加態(tài)光束具有的“花瓣”數(shù)目為l的二倍,適宜利用CNN 進(jìn)行識(shí)別。本文利用SLM 加載相位圖的方式,生成{l=±2,±3,±4,±5,±6,±7,±8,±9,±10,±11,±12,±13,±14,±15,±16,±17}這16 種疊加態(tài)LG 光束,可進(jìn)行4 bit 編碼,其具體映射關(guān)系如圖2 所示。
圖2 LG 光束與數(shù)據(jù)間的映射關(guān)系Fig.2 The mapping relationship between LG beam and data
湍流效應(yīng)引起的大氣折射率變化會(huì)導(dǎo)致在大氣中傳播的LG 光束的波前發(fā)生變化,從而影響CNNOAM 識(shí)別系統(tǒng)的識(shí)別效果。本文采取改進(jìn)的von Karman 功率譜描述大氣湍流:
由此,還可以引入相對(duì)湍流強(qiáng)度的概念:設(shè)湍流中傳輸?shù)墓馐睆綖镈,則D與大氣相干長度r0的比值D/r0即 可用來衡量湍流的大小,一般認(rèn)為當(dāng)D/r0<2時(shí)為弱湍流,當(dāng)2 <D/r0<8 時(shí) 為中湍流,當(dāng)D/r0>8時(shí)為強(qiáng)湍流。
為了在實(shí)驗(yàn)室環(huán)境模擬大氣湍流,本文采用空間光調(diào)制器加載蒙特卡洛相位屏的方法模擬湍流對(duì)光束的影響,本文使用Lane 等人[23]提出的“次諧波法”生成所需相位屏:首先基于功率譜反演法,對(duì)式(2)中的von Karman 功率譜進(jìn)行二維傅里葉變換(twodimensional discrete Fourier transform,2D-DFT),生成一個(gè)相位屏,傅里葉變換法生成的相位屏具有低頻分量不足的缺點(diǎn),因此需要生成低頻相位屏,與FT方法生成的相位屏進(jìn)行疊加,以補(bǔ)充其低頻分量。其數(shù)學(xué)表達(dá)式如下:
其中:Cn,m為傅里葉級(jí)數(shù)系數(shù),fxn和fym分別為x與y方向的離散空間頻率,Np為次諧波級(jí)數(shù),本文的次諧波級(jí)數(shù)Np=3。
疊加后即可生成較為準(zhǔn)確的蒙特卡洛相位屏,以描述大氣湍流。本文選擇r0=0.24 m 和r0=0.09 m 的大氣相干長度。本文仿真的系統(tǒng)光源直徑為0.36 m,因此,當(dāng)大氣相干長度r0= 0.24 m 時(shí),其D/r0的值為1.5,對(duì)應(yīng)的湍流強(qiáng)度為弱湍流。當(dāng)r0= 0.09 m 時(shí),其D/r0的值為4,對(duì)應(yīng)的湍流強(qiáng)度為中湍流。相位屏的內(nèi)尺度l0=0.01 m,外尺度L0= 10 m,模擬傳輸距離L=1000 m的大氣信道。最后要注意相位屏在加載到SLM 前需要?dú)w一化到[0,2π]之間。圖3 中的3(a)、3(b)分別為生成的r0=0.24 m 和r0=0.09 m 的相位屏,3(c)、3(d)分別為歸一化后r0=0.24 m 和r0=0.09 m 的相位屏。
圖3 0.24 m 和0.09 m 的相位屏與歸一化后的相位屏。(a) r0=0.24 m 的相位屏;(b) r0=0.09 m 的相位屏;(c) 歸一化后r0=0.24 m 的相位屏;(d) 歸一化后r0=0.09 m 的相位屏Fig.3 Phase screen of r0=0.24 m and r0=0.09 m and normalized phase screen.(a) Phase screen of r0=0.24 m;(b) Phase screen of r0=0.09 m;(c) Normalized phase screen of r0=0.24 m;(d) Normalized phase screen of r0=0.09 m
遷移學(xué)習(xí)指的是在相似但不同的領(lǐng)域或任務(wù)中進(jìn)行的知識(shí)遷移[24]。也即利用已有的知識(shí)(源域(source domain))來學(xué)習(xí)新的知識(shí)(目標(biāo)域(target domain))。在傳統(tǒng)的深度學(xué)習(xí)方法中,神經(jīng)網(wǎng)絡(luò)需要對(duì)每一個(gè)任務(wù)提取特征,當(dāng)數(shù)據(jù)的分布發(fā)生變化時(shí),通常需要從頭訓(xùn)練,當(dāng)訓(xùn)練集數(shù)據(jù)量龐大或神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較復(fù)雜時(shí),其時(shí)間復(fù)雜度與空間復(fù)雜度大大增加,往往依賴算力更強(qiáng)的圖形處理器(graphics processing unit,GPU)。而遷移學(xué)習(xí)則利用源域與目標(biāo)域之間的相似性,對(duì)已學(xué)習(xí)到的知識(shí)進(jìn)行復(fù)用降低了訓(xùn)練模型的成本。但源域如果和目標(biāo)域相似度不夠,遷移效果會(huì)不理想,即所謂的“負(fù)遷移”現(xiàn)象。
遷移學(xué)習(xí)可以分為基于參數(shù)(parameter)、特征(feature)、實(shí)例(instance)、結(jié)構(gòu)關(guān)系(relation)這4 類遷移方法。本文選用基于參數(shù)的遷移學(xué)習(xí)方法。
基于參數(shù)的遷移學(xué)習(xí)方法也被稱為基于網(wǎng)絡(luò)或基于模型的遷移學(xué)習(xí)方法,是指利用已經(jīng)在其他數(shù)據(jù)集訓(xùn)練好的網(wǎng)絡(luò),即預(yù)訓(xùn)練網(wǎng)絡(luò)(pretrained network),將其中的網(wǎng)絡(luò)和權(quán)重應(yīng)用于其他不相干的任務(wù)中,使模型無需從頭訓(xùn)練。
基于參數(shù)的遷移學(xué)習(xí)的原理是利用CNN 所提取的特征的可移植性,將預(yù)訓(xùn)練網(wǎng)絡(luò)作為特征提取器,從新數(shù)據(jù)集中提取特征,然后將這些特征輸入新的分類器,開始訓(xùn)練。CNN 結(jié)構(gòu)包含兩部分:第一部分是一系列卷積層與池化層,稱為卷積基(convolutional base),第二部分是密集連接分類器。卷積層提取特征的通用性取決于該層在模型中的深度,模型中淺層所提取的特征是局部的,高度通用的,如邊緣、顏色、紋理等,而深層能提取適用于該圖像的特定特征。因此,當(dāng)原始模型與目標(biāo)數(shù)據(jù)集差距較大時(shí),通常使用模型的前幾層做特征提取,當(dāng)差距較小時(shí),可以使用整個(gè)卷積基。
本文使用在ImageNet 上訓(xùn)練的VGG16 網(wǎng)絡(luò)的卷積基作為特征提取器,之后添加適用于本文的分類器,其架構(gòu)如圖4 所示。其中Convolution2D 代表卷積層。MaxPooling2D 代表最大池化層,以對(duì)特征圖進(jìn)行下采樣。利用Flatten 層對(duì)多維輸入一維化,Dense 為全連接層,并添加了Dropout 層以防止過擬合。
圖4 基于VGG16 的遷移學(xué)習(xí)架構(gòu)Fig.4 Transfer learning architecture based on VGG16
架構(gòu)中的卷積基經(jīng)過了凍結(jié)(freeze),所謂“凍結(jié)”,指的是在訓(xùn)練過程中,令一個(gè)或多個(gè)層的權(quán)重保持不變。本文采用在ImageNet 上訓(xùn)練好的權(quán)重代替隨機(jī)初始化的權(quán)重,若不進(jìn)行凍結(jié),其權(quán)重會(huì)隨著訓(xùn)練而進(jìn)行更改,使遷移學(xué)習(xí)方法失敗。凍結(jié)后,只有最后兩個(gè)全連接層參與訓(xùn)練,以對(duì)16 種不同的疊加態(tài)LG 光束進(jìn)行分類。
本文中的CNN-OAM 識(shí)別系統(tǒng)結(jié)構(gòu)簡(jiǎn)圖如圖5 所示。采用半導(dǎo)體激光器作為光源,其波長為1550 nm,激光器發(fā)出的高斯光束耦合到準(zhǔn)直鏡后發(fā)射到自由空間中傳播。首先經(jīng)過半波片,其作用是將光束的偏振態(tài)調(diào)整至入射光線和反射光線所組成的平面上,以滿足SLM 的調(diào)制要求。之后利用偏振片對(duì)入射的線偏振光進(jìn)行過濾,提高消光比。獲得的高質(zhì)量線偏振光入射到第一個(gè)SLM 上進(jìn)行調(diào)制,通過改變SLM1 所加載的l=±2 到±17 的LG 光束對(duì)應(yīng)相位圖,其反射光即為16 種不同疊加態(tài)LG 光束。
圖5 系統(tǒng)結(jié)構(gòu)Fig.5 System structure
本文選用的SLM 為濱松公司的X13138 型,入射光束需照射到液晶靶面正中心,同時(shí)要滿足入射角小于10°,若入射角過大會(huì)導(dǎo)致光束兩側(cè)的相位差過大,影響光束的調(diào)制。
高斯光經(jīng)SLM1 調(diào)制后變?yōu)榀B加態(tài)LG 光束,再入射到SLM2 上,SLM2 上加載湍流相位屏,以模擬大氣湍流對(duì)LG 光束的擾動(dòng)。本文利用Matlab 生成了r0=0.24 m 和r0=0.09 m 兩種湍流強(qiáng)度的相位屏,在本系統(tǒng)中分別對(duì)應(yīng)D/r0=1.5 的弱湍流和D/r0=4 的中湍流。在每種強(qiáng)度下生成300 張隨機(jī)湍流相位屏,共600 張。以代表隨機(jī)的大氣湍流。利用軟件對(duì)加載到SLM2 上的相位屏進(jìn)行滾動(dòng)播放,播放切換間隔為每秒10 張圖片。切換16 種不同LG 光束分別通過SLM2,共計(jì)獲得9600 張光強(qiáng)分布圖片。最后利用連接計(jì)算機(jī)的紅外相機(jī)對(duì)通過湍流后的光束光強(qiáng)圖片進(jìn)行記錄,以完成識(shí)別模型的建立。圖6 為l=±5 的疊加態(tài)LG 光束分別經(jīng)過D/r0= 1.5 和D/r0=4 的湍流后的光強(qiáng)分布圖。
圖6 D/r0 為1.5 與4 時(shí)±5 階LG 光束的光強(qiáng)圖。(a) D/r0=1.5;(b) D/r0=4Fig.6 Intensity diagram of ±5 order LG beam when D/r0 is 1.5 and 4.(a) D/r0=1.5;(b) D/r0=4
采集兩種湍流強(qiáng)度下的16 種LG 光束,所對(duì)應(yīng)的9600 張光強(qiáng)分布圖片將劃為訓(xùn)練集和驗(yàn)證集兩部分,具體劃分方式如下:
在D/r0=1.5 的湍流強(qiáng)度下,16 種LG 光束圖片每種取250 張,同理在D/r0=4 的條件下每種光束取250 張光強(qiáng)圖。將相同種類LG 光束對(duì)應(yīng)的不同湍流強(qiáng)度下的圖片混合并標(biāo)注為同一類,即每種LG 光束標(biāo)簽對(duì)應(yīng)500 張圖片建立訓(xùn)練集,訓(xùn)練集共計(jì)8000張圖片。按上述選取規(guī)則,每種LG 光束對(duì)應(yīng)100 張圖片混合并標(biāo)注以建立驗(yàn)證集,驗(yàn)證集共計(jì)1600 張圖片。
對(duì)數(shù)據(jù)集分類并標(biāo)注后即可訓(xùn)練并建立模型,本文實(shí)驗(yàn)的硬件條件為Inter Core i5-421U 的CPU,主頻為2.40 GHz。GPU 為NVIDIA GeForce 840M,內(nèi)存4.00 GB (3.89 GB 可用)。操作系統(tǒng)為Windows 10 x64。運(yùn)行環(huán)境為tensorflow2.2.2,編程語言為Python3.7.6。
模型共訓(xùn)練20 個(gè)輪次,本文同時(shí)利用相同數(shù)據(jù)集,對(duì)未使用遷移學(xué)習(xí)的VGG16 模型進(jìn)行了建立與訓(xùn)練,以進(jìn)行性能對(duì)比,其訓(xùn)練精度與驗(yàn)證精度如圖7 所示。
圖7 不同識(shí)別模型的訓(xùn)練精度與驗(yàn)證精度。(a) 基于遷移學(xué)習(xí)的識(shí)別模型;(b) 基于原始VGG16 的識(shí)別模型Fig.7 Training accuracy and validation accuracy of different recognition models.(a) Based on transfer learning;(b) Based on VGG16
在本文的分類任務(wù)中,兩個(gè)模型的擬合速度相近,在第7 輪時(shí)便保持了90%以上的驗(yàn)證精度,保存驗(yàn)證精度最高時(shí)的模型。本文首先選取了最高驗(yàn)證精度,網(wǎng)絡(luò)的參數(shù)(param)總量,訓(xùn)練總時(shí)長,平均每輪訓(xùn)練時(shí)長這4 個(gè)指標(biāo),對(duì)比評(píng)價(jià)遷移學(xué)習(xí)模型和原始VGG16 模型對(duì)此分類任務(wù)的表現(xiàn),如表1 所示。
表1 模型評(píng)價(jià)指標(biāo)Table 1 Model evaluation indicators
由表1 可知,利用遷移學(xué)習(xí)的模型可大大縮減訓(xùn)練時(shí)長及參與訓(xùn)練的參數(shù)總量,但在驗(yàn)證集的精度上有一定下降。文中的驗(yàn)證集數(shù)據(jù)量相對(duì)較小,為了使精確度更具有普遍意義,也為了更準(zhǔn)確了解兩種模型對(duì)不同湍流強(qiáng)度下不同LG 光束的識(shí)別表現(xiàn),本文在弱湍流和中湍流條件下分別生成500 張隨機(jī)湍流相位屏,為了體現(xiàn)大氣湍流的隨機(jī)性,這500 張相位屏不能包含建立模型所用的相位屏,需重新生成。之后在圖5 所示的鏈路中,分別利用遷移學(xué)習(xí)模型和VGG16 模型對(duì)16 種疊加OAM 光束進(jìn)行識(shí)別,每種湍流強(qiáng)度下包含8000 種不同光強(qiáng)分布的光束。并利用混淆矩陣(confusion matrix)可視化識(shí)別結(jié)果。
混淆矩陣的縱坐標(biāo)為真實(shí)標(biāo)簽,即實(shí)際的圖片分類;橫坐標(biāo)為預(yù)測(cè)標(biāo)簽,即模型對(duì)圖片的分類結(jié)果。橫縱坐標(biāo)值從左至右、從上至下為2 到17,對(duì)應(yīng)本文的±2 到±17 的疊加光束。若一張圖片屬于±2 的光束,模型將其分類為±5,則在2 所在行、5 所在列記錄數(shù)據(jù)。矩陣對(duì)角線上的數(shù)據(jù)為正確識(shí)別結(jié)果數(shù)。
由圖8 和圖9 可以看出,當(dāng)湍流強(qiáng)度為D/r0=1.5的弱湍流時(shí),遷移學(xué)習(xí)模型識(shí)別率為98.62%,在本文的編碼規(guī)則下的系統(tǒng)誤比特率為0.00666;VGG16模型識(shí)別率為99.39%,誤比特率為0.00303。當(dāng)湍流強(qiáng)度為D/r0=4 的中湍流時(shí),遷移學(xué)習(xí)模型識(shí)別率為94.37%,誤比特率為0.0232;VGG16 模型識(shí)別率為94.81%,誤比特率為0.0213。隨著湍流強(qiáng)度的增強(qiáng),兩個(gè)模型的識(shí)別率均有下降。相比于原始VGG16 網(wǎng)絡(luò)建立的識(shí)別模型,利用遷移學(xué)習(xí)建立的模型的識(shí)別率有微小下降,在兩種湍流強(qiáng)度下識(shí)別率下降幅度均小于1%。而建立遷移學(xué)習(xí)模型所需的訓(xùn)練時(shí)間為13887 s,遠(yuǎn)遠(yuǎn)少于建立原始VGG16 模型所需的32022 s,訓(xùn)練速度提升約2.3 倍。
圖8 遷移學(xué)習(xí)模型在不同湍流環(huán)境下的混淆矩陣。(a) D/r0=1.5;(b) D/r0=4Fig.8 Confusion matrix of transfer learning model in different turbulent environment.(a) D/r0=1.5 ;(b) D/r0=4
圖9 VGG16 模型在不同湍流環(huán)境下的混淆矩陣。(a) D/r0=1.5 ;(b) D/r0=4Fig.9 Confusion matrix of VGG16 model in different turbulent environment.(a) D/r0=1.5;(b) D/r0=4
本文利用深度遷移學(xué)習(xí)方法建立了CNN-OAM識(shí)別系統(tǒng),并在弱湍流和中湍流環(huán)境下進(jìn)行了識(shí)別任務(wù),分別獲得了98.62%、94.37%的較高識(shí)別率。證明了基于遷移學(xué)習(xí)的OAM 識(shí)別系統(tǒng)的可行性。同時(shí)與傳統(tǒng)深度學(xué)習(xí)方法做對(duì)比,證明了遷移學(xué)習(xí)系統(tǒng)可在維持較高識(shí)別率的條件下,大幅減少模型訓(xùn)練所需時(shí)間,為未來快速構(gòu)建CNN-OAM-SK 系統(tǒng)提供了一種思路。
下一階段的工作可以集中在:1) 對(duì)湍流強(qiáng)度進(jìn)行細(xì)分,詳細(xì)對(duì)比遷移學(xué)習(xí)模型在弱、中、強(qiáng)湍流下的表現(xiàn)。2) 將遷移學(xué)習(xí)中的特征提取方法與其他算法如支持向量機(jī)等結(jié)合,進(jìn)一步減少模型訓(xùn)練時(shí)間或提高識(shí)別精度等。