王俊智, 仲偉志, 肖麗君, 王 鑫, 朱秋明, 林志鵬
(1. 南京航空航天大學(xué)航天學(xué)院, 江蘇 南京 210016; 2. 南京航空航天大學(xué)電子信息工程學(xué)院, 江蘇 南京 210016)
毫米波頻段具有巨大且連續(xù)的未分配帶寬,可以滿足無線通信系統(tǒng)對(duì)更高數(shù)據(jù)速率的要求。因此,毫米波通信獲得了人們的廣泛關(guān)注[1]。
由于毫米波傳輸具有路徑損耗和遮擋問題[2],因此需要采用大規(guī)模陣列天線波束形成技術(shù),產(chǎn)生高增益的定向窄波束以彌補(bǔ)路徑傳輸損耗[3]。毫米波的高頻特性決定了其較適合室內(nèi)或室外的短距離傳輸,但是實(shí)際應(yīng)用中發(fā)射端和接收端的相對(duì)運(yùn)動(dòng)會(huì)導(dǎo)致波束搜索復(fù)雜度高、波束對(duì)齊困難等問題,尤其當(dāng)室內(nèi)或者室外小區(qū)內(nèi)存在豐富障礙物時(shí),用戶與基站之間的波束選擇難度將進(jìn)一步增加,波束匹配過程也將消耗大量的運(yùn)算時(shí)間和數(shù)據(jù)資源[4]。針對(duì)這一難點(diǎn),國內(nèi)外研究者做了大量的研究工作。經(jīng)典的波束搜索算法為窮舉搜索方法[5],即對(duì)碼本中所有的波束對(duì)逐個(gè)搜索以找到最佳波束對(duì),但該方法的搜索時(shí)間較長,難以適用于室內(nèi)目標(biāo)隨機(jī)移動(dòng)這一場景。為了減少搜索時(shí)間,研究者提出一種分層搜索[6-7]方法,但當(dāng)主信道路徑的預(yù)波束成形信噪比較低時(shí),分層搜索精度會(huì)降低。文獻(xiàn)[8]從亞6 GHz獲得帶外信息,用于毫米波波束搜索以解決上述問題,但先驗(yàn)信息需要通過收發(fā)器上的傳感器或者進(jìn)行額外測量來獲得,這就導(dǎo)致了額外的系統(tǒng)開銷。文獻(xiàn)[9]提出一種逆指紋方法,該方法利用多路徑指紋和位置信息,在非視線路徑(non-line-of-sight, NLOS)的情況下擴(kuò)展了基于先驗(yàn)信息的波束選擇方法。文獻(xiàn)[10]提出一種基于匈牙利算法的波束選擇方案,通過將波束選擇建模為二部圖上的最大權(quán)匹配進(jìn)行波束選擇,此算法的計(jì)算性能雖好,但復(fù)雜度較高。文獻(xiàn)[11]提出一種基于臨近波束的波束搜索算法,該方法可以有效地減少波束搜索次數(shù),降低波束搜索時(shí)延,在移動(dòng)場景中具有更高的搜索效率。
此外,由于機(jī)器學(xué)習(xí)在處理非線性問題中具有較好的性能表現(xiàn),因此學(xué)者們提出將機(jī)器學(xué)習(xí)應(yīng)用于波束選擇。文獻(xiàn)[12]證明了信道預(yù)測最佳毫米波波束的過程存在非線性函數(shù)關(guān)系,并且證明了一個(gè)足夠大的神經(jīng)網(wǎng)絡(luò)可以預(yù)測最佳毫米波波束和阻塞狀態(tài),其成功概率可以無限接近1。文獻(xiàn)[13]提出一種基于三維(three-dimensional, 3D)場景的波束選擇方法,該方法主要貢獻(xiàn)為使用攝像機(jī)離線拍攝場景圖像進(jìn)行3D場景重建,并將其場景點(diǎn)云作為輸入來構(gòu)建神經(jīng)網(wǎng)絡(luò),顯著降低了運(yùn)算復(fù)雜度,且適用于小型移動(dòng)終端。文獻(xiàn)[14]引入基于深度學(xué)習(xí)的圖像重建方法提高波束形成效率,該方法能夠有效降低波束選擇的開銷。文獻(xiàn)[15]提出一種基于深度神經(jīng)網(wǎng)絡(luò)(deep neural networks, DNN)的波束選擇方法,該方法利用接收機(jī)的位置和方向來推薦最佳波束對(duì)的列表,從而顯著地減少了搜索開銷。然而,基于神經(jīng)網(wǎng)絡(luò)的方法需要大的訓(xùn)練數(shù)據(jù)集來優(yōu)化其網(wǎng)絡(luò)中的所有可訓(xùn)練參數(shù)。訓(xùn)練數(shù)據(jù)集特定于每個(gè)部署站點(diǎn)及其傳播環(huán)境,以及基站和用戶使用的天線陣列配置。由于數(shù)據(jù)集收集的時(shí)間和成本較大,因此大型訓(xùn)練數(shù)據(jù)集的構(gòu)建是采用神經(jīng)網(wǎng)絡(luò)進(jìn)行波束選擇需要面臨的一個(gè)主要難點(diǎn)。針對(duì)上述問題,遷移學(xué)習(xí)(transfer learning, TL)技術(shù)[16]得到了廣泛應(yīng)用,該技術(shù)可將先前用大數(shù)據(jù)集訓(xùn)練的網(wǎng)絡(luò)中的部分信息轉(zhuǎn)移到僅有小訓(xùn)練數(shù)據(jù)集可供使用的另一網(wǎng)絡(luò)。文獻(xiàn)[17]提出一種帶有TL的并行DNN來預(yù)測用戶多鏈路的最佳波束,并表明并行TL結(jié)構(gòu)可以有助于減少干擾和訓(xùn)練開銷。文獻(xiàn)[18]為了有效利用經(jīng)驗(yàn)樣本,使用了遷移強(qiáng)化學(xué)習(xí)來解決毫米波網(wǎng)絡(luò)中的干擾緩解問題,從而加快了任務(wù)的收斂。
基于TL技術(shù)具有能夠節(jié)約數(shù)據(jù)集收集時(shí)間和成本的優(yōu)點(diǎn),本文提出一種基于TL的室內(nèi)波束選擇優(yōu)化方法。該方法使用小數(shù)據(jù)集來優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù),可以從用大數(shù)據(jù)集訓(xùn)練的網(wǎng)絡(luò)中傳輸有用的信息。當(dāng)無法在任意環(huán)境和任意可能的配置下測量大量樣本時(shí),本文提出的優(yōu)化方法能夠有效地進(jìn)行波束選擇。
本文采用二維(two-dimensional, 2D)室內(nèi)幾何信道模型[19]。如圖1所示,在該模型中,發(fā)射機(jī)和接收機(jī)均配備均勻線性陣列(uniform linear arrays, ULA)天線。假設(shè)天線均水平放置,分別由Nt和Nr個(gè)陣元組成,陣元間隔為半波長,即d=λ/2。接收機(jī)隨機(jī)放置在位置pr=(xr,yr)的定義區(qū)域內(nèi),其方向?yàn)棣羠∈[0,2π)。
圖1 室內(nèi)2D幾何信道模型Fig.1 Indoor 2D geometric channel model
發(fā)射機(jī)和接收機(jī)之間的信道由一條視線路徑(line-of-sight, LOS)路徑和L條NLOS構(gòu)成,因此接收機(jī)在某一位置、某一時(shí)刻的信道矩陣可建模為
(1)
(2)
(3)
本文采用模擬波束賦形系統(tǒng),分別用F=[f1,f2,…,fNt]和W=[w1,w2,…,wNr]表示發(fā)射機(jī)的波束賦形碼本和接收機(jī)的波束結(jié)合碼本,為了簡單起見,設(shè)定每個(gè)碼本分別具有Nt和Nr個(gè)碼字。本文采用常見的基于離散傅里葉變換(discrete Fourier transform, DFT)的碼本[15]。因此,波束賦形向量和波束結(jié)合向量可分別表示為
(4)
(5)
式中:p∈{1,2,…,Nt},q∈{1,2,…,Nr}。在每個(gè)時(shí)隙上,根據(jù)預(yù)編碼器fp∈F和組合器wq∈W,接收信號(hào)功率R∈RNt×Nr可以表示為
(6)
利用環(huán)境中的先驗(yàn)信息有助于提高波束選擇的精度[12-15],同時(shí)減少匹配過程的延遲。先驗(yàn)信息可在訓(xùn)練階段從測試環(huán)境中感知提取。由于利用信道先驗(yàn)信息預(yù)測最佳波束對(duì)的過程存在非線性函數(shù)關(guān)系,且神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的學(xué)習(xí)非線性函數(shù)的能力。因此,可采用DNN來解決此類問題。但是,DNN需要采用大數(shù)據(jù)集來調(diào)整其參數(shù),但在每個(gè)環(huán)境中捕獲大量樣本會(huì)導(dǎo)致成本大幅度增加。TL是一種將大數(shù)據(jù)集場景的知識(shí)轉(zhuǎn)移到小數(shù)據(jù)集場景中使用的技術(shù),可以解決因?yàn)閿?shù)據(jù)集過小而導(dǎo)致神經(jīng)網(wǎng)絡(luò)無法得到充分訓(xùn)練這一問題。因此,本文將采用TL對(duì)小數(shù)據(jù)集情況下基于深度神經(jīng)網(wǎng)絡(luò)的波束選擇進(jìn)行優(yōu)化。具體優(yōu)化步驟如算法1所示,后續(xù)將對(duì)每一步進(jìn)行詳細(xì)介紹。
算法 1 基于TL的波束選擇優(yōu)化方法參數(shù)設(shè)定:設(shè)場景A對(duì)應(yīng)網(wǎng)絡(luò)為DNNA,數(shù)據(jù)集為DA;設(shè)場景B對(duì)應(yīng)網(wǎng)絡(luò)為DNNB,數(shù)據(jù)集為DB;其中DA為大型數(shù)據(jù)集,DB為小型數(shù)據(jù)集,并且DNNA和DNNB網(wǎng)絡(luò)層數(shù)和隱藏層神經(jīng)元個(gè)數(shù)都相等。1: 隨機(jī)初始化DNNA的權(quán)重 2: 使用DA對(duì)DNNA進(jìn)行訓(xùn)練3: 對(duì)目標(biāo)環(huán)境特征和用戶配置進(jìn)行判斷情況 1: B場景與A場景用戶配置相同,環(huán)境改變4-1: 使用訓(xùn)練后的DNNA的隱藏層和輸出層權(quán)重初始化DNNB的隱藏層和輸出層權(quán)重,凍結(jié)DNNB的輸出層權(quán)重使其不被訓(xùn)練,僅使用DB對(duì)其隱藏層權(quán)重進(jìn)行訓(xùn)練。情況 2: B場景與A場景用戶配置改變,為同一環(huán)境4-2: 使用訓(xùn)練后的DNNA的隱藏層權(quán)重初始化DNNB的隱藏層權(quán)重,DNNB的輸出層權(quán)重隨機(jī)初始化,凍結(jié)DNNB的隱藏層權(quán)重使其不被訓(xùn)練,使用DB僅對(duì)其輸出層權(quán)重進(jìn)行訓(xùn)練。5: DNNB訓(xùn)練完成。
由于TL是對(duì)神經(jīng)網(wǎng)絡(luò)的權(quán)重進(jìn)行遷移,因此,在本文中為了簡化模型,假設(shè)源域跟目標(biāo)域使用的神經(jīng)網(wǎng)絡(luò)層數(shù)和神經(jīng)元個(gè)數(shù)相同,該DNN參考結(jié)構(gòu)如圖2所示[15]。
圖2 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Network structure
該神經(jīng)網(wǎng)絡(luò)根據(jù)接收機(jī)的坐標(biāo)和方向來預(yù)測每個(gè)波束對(duì)產(chǎn)生最大接收信號(hào)強(qiáng)度(received signal strength, RSS)的概率。其中,輸入是接收機(jī)的位置(xr,yr)及其方向αr,每個(gè)輸出對(duì)應(yīng)于一個(gè)唯一的波束對(duì),因此共有NtNr個(gè)輸出。該網(wǎng)絡(luò)的隱藏層和輸出層分別使用tanh及Softmax函數(shù)作為非線性激活函數(shù)。如圖2所示,DNN的輸出O={oi,j|i=1,2,…,Nt;j=1,2,…,Nr}是關(guān)于輸入的非線性函數(shù),如
(7)
為了生成具有M個(gè)用戶點(diǎn)的環(huán)境訓(xùn)練數(shù)據(jù)集,本文采用式(6)計(jì)算設(shè)定場景中與每個(gè)用戶位置和方向相對(duì)應(yīng)的各個(gè)波束對(duì)的RSS,獲得大小為M的數(shù)據(jù)集,該數(shù)據(jù)集可以表示為D,每組數(shù)據(jù)中包含的信息有:神經(jīng)網(wǎng)絡(luò)輸入的向量(xr,yr,αr)和第m={1,2,…,M}個(gè)用戶相對(duì)應(yīng)的各個(gè)波束對(duì)的RSS。對(duì)于給定的位置和方向,神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)RSS最高的波束對(duì)。
TL旨在通過轉(zhuǎn)移不同但相關(guān)的源域中包含的知識(shí),提高目標(biāo)學(xué)習(xí)者在目標(biāo)域的表現(xiàn)。通過這種方式,可以減少構(gòu)建目標(biāo)學(xué)習(xí)者對(duì)大量目標(biāo)域數(shù)據(jù)的依賴。研究表明,TL具有多樣性,既可以跨領(lǐng)域也可以跨任務(wù)應(yīng)用,其目標(biāo)是分別在不同環(huán)境或不同任務(wù)之間轉(zhuǎn)移知識(shí)[16]。本文分別對(duì)跨領(lǐng)域和任務(wù)的兩種情況與所考慮場景進(jìn)行結(jié)合,提出以下兩種方案。
2.3.1 域自適應(yīng)
假設(shè)在一個(gè)環(huán)境中有一個(gè)大的測量數(shù)據(jù)集DA,將此環(huán)境稱為源域,假設(shè)在另一個(gè)環(huán)境中只有有限大小的數(shù)據(jù)集DB可供使用,將該環(huán)境稱為目標(biāo)域,兩種環(huán)境中的發(fā)射機(jī)和接收機(jī)分別有Nt和Nr個(gè)陣元。將源域中使用的深度神經(jīng)網(wǎng)絡(luò)定義為DNNA,該網(wǎng)絡(luò)有Nh個(gè)隱藏層,每個(gè)隱藏層有n個(gè)神經(jīng)元。由于該環(huán)境有大數(shù)據(jù)集DA可供使用,因此DNNA的權(quán)重可以用隨機(jī)值初始化,并通過標(biāo)準(zhǔn)反向傳播算法進(jìn)行訓(xùn)練。如果在目標(biāo)域中使用一個(gè)與DNNA具有相同網(wǎng)絡(luò)層數(shù)和神經(jīng)元的DNNB,則可以使用DNNA的訓(xùn)練權(quán)重W初始化DNNB,將源域中學(xué)習(xí)的信息傳輸?shù)侥繕?biāo)域,其中網(wǎng)絡(luò)的隱藏層可以理解為包含環(huán)境等先驗(yàn)信息,輸出層可以理解為包含用戶配置信息[12]。因?yàn)橛蜃赃m應(yīng)中環(huán)境不同,用戶配置相同,因此隱藏層的映射需要更新,輸出層的映射可以保留。故在仿真中可以凍結(jié)輸出層權(quán)重,僅使用DB訓(xùn)練隱藏層權(quán)重,凍結(jié)這些層減少了網(wǎng)絡(luò)中可訓(xùn)練參數(shù)的數(shù)量,這極大提高了使用小數(shù)據(jù)集訓(xùn)練時(shí)的性能。
2.3.2 任務(wù)自適應(yīng)
由于TL技術(shù)是對(duì)基于深度學(xué)習(xí)(deep learning, DL)的波束選擇方法的優(yōu)化,故本節(jié)將對(duì)基于TL的波束選擇與基于DL的無TL波束選擇方法進(jìn)行比較。為了評(píng)估域自適應(yīng)案例中的TL思想,設(shè)定兩種不同的2D室內(nèi)場景,一個(gè)為空闊房間(empty room, ER),一個(gè)為普通室內(nèi)房間(ordinary indoor room, OR)。
ER表示一個(gè)沒有任何障礙物的室內(nèi)環(huán)境,其大小為60 m×60 m。OR場景如圖3所示,設(shè)定該室內(nèi)場景中有6個(gè)靜態(tài)物體,包括4個(gè)墻壁和2個(gè)固定障礙物,動(dòng)態(tài)物體的數(shù)量λ可作調(diào)整[15]。用于信道建模的參數(shù)如表1所示。
圖3 OR場景Fig.3 OR scenario
表1 信道模型參數(shù)Table 1 Channel model parameters
仿真所用到的兩種室內(nèi)場景模型發(fā)射機(jī)均放置在距離左墻1 m處,室內(nèi)的接收器放置在任意位置。
在每個(gè)波束對(duì)的選擇過程中,根據(jù)2D齊次泊松點(diǎn)過程在房間內(nèi)繪制新的移動(dòng)對(duì)象,而靜態(tài)對(duì)象在所有環(huán)境實(shí)現(xiàn)中始終保持相同的位置和方向。設(shè)定移動(dòng)物體映射到2D平面的大小為0.35 m×0.6 m,以模擬室內(nèi)的行人,接收機(jī)隨機(jī)放置在房間內(nèi),與靜態(tài)物體和移動(dòng)物體沒有重疊。在這種情況下,由于房間內(nèi)有兩個(gè)尺寸為6 m×1 m的固定障礙物和其他移動(dòng)物體,因此部分或所有路徑可能會(huì)被阻塞。
高階反射路徑是指那些經(jīng)過物體多次反射后才能到達(dá)接收機(jī)路徑。根據(jù)成像理論,反射物體越大,反射路徑從給定物體到達(dá)接收機(jī)的概率越大[19]。由于在OR場景中,移動(dòng)對(duì)象比靜態(tài)對(duì)象小得多,因此,除了信號(hào)能量較小的高階路徑之外,有的反射路徑經(jīng)過多個(gè)移動(dòng)對(duì)象到達(dá)接收機(jī)的概率接近于零。鑒于此,在生成數(shù)據(jù)集的過程中可以忽略來自多個(gè)移動(dòng)對(duì)象的反射路徑,以減少射線跟蹤過程的計(jì)算時(shí)間。
仿真中,每個(gè)接收機(jī)的位置處均使用100條最強(qiáng)路徑來構(gòu)造信道響應(yīng)。通過計(jì)算每個(gè)用戶位置處每個(gè)波束對(duì)的RSS來生成數(shù)據(jù)集,并將該數(shù)據(jù)集隨機(jī)分成兩組:第一組包含80%的數(shù)據(jù),用于訓(xùn)練;另一組包含其余20%的數(shù)據(jù),用于評(píng)估遷移學(xué)習(xí)的性能。ER和OR中培訓(xùn)樣本分別是100 000和50 000。設(shè)定用于訓(xùn)練的神經(jīng)網(wǎng)絡(luò)有5個(gè)隱藏層,每個(gè)層有128個(gè)神經(jīng)元,為了防止過擬合,每個(gè)隱藏層設(shè)定10%的節(jié)點(diǎn)丟失率。使用具有50個(gè)epoch的Adam優(yōu)化器來訓(xùn)練神經(jīng)網(wǎng)絡(luò),訓(xùn)練樣本從32個(gè)逐漸增加到8 192個(gè)。此外,將每個(gè)波束對(duì)的標(biāo)簽轉(zhuǎn)換成一個(gè)向量,用來計(jì)算損失函數(shù)。仿真中將使用以下4種方法進(jìn)行評(píng)估。
(1) DNN:具有隨機(jī)權(quán)重初始化并在目標(biāo)數(shù)據(jù)集上進(jìn)行訓(xùn)練的DNN方法。
(2) DNN-TL:使用源權(quán)重初始化,并使用目標(biāo)數(shù)據(jù)集對(duì)所有層進(jìn)行微調(diào)的DNN方法。
(3) 域自適應(yīng)DNN-TL(DNN-TL-domain adaptation, DNN-TL-DA):使用源權(quán)重初始化,輸出層被凍結(jié),隱藏層使用目標(biāo)數(shù)據(jù)集進(jìn)行優(yōu)化,即域自適應(yīng)。
(4) 任務(wù)自適應(yīng)DNN-TL(DNN-TL-task adaptation, DNN-TL-TA)。使用源權(quán)重初始化,隱藏層被凍結(jié),隱藏層使用目標(biāo)數(shù)據(jù)集進(jìn)行優(yōu)化,即任務(wù)自適應(yīng)。
其中,方法(1)為基于DL的無TL波束選擇方法,方法(2)~方法(4)為3種不同的基于TL的波束選擇方法。
為了評(píng)估TL技術(shù)在域自適應(yīng)場景中的效果,設(shè)定源場景和目標(biāo)場景中TX和RX天線單元個(gè)數(shù)均為64個(gè)。使用100 000數(shù)據(jù)集DA將ER中的網(wǎng)絡(luò)DNNA作為源域進(jìn)行訓(xùn)練。為了在目標(biāo)域OR中微調(diào)DNNB,分別使用10 000數(shù)據(jù)集和50 000數(shù)據(jù)集DB評(píng)估目標(biāo)數(shù)據(jù)集對(duì)TL性能的影響。
在本文中,使用失配概率來評(píng)測這幾種方法的性能,其定義為不包含接收功率最高的波束對(duì)的最小概率,其表達(dá)式為
(8)
式中:B表示所有可能的波束對(duì)的集合;Sk表示排名前Nb的波束對(duì)。
圖4和圖5分別展示了處理OR中不同數(shù)據(jù)集時(shí)不同波束選擇方法的失配概率。當(dāng)采用較少數(shù)據(jù)集訓(xùn)練時(shí),使用TL技術(shù)可以顯著改善波束選擇性能,并且數(shù)據(jù)集越小,效果越好。這是因?yàn)橥ㄟ^使用528 384個(gè)參數(shù)凍結(jié)輸出層,可訓(xùn)練參數(shù)的數(shù)量從594 944減少到了66 560個(gè)。凍結(jié)約88%的權(quán)重有助于網(wǎng)絡(luò)更好地工作,尤其是在目標(biāo)域中訓(xùn)練樣本很少的情況下。
圖4 數(shù)據(jù)集10 000的域自適應(yīng)Fig.4 Domain adaptation of dataset 10 000
圖5 數(shù)據(jù)集50 000的域自適應(yīng)Fig.5 Domain adaptation of dataset 50 000
圖6和圖7展示了不同波束選擇方法可實(shí)現(xiàn)的頻譜效率。通過假設(shè)一個(gè)固定的信道相干時(shí)間,從系統(tǒng)的可實(shí)現(xiàn)速率中減去每個(gè)相干時(shí)間段用于波束選擇的信道資源比例即可得到。因此,有效頻譜效率可以定義為
(9)
式中:Ts和Tfr分別表示在波束選擇過程中掃描波束對(duì)所需的時(shí)間和固定信道響應(yīng)的一幀持續(xù)時(shí)間[14]。SNRp,q是波束對(duì)準(zhǔn)之后與選定波束對(duì)(p,q)相對(duì)應(yīng)的信噪比,其定義為
(10)
圖6 域自適應(yīng)的頻譜效率(數(shù)據(jù)集10 000)Fig.6 Spectrum efficiency of domain adaptation (dataset 10 000)
圖7 域自適應(yīng)的頻譜效率(數(shù)據(jù)集50 000)Fig.7 Spectrum efficiency of domain adaptation (dataset 50 000)
在仿真中,設(shè)定Tfr=20 ms,Ts=0.1 ms,可以通過改變候選波束列表大小來調(diào)整Nb。通過使用TL和凍結(jié)輸出層,在掃描波束對(duì)數(shù)相同的情況下,基于TL的方法獲得的頻譜效率明顯優(yōu)于DNN方法,并且數(shù)據(jù)集越小,頻譜效率提高越明顯。
TL在任務(wù)自適應(yīng)問題中的優(yōu)越性如圖8和圖9所示,其中任務(wù)是指在同一環(huán)境中使用不同天線配置進(jìn)行波束選擇。
圖8 數(shù)據(jù)集10 000的任務(wù)自適應(yīng)Fig.8 Task adaptation of dataset 10 000
圖9 數(shù)據(jù)集50 000的任務(wù)自適應(yīng)Fig.9 Task adaptation of dataset 50 000
在環(huán)境OR中,使用分別具有64個(gè)和16個(gè)天線陣元的TX和RX來捕獲大型數(shù)據(jù)集DA。在相同的環(huán)境中,收集一個(gè)小型數(shù)據(jù)集DB,其中TX和RX均有64個(gè)天線陣元。如圖8和圖9所示,TL在小數(shù)據(jù)集下,通過凍結(jié)隱藏層,能夠有效的改善失配概率。
在室內(nèi)毫米波通信中,可以使用DNN方法,充分學(xué)習(xí)環(huán)境信息,來實(shí)現(xiàn)波束選擇,但有限的數(shù)據(jù)集使DNN不能高效地進(jìn)行波束精確匹配?;诖?本文利用TL技術(shù)對(duì)深度機(jī)器學(xué)習(xí)進(jìn)行優(yōu)化,其中引入?yún)?shù)重用方法,可以顯著降低執(zhí)行基于位置和方向的波束選擇的神經(jīng)網(wǎng)絡(luò)對(duì)于大訓(xùn)練數(shù)據(jù)集的依賴。此外,在目標(biāo)環(huán)境或者目標(biāo)天線配置中使用小數(shù)據(jù)集對(duì)不同層的網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),可使經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)權(quán)重在其他傳播環(huán)境或目標(biāo)天線設(shè)置中有效重用。仿真結(jié)果表明,本文提出的基于TL的室內(nèi)波束選擇優(yōu)化方法能夠有效提高有限數(shù)據(jù)集下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果。