特邀策劃人
李艷斌
博士,中國電子科技集團公司第五十四研究所研究員。
暢鑫
博士,中國電子科技集團公司第五十四研究所高級工程師。
劉東輝
博士,石家莊鐵道大學管理學院講師,長期從事復雜系統(tǒng)管理、策略優(yōu)化等領域的研究。獲評中國地質大學(北京)優(yōu)秀博士學位論文,在國內外期刊和會議發(fā)表論文15 篇,其中,以第一作者發(fā)表SCI / SSCI 論文5 篇。主研河北省教育廳青年基金項目1 項,擔任Nonlinear Dynamics,International Journal of Financial Research,Complexity 等國際期刊審稿人。
馬宏斌
博士,航天工程大學電子與光學工程系、智能化航天測運控教育部重點實驗室講師。長期從事人工智能、電磁頻譜感知等領域的研究,在國內外期刊和會議發(fā)表論文10 篇,其中,SCI 論文8 篇,會議優(yōu)秀論文1 篇,授權發(fā)明專利21 項,擔任IEEE Signal Letters,SignalImage and Video Processing 等期刊審稿人。
內容導讀
隨著Alpha Go 在圍棋領域擊敗李在石奪冠、Alpha Star 在復雜的“星際爭霸2”游戲中完勝職業(yè)選手、深度強化學習支撐在托卡馬克裝置內保持核聚變等離子體穩(wěn)定驚艷全球,這些里程碑事件展示了基于人工智能的決策技術在各種實時、動態(tài)和復雜環(huán)境下的驚人表現,從而證明了其在決策制定方面的巨大潛力。在各個領域中,基于人工智能的決策技術都具有革命性的潛力。在無人駕駛領域,智能系統(tǒng)可以根據路況和環(huán)境實時做出決策,提高交通安全性和效率。在頻譜管控方面,人工智能可以優(yōu)化無線電頻譜的利用,提高通信網絡的性能。在智慧醫(yī)療領域,人工智能可以幫助醫(yī)生做出更準確的診斷和治療建議,提高醫(yī)療服務的質量和效率。在指揮控制領域,人工智能可以輔助軍事人員及時做出決策,應對各種復雜情況。因此,推動智能決策技術的發(fā)展是將我國建成人工智能領域的領先國家和全球創(chuàng)新中心的重要方向之一。
在當今所處的大數據時代,智能決策技術能夠充分地利用海量數據分析、挖掘和探索內在機理,解決動態(tài)復雜場景下的多目標優(yōu)化和多智能體的協(xié)同管控等問題。為集中展現基于人工智能的決策技術的最新研究成果,《無線電工程》第6 期推出“基于人工智能的決策技術”專題。專題采用公開征稿的方式組織稿件,在所有通過專家評審的稿件中,最終確定錄用稿件7 篇。專題主要展示了通信輻射源識別、協(xié)作頻譜感知、解決獎賞稀疏性問題、多智能體協(xié)同能力提升、基于LEO 衛(wèi)星網絡的切換判決、電力物聯(lián)網動態(tài)切片策略和車聯(lián)網資源分配等研究成果。
在通信輻射源識別方面收錄1 篇論文。作為電磁頻譜決策和管控的重要環(huán)節(jié),王育欣等介紹了開源輻射源識別數據集,綜述了基于知識驅動和基于數據驅動的輻射源個體識別技術研究現狀,剖析了當前深度學習在輻射源個體識別領域面臨的問題,指引了未來輻射源個體識別的發(fā)展方向。
在協(xié)作頻譜感知方面收錄1 篇論文。為解決多節(jié)點協(xié)作頻譜感知引起的全局決策延遲問題,劉春玲等提出節(jié)點評估與選擇和網格搜索的強化學習算法。先通過節(jié)點評估與選擇算法阻止惡意用戶參與協(xié)作頻譜感知,再基于網格搜索的強化學習機制搜索出所有可能的參數組合。仿真結果表明,該方法與其他算法相比,在提高檢測概率的同時,解決了全局決策延遲的問題。
在解決多智能體策略生成獎賞稀疏性問題的理論研究方面收錄1 篇論文。針對特定策略如何快速產生對抗策略這一問題,劉東輝等基于靜態(tài)博弈理念,對馬爾科夫決策過程演化,以對抗結果作為目標函數,基于動作集合優(yōu)化目標函數,對策略優(yōu)化問題進行數學建模。相比于經典多智能體強化學習方法,本方法能夠針對特定策略高效產生多智能體對抗策略。
在提升多智能體協(xié)同能力的理論研究方面收錄1 篇論文。針對典型多智能體博弈對抗策略生成框架缺乏從整體角度對子策略的協(xié)同控制的問題,暢鑫等基于分層強化學習提出改進方法。構造融合觀測信息的頂層策略控制模型,完成控制信息的映射?;陂_源對抗場景的實驗結果表明,該策略生成方法對于多智能體協(xié)同對抗效果提升明顯。
在基于LEO 衛(wèi)星網絡的切換判決方面收錄1 篇論文。張英健等結合LEO 衛(wèi)星網絡切換判決方法研究進展,綜述了切換判決方法。歸納了常用的圖論模型切換判決方法??偨Y了機器學習在LEO 衛(wèi)星網絡切換判決中的應用。結合常用評價性能指標對不同切換判決方法進行了對比分析。對未來LEO 衛(wèi)星網絡切換研究值得關注的問題進行了展望,為后續(xù)相關研究提供解決思路。
在電力物聯(lián)網動態(tài)切片策略研究方面收錄1 篇論文。辛銳等研究了動態(tài)網絡場景下的切片策略,基于深度強化學習算法求解虛擬網絡功能部署和業(yè)務傳輸路由確定這一復雜聯(lián)合優(yōu)化問題,實驗證明所提策略能根據目前的網絡狀態(tài)靈活地改變部署方案,控制業(yè)務路由平均能量損耗、平均可靠性和平均剩余帶寬占有率,提高了網絡整體傳輸性能。
在車聯(lián)網資源分配方面收錄1 篇論文。孟水仙等為解決車輛高速移動性和全局狀態(tài)信息獲取困難等問題,提出了一種基于完全分布式多智能體深度強化學習的資源分配算法。引入共享經驗池機制、長短期記憶網絡、卷積神經網絡和殘差網絡結合增強算法的準確性和預測能力。實驗結果表明,所提出的算法能夠滿足車對基礎設施鏈路的高吞吐量以及車對車鏈路的低延遲要求,并且對環(huán)境變化表現出良好的適應性。
綜上所述,專題收錄的7 篇論文,分別針對特定的研究問題,從理論研究和工程應用維度,多個視角展示了當前基于人工智能的決策技術的進展,得到了有意義的研究結論,能夠提供較好的參考作用。當然,這些論文也不能窮盡智能通信技術各方面的進展,希望通過這些論文的刊出,讓更多的專家學者和研究人員關注該領域的發(fā)展,從而促進產生更多的研究成果。
最后,感謝參與稿件評審的各位專家學者的辛勤工作,衷心希望專題的出版能夠對基于人工智能的決策技術研究起到有益的作用。