周城宏,錢衛(wèi)平,郭永強
(北京跟蹤與通信技術(shù)研究所,北京 100094)
雷達系統(tǒng)中的認知控制策略
周城宏,錢衛(wèi)平,郭永強
(北京跟蹤與通信技術(shù)研究所,北京100094)
摘要:人類大腦通過認知控制來增強對周圍環(huán)境的感知能力,雷達在探測和測量的過程中通過控制系統(tǒng)對自身狀態(tài)的調(diào)節(jié)來增強工作性能;將認知控制引入雷達系統(tǒng)有助于雷達的智能化;基于如上出發(fā)點,首先概述了認知控制的研究狀況和概念,類比了大腦認知系統(tǒng)和工程認知動態(tài)系統(tǒng)的共通之處,隨后建立了認知控制的數(shù)學模型,將其歸結(jié)為系統(tǒng)熵態(tài)的最優(yōu)估計問題和最優(yōu)控制問題,最后將認知控制策略引入雷達對目標的感知過程中。
關(guān)鍵詞:認知控制;認知動態(tài)系統(tǒng);信息缺失;雙態(tài)模型;系統(tǒng)熵態(tài)
本文引用格式:周城宏,錢衛(wèi)平,郭永強.雷達系統(tǒng)中的認知控制策略[J].四川兵工學報,2015(12):99-102.
Citation format:ZHOU Cheng-hong,QIAN Wei-ping, GUO Yong-qiang.Cognitive Control Strategy in Radar System[J].Journal of Sichuan Ordnance,2015(12):99-102.
Cognitive Control Strategy in Radar System
ZHOU Cheng-hong,QIAN Wei-ping, GUO Yong-qiang
(Beijing Institute of Tracking and Telecommunications Technology, Beijing 100094, China)
Abstract:Human brain enhances the perception of environment by cognitive control, and similarly, radar control system adjusts state parameters to improve the detection performance. It is promising to introduce cognitive control into radar system to promote the intelligentization of radar. Based on the above background, the concept and research status of cognitive control in psychology and neuroscience were overviewed, and the similarity between human brain and cognitive dynamic system was discussed. Subsequently, a mathematical model of cognitive control was constructed, which can be equal to the optimal estimation and optimal control of entropic state. Finally the strategy of cognitive control in radar was put forward.
Key words:cognitive control; cognitive dynamic system; information gap; two-state model; entropic state
認知控制的概念起源于心理學和神經(jīng)心理學。1959年Gardner第一次使用認知控制,用來描述認知過程中的控制原理并解釋相關(guān)任務實驗結(jié)果。隨后1972年Hammond和 Summers提出 “人在執(zhí)行認知任務中涉及知識獲取和對已獲得知識的認知控制兩個不同過程”的觀點,認為在認知任務和精神分析任務中知識的獲取和應用是相互獨立獨立的認知過程環(huán)節(jié),并從理論上引入認知控制的概念,用以闡述其在關(guān)于人類學習、判斷和人際活動研究中的重要作用[1]。2005年,Brass從認知心理學的角度給出認知控制的定義,“認知控制過程指的是我們根據(jù)內(nèi)在的目標協(xié)調(diào)思想和行動的能力”[2]。2009年,Kouneiher提出“認知控制在神經(jīng)層面可以看做個體對其行為可能導致的后果和已經(jīng)導致的后果進行評估的結(jié)果”[3]。此后2010年,F(xiàn)eldman和Friston在神經(jīng)心理學中引入環(huán)境的概率分布表示觀點,認為大腦系統(tǒng)可通過注意來優(yōu)化環(huán)境的概率表示,以便減少環(huán)境感知的熵,實現(xiàn)不確定性的降低[4]。在人類大腦認知系統(tǒng)中,知覺的作用在于從噪聲環(huán)境獲取的觀測量中提取出有效信息。大腦針對知覺信息通過采取應對行為來保持對環(huán)境信息的連續(xù)最優(yōu)獲取,這樣的應對行為即為認知行動。例如,人類視知覺系統(tǒng)在黑暗環(huán)境中對物體無法準確識別,大腦通過放大瞳孔的認知行動來緩和對環(huán)境感知的不確定程度,此外,在條件允許的特定情況下也會通過開燈、開手電筒等決策行為應對。
1認知動態(tài)系統(tǒng)
認知動態(tài)系統(tǒng)是Fuster在人類大腦認知系統(tǒng)研究中提出的概念,用以描述視知覺中的知覺動作反饋過程,包含知覺動作回路(Perception-action cycle)、記憶(Memory)、注意(Attention)和智能(Intelligence)等基本要素[5]。知覺動作回路是大腦知覺系統(tǒng)的結(jié)構(gòu)基礎(chǔ),如圖1所示。在大腦視知覺系統(tǒng)中,皮質(zhì)感覺區(qū)感知認知任務(環(huán)境)的視覺刺激,隨后皮質(zhì)運動區(qū)獲得感覺區(qū)的信息反饋,通過認知行動的調(diào)節(jié)作用來適應環(huán)境以實現(xiàn)環(huán)境信息的最大獲取。
圖1 大腦知覺系統(tǒng)(左)和認知動態(tài)系統(tǒng)(右)基本結(jié)構(gòu)
認知動態(tài)系統(tǒng)是對大腦知覺系統(tǒng)的高度抽象,控制器的調(diào)節(jié)行為依賴于知覺器感知環(huán)境后的信息反饋,知覺器的信息獲取包含對環(huán)境狀態(tài)的測量與估計,控制器的響應則涉及系統(tǒng)的最優(yōu)控制。通過知覺動作回路的作用,認知動態(tài)系統(tǒng)最大限度地實現(xiàn)與動態(tài)環(huán)境的交互融合[6-9]。認知系統(tǒng)通過記憶存儲知覺過程、反饋回路、控制過程中所獲取的知識與經(jīng)驗,并反過來輔助、促進各過程中知識的獲取、經(jīng)驗的提升以及模塊功能的完善。注意以及智能,以算法的方式整合在知覺動作回路之中,保障控制功能的最佳實現(xiàn)。
通過類比將認知動態(tài)系統(tǒng)引入雷達系統(tǒng),可構(gòu)建具有人類認知特性的智能雷達系統(tǒng)。在工程背景下,環(huán)境信息通過測量過程流入知覺器,知覺器利用貝葉斯估計實現(xiàn)信息提取,信息反饋路徑將知覺器與控制器聯(lián)系一起,控制器在優(yōu)化算法下執(zhí)行最佳控制,控制系統(tǒng)的閉環(huán)回路由此形成。工程系統(tǒng)中的知覺動作回路是認知控制的基本結(jié)構(gòu),記憶、注意與智能等特性通過存儲器、體制結(jié)構(gòu)和智能算法等實現(xiàn)。
2量測信息的度量模型
測量信息由傳感器在噪聲環(huán)境中直接測量獲得,包含有效信息和環(huán)境噪聲、干擾等因素引入的無用信息;將測量空間向信息空間的投影,可提取有效信息,分為與當前任務需求緊密聯(lián)系的相關(guān)信息和與之無關(guān)的冗余信息;在最小風險意義下,執(zhí)行當前任務所需的信息為充分信息,相關(guān)信息是充分信息與有效信息的交集;充分信息中無法通過測量獲取的部分,即充分信息與相關(guān)信息的差集為信息缺失(Information gap)[11],如圖2所示。
圖2 信息缺失概念示意圖
工程系統(tǒng)中的認知控制可由如下定義給出:假設(shè)存在一個擁有知覺動作回路結(jié)構(gòu)的類人腦隨機動力系統(tǒng),認知控制的功能就是調(diào)節(jié)從系統(tǒng)知覺部分向其執(zhí)行部分流動的信息流,從而在最小風險意義下縮減當前任務的信息缺失。
系統(tǒng)雙態(tài)模型的思想為用系統(tǒng)狀態(tài)和系統(tǒng)熵態(tài)表征系統(tǒng)信息特征。系統(tǒng)狀態(tài)是系統(tǒng)信息的表征,是經(jīng)典測量操作下的不變量(非量子理論體系);系統(tǒng)熵態(tài)是信息缺失的度量,是系統(tǒng)不確定度的表征。
2.2.1狀態(tài)空間模型
在給定時刻,系統(tǒng)狀態(tài)表征當前時刻的系統(tǒng)信息,同理,狀態(tài)隨時間的變化表征系統(tǒng)的演化行為。系統(tǒng)的真實狀態(tài)無法直接獲取,只能通過噪聲環(huán)境下的觀測量間接估計,如在先驗信息條件下的貝葉斯估計。對系統(tǒng)的先驗認識可體現(xiàn)在狀態(tài)空間模型(State-space model)如圖3所示,包含描述系統(tǒng)演化的狀態(tài)方程和刻畫系統(tǒng)狀態(tài)獲取的量測方程。
圖3 狀態(tài)空間模型
狀態(tài)方程
xn離散時間系統(tǒng)狀態(tài)為馬爾科夫序列,狀態(tài)方程表示從n時刻到n+1時刻的狀態(tài)轉(zhuǎn)移,n表示離散時間,狀態(tài)轉(zhuǎn)移取決于轉(zhuǎn)移函數(shù)、當前狀態(tài)和系統(tǒng)噪聲,其中an(.,.)為狀態(tài)轉(zhuǎn)移函數(shù),xn為當前狀態(tài),xn+1為下一時刻狀態(tài),ωn為系統(tǒng)噪聲。如果系統(tǒng)噪聲為加性噪聲,則狀態(tài)方程可簡化為xn+1=an(xn)+ωn;如果狀態(tài)轉(zhuǎn)移為線性函數(shù),xn+1=An+1,nxn+ωn,系統(tǒng)方程可簡化為線性方程,其中An+1,n為狀態(tài)轉(zhuǎn)移矩陣;如果ωn為高斯過程,則狀態(tài)方程為線性高斯系統(tǒng),協(xié)方差矩陣可記為Qω,n。
量測方程:
yn表示目標狀態(tài)量測量,量測結(jié)果決定于量測函數(shù)、當前狀態(tài)、量測噪聲,其中bn(.,.)為量測函數(shù),vn為測量噪聲。若量測噪聲為加性噪聲,則量測方程可簡化為xn+1=bn(xn)+vn;若量測過程為線性函數(shù),則量測方程可簡化為xn+1=Bnxn+vn,其中Bn為量測矩陣;若vn為高斯隨機過程,協(xié)方差矩陣可記為Rv,n,則量測方程為線性高斯的。
2.2.2系統(tǒng)熵態(tài)模型
由于系統(tǒng)本身、測量環(huán)節(jié)等存在一定程度的不確定性,因而系統(tǒng)的狀態(tài)和觀測量均用隨機變量表征。系統(tǒng)狀態(tài)即為一個概率分布,實際觀測結(jié)果即為觀測變量的實現(xiàn)。狀態(tài)的獲得需通過噪聲環(huán)境下的測量,反之,可通過測量結(jié)果來估計系統(tǒng)狀態(tài)的后驗概率分布。信息缺失的概念刻畫了系統(tǒng)狀態(tài)的不確定程度,信息論中不確定度可由概率分布的全局量——熵表征,因而信息缺失可由系統(tǒng)熵態(tài)刻畫,可定義為系統(tǒng)狀態(tài)后驗分布的Shannon熵。
若xn表示系統(tǒng)n時刻狀態(tài),p(xn)表示系統(tǒng)狀態(tài)的先驗概率分布,當獲得n時刻觀測量yn后,p(xn|n)表示該時刻系統(tǒng)狀態(tài)的后驗概率分布,該時刻系統(tǒng)熵態(tài)Hn|n定義為p(xn|n)的Shannon熵:
xn是隨機變量,Yn是觀測集{y1,y2,…,yn}。
3認知控制模型
雷達認知控制的基本思想在于通過控制系統(tǒng)實時調(diào)整自身狀態(tài)來減小目標測量過程中的信息缺失。因而認知控制可以歸結(jié)為兩個子問題,即系統(tǒng)熵態(tài)的最優(yōu)估計和系統(tǒng)熵態(tài)的最優(yōu)控制。
系統(tǒng)熵態(tài)是系統(tǒng)狀態(tài)后驗概率分布的Shannon熵,因而系統(tǒng)熵態(tài)的估計取決于系統(tǒng)狀態(tài)的感知。系統(tǒng)狀態(tài)的感知過程是對系統(tǒng)狀態(tài)進行獲取和估計的過程。狀態(tài)獲取結(jié)果為傳感器觀測集,是觀測隨機變量的實現(xiàn);狀態(tài)估計可通過最小方差、最大似然、最小二乘等思想實現(xiàn),然而,在具備系統(tǒng)狀態(tài)先驗信息的情況下,可通過貝葉斯估計在最小風險函數(shù)意義下實現(xiàn)最優(yōu)估計。一般可采取最小平均風險函數(shù)意義下的貝葉斯估計。對于最小均方差準則,加性高斯白噪聲下的線性系統(tǒng),貝葉斯濾波器簡化為卡爾曼濾波器;對于非線性高斯系統(tǒng),貝葉斯濾波器可通過EKF、UKF或CKF等近似實現(xiàn);非線性非高斯系統(tǒng)則選用Monte Carlo粒子濾波器。狀態(tài)估計的準確程度取決于系統(tǒng)狀態(tài)的后驗不確定度,即信息缺失量,系統(tǒng)熵態(tài)可用系統(tǒng)狀態(tài)的后驗概率分布的Shannon熵表示。獲得系統(tǒng)狀態(tài)后驗概率分布后,通過降低信息缺失來增強狀態(tài)估計性能的最優(yōu)控制是認知控制的基本思想。
在認知控制結(jié)構(gòu)中,認知行動可直接作用于環(huán)境,從而間接影響知覺器的知覺過程,例如辨識在黑暗環(huán)境中的物體,開燈的行為便是通過改變環(huán)境提升對物體的知覺;認知行動也可作用于系統(tǒng)本身,例如改變傳感器等結(jié)構(gòu)的自身配置,在黑暗環(huán)境放大瞳孔來增加物體反射光的接收,認知雷達通過調(diào)整發(fā)射波形來改善當前目標探測性能;物理行動同樣能夠作用于系統(tǒng),例如挪近物體位置有助于黑暗環(huán)境中物體辨識。
假設(shè)雷達的狀態(tài)可由參數(shù)集Λ表征,其中Λ={λk|k=1,2,…,n},λk為表征雷達系統(tǒng)狀態(tài)的參數(shù),如載頻、帶寬、極化、功率、天線、波形等所有相關(guān)參量,雷達在n時刻發(fā)射的信號可由Λn表征,在雷達目標與環(huán)境的共同電磁散射作用下得到觀測量yn,隨之得到系統(tǒng)熵態(tài)Hn|n,因此Hn|n~Λn,因此在模型Hn|n(Λ)下求解Λ使得
如上的參數(shù)調(diào)整過程即為圖4中認知控制器對系統(tǒng)的認知行動作用,雷達通過認知控制過程調(diào)整到優(yōu)化發(fā)射狀態(tài)后執(zhí)行對目標的量測過程。本質(zhì)上,Hn|n是控制過程的目標函數(shù),而Λ是控制變量。
圖4 認知動態(tài)系統(tǒng)中的認知控制結(jié)構(gòu)
認知控制中,可將系統(tǒng)熵態(tài)定義為Hn|n,表示獲取第n個觀測量后確定的系統(tǒng)不確定度。與系統(tǒng)狀態(tài)不同,系統(tǒng)熵態(tài)無法直接控制。例如,目標的位置與期望存在一定偏差,可直接改變目標位置進行補償;然而目標的熵態(tài)與期望一定偏差,則無法直接減少目標狀態(tài)不確定度,只能通過其他量間接控制。此外,系統(tǒng)熵態(tài)的減小,不僅僅要在局部實現(xiàn),更要在全局實現(xiàn)。即在n時刻獲得觀測量后,通過采取控制行為,在降低n+1時刻系統(tǒng)熵態(tài)的同時,也要降低n+1之后所有時刻的系統(tǒng)熵態(tài)。
4結(jié)論
認知控制來源于心理學與神經(jīng)科學,尚未在工程領(lǐng)域得到廣泛應用。認知控制模擬人類認知系統(tǒng),是以降低信息缺失為基本思想的信息控制方法。本文在對認知心理學和認知神經(jīng)科學中大腦認知控制研究加以分析的基礎(chǔ)上,通過類比將人類認知控制過程引入雷達系統(tǒng),構(gòu)建了信息缺失最小化的認知控制模型,并將問題轉(zhuǎn)化為系統(tǒng)熵態(tài)的最優(yōu)估計與控制,最終對認知控制在雷達系統(tǒng)中的作用進行了分析論述。認知控制是一種融合認知、信息與控制的新思維方法,在智能雷達系統(tǒng)中將有極大需求和應用。
參考文獻:
[1]Hammond K R,Summers D A.Cognitive control[J].Psychological review,1972,79(1):58.
[2]Brass M,Derrfuss J,Forstmann B,et al.The role of the inferior frontal junction area in cognitive control[J].Trends in cognitive sciences,2005,9(7):314-316.
[3]Kouneiher F,Charron S,Koechlin E.Motivation and cognitive control in the human prefrontal cortex[J].Nature neuroscience,2009,12(7):939-945.
[4]Feldman H,Friston K J.Attention,uncertainty,and free-energy[J].Frontiers in human neuroscience,2010(4):17-21.
[5]Fuster J M.Cortex and mind:Unifying cognition[M].Oxford university press,2003.
[6]Haykin S,Xue Y,Setoodeh P.Cognitive radar:Step toward bridging the gap between neuroscience and engineering[J].Proceedings of the IEEE,2012,100(11):3102-3130.
[7]Haykin S,Fatemi M,Setoodeh P,et al.Cognitive control[J].Proceedings of the IEEE,2012,100(12):3156-3169.
[8]Haykin S.Cognitive radio:brain-empowered wireless communications[J].Selected Areas in Communications,IEEE Journal on,2005,23(2):201-220.
[9]Haykin S.Cognitive dynamic systems:Perception-Action cycle,radar and radio[M].Cambridge University Press,2012.
[10]Ben-Haim Y.Information-gap decision theory:decisions under severe uncertainty[M].Academic Press,2001.
[11]Arasaratnam I,Haykin S.Cubature kalman filters[J].Automatic Control,IEEE Transactions on,2009,54(6):1254-1269.(責任編輯周江川)
【信息科學與控制工程】
中圖分類號:TN95
文獻標識碼:A
文章編號:1006-0707(2015)12-0099-04
doi:10.11809/scbgxb2015.12.025
作者簡介:周城宏(1989—),男,碩士研究生,主要從事認知雷達體制與技術(shù)和動態(tài)目標的電磁散射研究。
收稿日期:2015-06-01