邱建文,徐 瑞,趙宇庭
(1. 中廣核研究院北京分院,北京 100086; 2. 北京理工大學(xué)宇航學(xué)院,北京 100081;3.深空自主導(dǎo)航與控制工信部重點(diǎn)實(shí)驗(yàn)室,北京 100081)
能源是航天領(lǐng)域的一個(gè)核心問(wèn)題,目前航天器的主要能源是化學(xué)能、太陽(yáng)能和核能。在深空探測(cè)任務(wù)中,尤其需要能適應(yīng)復(fù)雜惡劣的空間環(huán)境、在無(wú)人干預(yù)的情況下可以穩(wěn)定供能的能量來(lái)源。化學(xué)能和太陽(yáng)能的固有缺陷,令其應(yīng)用在空間的潛力十分有限[1]。使用化學(xué)能需要占用大量的質(zhì)量和空間,太陽(yáng)能受到行星環(huán)境和與太陽(yáng)距離的影響,在沙塵等環(huán)境中太陽(yáng)能板難以接受能量,而木星及以遠(yuǎn)空間的太陽(yáng)常數(shù)過(guò)低,利用太陽(yáng)能發(fā)電效率低下。核反應(yīng)堆芯具有小體積、大功率、可變大小、長(zhǎng)壽命等特點(diǎn),是目前地球上最高能量密度的可用資源[2-3]。在已有的深空探測(cè)任務(wù)中,美國(guó)的“旅行者號(hào)”(Voyager)、“新視野號(hào)”(New Horizons)、“好奇號(hào)”(Curiosity)等深空探測(cè)器均采用了同位素核電源。美國(guó)國(guó)家航空航天局(NASA)計(jì)劃在2030年利用核能實(shí)現(xiàn)載人登陸火星,NASA已經(jīng)與Ad Astra公司簽訂協(xié)議,在國(guó)際空間站上進(jìn)行核能發(fā)動(dòng)機(jī)的試驗(yàn)飛行,Ad Astra公司也提出了使用200 MW核反應(yīng)堆的短期載人往返火星的概念[4],圖1為核動(dòng)力火星飛船示意圖。由此可見(jiàn),核動(dòng)力必將成為發(fā)展深空探測(cè)的戰(zhàn)略性能源選擇,在國(guó)防需求推動(dòng)下快速發(fā)展。
隨著近些年來(lái)核電事業(yè)的發(fā)展,尤其福島事故后隨著對(duì)核電安全要求的提高,小型反應(yīng)堆因?yàn)榱己玫陌踩O(shè)計(jì)理念、結(jié)構(gòu)簡(jiǎn)單的特點(diǎn),能滿足中小型電網(wǎng)的供電、制氫、城市供熱、工業(yè)工藝供熱、混合清潔能源和海水淡化等特殊應(yīng)用要求的優(yōu)勢(shì),引起了研發(fā)和建設(shè)熱潮。商用小型堆發(fā)展為空間堆應(yīng)用提供了堅(jiān)實(shí)基礎(chǔ)。
按照國(guó)際原子能機(jī)構(gòu)(IAEA)的定義,小型反應(yīng)堆的電功率在300 MWe以下。小型反應(yīng)堆主要有輕水堆、高溫氣冷堆、液態(tài)金屬反應(yīng)堆、熔鹽堆等類型。模塊化小型堆是目前優(yōu)先開(kāi)發(fā)的方向。世界各國(guó)近期開(kāi)發(fā)的典型小型堆如表1所示[5]。
圖1 Ad Astra 200 MW載人火星飛船示意圖Fig.1 A schematic map of the Ad Astra 200 MW manned Mars spacecraft
序號(hào)堆型名稱設(shè)計(jì)公司國(guó)別發(fā)電能力/MWe設(shè)計(jì)狀態(tài)1System Integrated Modular Advanced Reactor (SMART)Korea Atomic Energy Research Institute俄羅斯1002012年7月4日收到標(biāo)準(zhǔn)設(shè)計(jì)批準(zhǔn)2mPowerB&W GenerationmPower美國(guó)180/module2015年申請(qǐng)?jiān)O(shè)計(jì)認(rèn)證3NuScaleNuScale Power Inc.美國(guó)50/module(gross)2016年中申請(qǐng)?jiān)O(shè)計(jì)認(rèn)證4ACP100CNNC/NPIC中國(guó)100詳細(xì)設(shè)計(jì),2016年開(kāi)始建設(shè)
反應(yīng)堆自主控制的需求主要體現(xiàn)在兩個(gè)方面:
1)經(jīng)濟(jì)競(jìng)爭(zhēng)力需求??臻g堆的投資成本和日常管理成本決定了其經(jīng)濟(jì)競(jìng)爭(zhēng)力,實(shí)現(xiàn)自主控制能降低反應(yīng)堆對(duì)人工管理的需求,節(jié)約成本。
2)空間反應(yīng)堆本身自主控制需求。由于深空探測(cè)器遠(yuǎn)離地球,具有很長(zhǎng)的通信時(shí)延,傳統(tǒng)的控制技術(shù)依賴地面人員決策,探測(cè)器上搭載設(shè)備均需要自主控制??臻g反應(yīng)堆作為能量來(lái)源,是深空探測(cè)器的重要組成部分,需要實(shí)現(xiàn)自主控制,保證設(shè)備的長(zhǎng)期可靠運(yùn)行。小型模塊化堆有運(yùn)行靈活、生產(chǎn)能力模塊化配置的優(yōu)勢(shì),適于實(shí)現(xiàn)空間中的自主控制。
目前的反應(yīng)堆控制大多是自動(dòng)化控制,無(wú)法滿足深空探測(cè)器空間堆對(duì)自主性的需求,如何提高自主程度,從“自動(dòng)化控制”到“自主控制”,是問(wèn)題的關(guān)鍵。
機(jī)器人、運(yùn)輸、航天等領(lǐng)域中已采用了不同自主程度的控制系統(tǒng)。理想的自主控制具有智能性、魯棒性、優(yōu)化性、靈活性、適應(yīng)性和可靠性等特性。雖然各領(lǐng)域所實(shí)現(xiàn)的自主程度和特定的控制算法不同,但對(duì)反應(yīng)堆自主控制系統(tǒng)關(guān)鍵特性和先進(jìn)自主功能架構(gòu)實(shí)現(xiàn)都有參考價(jià)值。
核反應(yīng)堆上應(yīng)用自主控制面臨下述挑戰(zhàn):1)在運(yùn)核電站還沒(méi)有實(shí)現(xiàn)自主控制;2)目前正在研發(fā)的先進(jìn)概念反應(yīng)堆,也沒(méi)有自主控制應(yīng)用的研究;3)當(dāng)前核電站的自動(dòng)化控制技術(shù)都相當(dāng)成熟,高度自動(dòng)化控制也足以應(yīng)對(duì)最理想工況;4)在當(dāng)前技術(shù)水平下,降質(zhì)、故障和其他非正常事件等非最理想工況反應(yīng)堆性能、以及直接人工干預(yù)能力受到限制;5)在核電特殊運(yùn)行區(qū)域,自主控制功能的開(kāi)發(fā)和示范還存在著明顯差距。
國(guó)內(nèi)核電廠的儀表與控制系統(tǒng)在全世界具有代表性。按照技術(shù)沿革,各核電廠的技術(shù)情況如表2所示。
核反應(yīng)堆的儀表與控制系統(tǒng)由測(cè)量系統(tǒng)、控制(調(diào)節(jié))系統(tǒng)、反應(yīng)堆保護(hù)系統(tǒng)、專設(shè)安全設(shè)施等組成[6]。核電廠數(shù)字化分布式儀表與控制系統(tǒng)總體縱向分為四層。
1)現(xiàn)場(chǎng)級(jí)(輸入/輸出層):執(zhí)行過(guò)程輸入和輸出功能。本級(jí)是系統(tǒng)級(jí)與核電站工藝設(shè)備之間信號(hào)傳遞的橋梁。
表2 國(guó)內(nèi)核電廠的儀表與控制系統(tǒng)Table 2 Instrumentation and control system of nuclear power plants in China
2)系統(tǒng)級(jí)(控制層):執(zhí)行信號(hào)采集、數(shù)據(jù)處理和執(zhí)行保護(hù)與控制功能。該級(jí)包括:反應(yīng)堆保護(hù)系統(tǒng)、數(shù)據(jù)采集與處理系統(tǒng)、反應(yīng)堆控制系統(tǒng)、汽輪發(fā)電機(jī)組控制和保護(hù)系統(tǒng)以及承擔(dān)機(jī)組控制和設(shè)備保護(hù)任務(wù)的標(biāo)準(zhǔn)控制系統(tǒng)。主要采用PID調(diào)節(jié)器控制技術(shù)。
3)機(jī)組級(jí)(過(guò)程信息處理層):處理一個(gè)機(jī)組的所有數(shù)據(jù),執(zhí)行機(jī)組的監(jiān)測(cè)、控制和信息顯示功能,是人機(jī)接口的界面。包括主控室、全廠放射性水平監(jiān)視系統(tǒng)和火災(zāi)監(jiān)測(cè)報(bào)警系統(tǒng)、緊急停堆控制盤系統(tǒng)等。
4)電站級(jí)(管理層):處理所有機(jī)組公用數(shù)據(jù)。
目前商用反應(yīng)堆系統(tǒng)主要采用經(jīng)典單輸入單輸出控制技術(shù),少部分采用多變量控制,比如蒸汽發(fā)生器的三變量控制器。商用反應(yīng)堆控制技術(shù)的發(fā)展趨勢(shì)是基于總體控制目標(biāo),協(xié)調(diào)各個(gè)控制回路的動(dòng)作,并擴(kuò)大自動(dòng)控制范圍。
在反應(yīng)堆控制技術(shù)研究中,常見(jiàn)的控制技術(shù)有自適應(yīng)魯棒控制、功率轉(zhuǎn)換模糊邏輯控制、蒸汽發(fā)生器的H∞控制與基于遺傳算法的控制,以及反應(yīng)堆堆芯功率分布的神經(jīng)網(wǎng)絡(luò)控制,還有具有容錯(cuò)與重構(gòu)特征、先進(jìn)反應(yīng)堆—回路功率控制的模型預(yù)測(cè)控制。這些技術(shù)主要應(yīng)用在大學(xué)研究中,或者研究堆以及先進(jìn)小型堆中。
第一臺(tái)自主式機(jī)器人探測(cè)車火星探路者索杰納于1997年7月開(kāi)始探索火星地表。索杰納的自主能力非常有限,導(dǎo)航、資源管理和應(yīng)急響應(yīng)等仍然需要地面遙控?;鹦请p子探測(cè)漫游車(MERS)——勇氣號(hào)和機(jī)遇號(hào),于2004年1月開(kāi)始了星表探測(cè)任務(wù),探測(cè)活動(dòng)一直持續(xù)到2017年。除了具有自主障礙檢測(cè)和導(dǎo)航能力,這兩輛漫游車在索杰納的能力之上擴(kuò)展了其自主能力,還具有基于模型的恢復(fù)、資源管理和自主規(guī)劃能力。用于促進(jìn)火星雙子探測(cè)漫游車自主的集成軟件架構(gòu)是“自主機(jī)器人耦合層體系結(jié)構(gòu)”(CLARAty)。CLARAty包含兩層結(jié)構(gòu),由人工智能軟件決策層和實(shí)現(xiàn)控制的功能層組成。每層中的隱式粒度允許具有嵌套能力的功能體系結(jié)構(gòu)[7]。
航天器的自主性已隨深空一號(hào)任務(wù)進(jìn)行了演示。深空一號(hào)于1998年10月發(fā)射。作為驗(yàn)證太空中高風(fēng)險(xiǎn)先進(jìn)技術(shù)的試驗(yàn)平臺(tái),除了演示航天器的自主導(dǎo)航外,還進(jìn)行了一個(gè)主要實(shí)驗(yàn),演示了用于星上規(guī)劃和航天器活動(dòng)執(zhí)行的遠(yuǎn)程智能體人工智能系統(tǒng)[8]。除了在深空一號(hào)上的實(shí)驗(yàn)性應(yīng)用,自主技術(shù)已經(jīng)實(shí)際應(yīng)用于航天器,比如哈勃望遠(yuǎn)鏡使用的“科學(xué)規(guī)劃交互知識(shí)系統(tǒng)(SPIKE)”[9],“地球觀測(cè)衛(wèi)星1號(hào)”(EO-1)使用的ASPEN系統(tǒng)[10]。國(guó)內(nèi)的高校和院所也已經(jīng)開(kāi)展了航天器自主技術(shù)的研究,如北京理工大學(xué)深空探測(cè)技術(shù)研究所對(duì)航天器的自主任務(wù)規(guī)劃技術(shù)[11-12]、自主姿態(tài)規(guī)劃技術(shù)進(jìn)行了研究[12-13],中國(guó)科學(xué)院、北京理工大學(xué)、國(guó)防科技大學(xué)、北京航空航天大學(xué)等對(duì)多種深空自主導(dǎo)航方式進(jìn)行了研究,嫦娥三號(hào)月球軟著陸成功采用了自主導(dǎo)航技術(shù)[14],姜連祥等[15]對(duì)航天器的自主故障診斷技術(shù)發(fā)展進(jìn)行了總結(jié)。國(guó)內(nèi)的深空探測(cè)器自主技術(shù)處于起步階段,雖然從多個(gè)角度開(kāi)展了理論研究,但尚未廣泛應(yīng)用到實(shí)際深空探測(cè)任務(wù)中。
未來(lái)的深空探測(cè)器應(yīng)具備系統(tǒng)級(jí)的自主能力,通過(guò)接收地面的高級(jí)指令,自主進(jìn)行任務(wù)規(guī)劃、命令序列化、探測(cè)器行為監(jiān)測(cè)、探測(cè)器故障診斷和恢復(fù)等,只在出現(xiàn)無(wú)法解決的故障時(shí),求助于地面[12]。另外,需要合理地自主運(yùn)行體系結(jié)構(gòu)以整合各項(xiàng)自主技術(shù)。在體系結(jié)構(gòu)設(shè)計(jì)中,航天器各系統(tǒng)應(yīng)盡量提高自主性,以減輕上一級(jí)系統(tǒng)的控制壓力[16]。
美國(guó)戰(zhàn)略防御計(jì)劃研制了SP-100核熱離子反應(yīng)堆系統(tǒng),其中采用了容錯(cuò)控制方法,論證了將這種方法應(yīng)用于空間裂變反應(yīng)堆控制的可行性,反應(yīng)堆既可用于推進(jìn)(核電或核熱),也可作為能源[17]。
反應(yīng)堆自主控制與典型自動(dòng)控制不同。自動(dòng)控制使被控對(duì)象自動(dòng)執(zhí)行基本動(dòng)作,重大決策需要由人決定。自主控制具有控制、診斷和決策能力,甚至還具有自我維護(hù)、修復(fù)能力。從自動(dòng)控制到自主控制的智能化過(guò)程如圖2所示。
圖2 自動(dòng)控制到自主控制的智能化過(guò)程Fig.2 The intellectualized process from automatic control to autonomous control
自主控制可以在反應(yīng)堆所有運(yùn)行模式下應(yīng)用。應(yīng)用場(chǎng)景包括:工藝性能優(yōu)化(如自整定);連續(xù)監(jiān)測(cè)、性能指標(biāo)診斷以及預(yù)測(cè)與安全相關(guān)參數(shù)的變化趨勢(shì);組件的健康診斷、處理預(yù)期與未預(yù)期事件和提供壽命有限元件(如電池和驅(qū)動(dòng)機(jī)構(gòu))保護(hù)的柔性控制;適應(yīng)工況不斷變化或降質(zhì);控制系統(tǒng)性能檢驗(yàn)和維護(hù)。
自主控制關(guān)鍵特性包括:確認(rèn)系統(tǒng)性能并檢測(cè)降質(zhì)或故障狀態(tài)的智能性;適應(yīng)不確定性和變化工況的魯棒性;設(shè)備負(fù)荷最小化和有效應(yīng)對(duì)運(yùn)行事件而不影響系統(tǒng)完整性的優(yōu)化性;通過(guò)在現(xiàn)有控制系統(tǒng)元素之間重新配置或調(diào)整控制系統(tǒng)策略、算法或參數(shù),以適應(yīng)故障的靈活性和適應(yīng)性。
智能性(嵌入式?jīng)Q策和管理/規(guī)劃?rùn)?quán))有助于減少或不依賴于人的干預(yù),并能容納一個(gè)完整的、全系統(tǒng)方法的控制。智能控制提供了基于系統(tǒng)知識(shí)的動(dòng)作預(yù)期和事件預(yù)測(cè)。為了支持控制和決策,對(duì)于狀態(tài)識(shí)別和健康/狀態(tài)監(jiān)測(cè),實(shí)時(shí)診斷/預(yù)測(cè)能力非常重要。自我驗(yàn)證是處理數(shù)據(jù)、命令和系統(tǒng)性能評(píng)估和響應(yīng)智能化的一個(gè)方面。
除了具有適應(yīng)各種環(huán)境的能力外,還需考慮設(shè)計(jì)不確定性和未建模動(dòng)態(tài)所需的魯棒性。故障管理是實(shí)現(xiàn)魯棒性的一個(gè)重要考慮因素。故障管理包含故障避免、故障排除、容錯(cuò)和故障預(yù)測(cè)等技術(shù)。此外,魯棒性也可以包含自我維護(hù)或自愈。這種能力是通過(guò)獲取設(shè)計(jì)知識(shí)與自我糾正性能、預(yù)測(cè)識(shí)別早期故障、故障檢測(cè)與故障隔離等技術(shù)來(lái)提升的。
優(yōu)化意味著對(duì)需求的快速響應(yīng)、與目標(biāo)條件的最小偏差以及高效的執(zhí)行器動(dòng)作。優(yōu)化控制可以通過(guò)自調(diào)整和其他形式的自適應(yīng)來(lái)實(shí)現(xiàn)。靈活性和適應(yīng)性可以通過(guò)不同的測(cè)量、多種通信選項(xiàng)和不同的控制解決方案來(lái)實(shí)現(xiàn)。功能可重構(gòu)性有助于這些系統(tǒng)可選項(xiàng)的有效利用,而固有的重設(shè)計(jì)能力可以適應(yīng)未預(yù)期工況。
與地面核電站采用不同程度的直接人工控制和運(yùn)行決策不同,空間反應(yīng)堆控制系統(tǒng)將遇到獨(dú)特的挑戰(zhàn)。空間堆控制系統(tǒng)應(yīng)能提供連續(xù)、遠(yuǎn)程、無(wú)人值守(有限直接人工干預(yù))運(yùn)行。此外,空間堆控制系統(tǒng)應(yīng)滿足系統(tǒng)和設(shè)備降質(zhì)或失效以及罕見(jiàn)或未預(yù)期運(yùn)行事件。因此,為支持運(yùn)行目標(biāo),需要對(duì)快速事件作出反應(yīng)并適應(yīng)不斷變化或降質(zhì)工況,而不需要立即進(jìn)行直接的人為監(jiān)督。自主控制可以在不需要直接人工干預(yù)的情況下,在存在重大不確定性、干擾和降質(zhì)的情況下,滿足重要的控制目標(biāo),同時(shí)提升經(jīng)濟(jì)競(jìng)爭(zhēng)力。
自主控制的目標(biāo)是限制非正常事件的發(fā)展及減少停堆動(dòng)作,非正常事件包括如下幾個(gè)方面:熱負(fù)荷瞬變(如熱電轉(zhuǎn)換系統(tǒng)故障,冷源喪失);負(fù)荷/電源中斷,執(zhí)行器降質(zhì)或失效,執(zhí)行器信號(hào)中斷或受干擾;余熱排出系統(tǒng)降質(zhì)或損壞,控制處理器故障,罕見(jiàn)的軟件錯(cuò)誤,傳感器故障,傳感器信號(hào)中斷或干擾、傳感器漂移、信號(hào)調(diào)理電路漂移、傳感器噪聲增加、通信故障或通信重發(fā);快速降負(fù)荷是最有可能觸發(fā)直接保護(hù)動(dòng)作的一個(gè)重大事件??臻g堆運(yùn)行模式見(jiàn)圖3。
圖3 空間堆的運(yùn)行模式Fig.3 Operation modes of space nuclear reactor
應(yīng)對(duì)非正常事件的手段有:
1)反應(yīng)堆保護(hù)
通過(guò)多樣性和縱深防御來(lái)提供增強(qiáng)的分層反應(yīng)堆保護(hù)?;蚶孟拗葡到y(tǒng),在保護(hù)反應(yīng)堆的同時(shí)最大限度地降低昂貴的緊急停堆風(fēng)險(xiǎn)。
2)可用率保證
通過(guò)故障管理、自動(dòng)控制、性能管理、數(shù)據(jù)管理和通信等方式保證可用率。
故障管理是自主控制的重要組成部分,在給定變化的設(shè)備或反應(yīng)堆狀態(tài)下,進(jìn)行檢測(cè)、診斷和適應(yīng)(或重新配置)??刂葡到y(tǒng)和反應(yīng)堆性能的檢測(cè)、診斷和驗(yàn)證。通過(guò)這種能力,作為預(yù)期動(dòng)作而非反應(yīng)性動(dòng)作,反應(yīng)堆控制系統(tǒng)能夠識(shí)別始發(fā)事件(瞬變或故障),確定保護(hù)壽命有限或易損部件的措施,并確保反應(yīng)堆持續(xù)可靠地運(yùn)行。
自動(dòng)控制是在正常運(yùn)行模式下的自主控制功能。性能管理評(píng)估控制系統(tǒng)和反應(yīng)堆的狀態(tài),以確定何時(shí)進(jìn)行應(yīng)調(diào)用的控制器預(yù)先調(diào)整。評(píng)估能夠監(jiān)測(cè)控制系統(tǒng)的有效性,識(shí)別反應(yīng)堆的動(dòng)態(tài)狀態(tài)和確定關(guān)鍵設(shè)備的狀態(tài)。評(píng)估的方法有:狀態(tài)估計(jì)算法、過(guò)程系統(tǒng)診斷、設(shè)備狀態(tài)監(jiān)視和控制參數(shù)自適應(yīng)。另外數(shù)據(jù)管理和通信能力也與自主功能相關(guān)。
總的來(lái)說(shuō),應(yīng)對(duì)非正常事件的手段有兩點(diǎn)。一是通過(guò)多樣性和縱深防御來(lái)提供增強(qiáng)的分層反應(yīng)堆保護(hù)。二是開(kāi)發(fā)限制系統(tǒng),在保護(hù)反應(yīng)堆的同時(shí)最大限度地減少昂貴的緊急停堆風(fēng)險(xiǎn)。
空間堆自主性的主要功能達(dá)到何種程度取決于賦予自主控制系統(tǒng)的責(zé)任水平和自主控制系統(tǒng)必須緩解的運(yùn)行風(fēng)險(xiǎn)程度。
影響空間堆自主性水平的因素有:持續(xù)直接人機(jī)交互潛力限制(因多個(gè)智能體共享操作員監(jiān)管職責(zé)或因限制空間安裝維護(hù)人數(shù))、績(jī)效目標(biāo)、系統(tǒng)需求復(fù)雜、技術(shù)限制,運(yùn)行風(fēng)險(xiǎn)考慮、極簡(jiǎn)約(即可靠性)與復(fù)雜程度(即檢測(cè)和調(diào)節(jié)能力)。
盡管具有高度可靠的反應(yīng)堆控制系統(tǒng)很重要,但在沒(méi)有直接人為干預(yù)或緊急停堆的情況下,如果控制系統(tǒng)不能適應(yīng)反應(yīng)堆降質(zhì),那么控制系統(tǒng)價(jià)值也有限。在這種空間堆狀態(tài)變化情況下,一個(gè)高度可靠的控制系統(tǒng)卻發(fā)揮不了作用。
總的來(lái)說(shuō),反應(yīng)堆的自主控制研究經(jīng)驗(yàn)不足,技術(shù)基礎(chǔ)不深,特別是自主控制尚未在地面運(yùn)行的核電廠實(shí)現(xiàn)。對(duì)于空間反應(yīng)堆自主控制的研發(fā)工作,關(guān)鍵要素包括建立適當(dāng)?shù)墓δ芗軜?gòu)、開(kāi)發(fā)支持自主的基本模塊、并進(jìn)行自主能力的地面綜合示范應(yīng)用。
如圖4所示,在分層自主控制方法中,自主控制體系結(jié)構(gòu)包含三層:規(guī)劃器層、執(zhí)行層和功能層[18-19]。規(guī)劃器層提供慎思式規(guī)劃,執(zhí)行層提供動(dòng)作排序,功能層提供直接控制。
圖4 自主控制體系結(jié)構(gòu)Fig.4 Autonomous control architecture
例如,火星探測(cè)漫游車任務(wù)中采用了基于CLARAty軟件環(huán)境的自主控制架構(gòu)。CLARAty體系結(jié)構(gòu)折疊了規(guī)劃器層和執(zhí)行層,其特點(diǎn)是將智能高層放入決策層。把慎思和程序功能合并成一個(gè)與功能層并行的層,并提供支持決策的公用數(shù)據(jù)庫(kù)。
在空間堆自主控制中,功能層是一個(gè)面向?qū)ο蟮慕Y(jié)構(gòu),它提供對(duì)核推進(jìn)/系統(tǒng)硬件功能的訪問(wèn),并充當(dāng)決策層對(duì)控制對(duì)象(機(jī)器人、航天器、核推進(jìn))的控制接口。決策層提供由功能層的智能控制能力分解和執(zhí)行的高級(jí)命令,建立基于核推進(jìn)/系統(tǒng)狀態(tài)和已知約束的任務(wù)序列,評(píng)估功能層實(shí)現(xiàn)這些命令的能力[20]。
圖5 空間堆近自主控制體系結(jié)構(gòu)Fig.5 Near autonomous control architecture of space nuclear reactor
本文根據(jù)已有研究成果和實(shí)踐,提出一種近自主控制系統(tǒng)體系結(jié)構(gòu)方法,如圖5所示。本體系結(jié)構(gòu)具有與運(yùn)行人員的高級(jí)接口,運(yùn)行人員為空間堆最終監(jiān)管者,決策和目標(biāo)由人確定??刂葡到y(tǒng)承擔(dān)了正??刂?、異常事件響應(yīng)和系統(tǒng)容錯(cuò)等擴(kuò)展職能。
體系結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)(除了底層的終端節(jié)點(diǎn))都是一個(gè)監(jiān)視模塊。體系結(jié)構(gòu)中每一級(jí)的監(jiān)視模塊都響應(yīng)其上層模塊所設(shè)定的目標(biāo)和指令,也響應(yīng)它下層的模塊所提供的數(shù)據(jù)和信息。每個(gè)模塊做出適合其體系結(jié)構(gòu)的決策,并將決策結(jié)果和必要的支持信息傳遞給功能連接模塊。
體系結(jié)構(gòu)中各層具有不同的功能。設(shè)備網(wǎng)絡(luò)層連接傳感器、執(zhí)行器和通訊;控制/監(jiān)視/診斷層的功能是控制模塊與較底層節(jié)點(diǎn)的耦合,相當(dāng)于由控制器與現(xiàn)場(chǎng)設(shè)備組成的自動(dòng)控制系統(tǒng),監(jiān)視和診斷模塊提供派生數(shù)據(jù)以支持設(shè)備和過(guò)程系統(tǒng)的狀態(tài)確定和監(jiān)視;混合控制/預(yù)測(cè)層的功能是提供命令和信號(hào)驗(yàn)證功能,支持失效早期或正在出現(xiàn)的設(shè)備降質(zhì)的預(yù)測(cè)(即故障識(shí)別);命令/決策層提供算法,允許重新配置或調(diào)節(jié)以適應(yīng)檢測(cè)到或預(yù)測(cè)到的反應(yīng)堆狀況(即,容錯(cuò)活動(dòng)),替代原有控制器,基于操縱員命令抑制或逆轉(zhuǎn)自主控制動(dòng)作;監(jiān)管者/協(xié)調(diào)人層提供人機(jī)接口,負(fù)責(zé)操作員指令下達(dá)。
自然界常常能給科學(xué)研究帶來(lái)啟發(fā)。當(dāng)思考如何自主控制系統(tǒng)中的多個(gè)子系統(tǒng)時(shí),可能聯(lián)想到章魚,它能同時(shí)協(xié)調(diào)八個(gè)腕足。章魚具有整個(gè)動(dòng)物界最奇特的智能——分散處理信息的能力。這種能力的實(shí)現(xiàn)依賴于章魚的生理特性。章魚具有8個(gè)外圍神經(jīng)系統(tǒng):每個(gè)腕足受數(shù)百個(gè)觸覺(jué)、化學(xué)和本體神經(jīng)支配,具有自主能力,不受大腦節(jié)制。同時(shí),章魚還有一個(gè)專門化的中央大腦,與人類海馬體相似,專注于高級(jí)認(rèn)知活動(dòng)(認(rèn)知、決策、協(xié)調(diào)復(fù)雜動(dòng)作等)[21]。這種信息處理方式是動(dòng)物界典型的多智能體自主控制。
由于空間反應(yīng)堆控制有安全性、經(jīng)濟(jì)性、操控約束、環(huán)境(空間、余熱排出)受限、人工參與受限等特點(diǎn),近自主控制的分層體系結(jié)構(gòu)無(wú)法完全適用。尤其是在人難以及時(shí)參與決策的深空環(huán)境中,近自主控制分層體系結(jié)構(gòu)中的監(jiān)管者/協(xié)調(diào)人層無(wú)法發(fā)揮原有的作用。因此,在多智能體自主控制中應(yīng)用分層控制體系結(jié)構(gòu)方法,根據(jù)空間堆的特點(diǎn)調(diào)整自主控制體系結(jié)構(gòu)的分層方式,提出多智能體自主控制體系結(jié)構(gòu)。
多智能體系統(tǒng)具有的能力有:控制能力,感知周圍環(huán)境的能力,智能體間的交互能力,信息處理和計(jì)算能力,響應(yīng)及決策能力。多智能體自主控制體系利用多智能體的能力解決空間反應(yīng)堆控制問(wèn)題,在人工參與受限的情況下,自主控制反應(yīng)堆,滿足各種條件的約束,達(dá)到安全性、經(jīng)濟(jì)性等控制目標(biāo)。
多智能體自主控制系統(tǒng)體系結(jié)構(gòu)如圖6所示。該體系結(jié)構(gòu)是一個(gè)抽象模型框架,它定義了系統(tǒng)中的結(jié)構(gòu)、設(shè)備、關(guān)系、動(dòng)態(tài)和通訊。決策與功能層融合是其主要特征。在空間堆近自主控制體系結(jié)構(gòu)的基礎(chǔ)上,兩層融合能夠簡(jiǎn)化體系結(jié)構(gòu),提升決策層獲取系統(tǒng)狀態(tài)信息的效率。決策功能單元包含:計(jì)劃與調(diào)度模塊、數(shù)據(jù)采集模塊、診斷與預(yù)測(cè)模塊、決策模塊、控制動(dòng)作預(yù)測(cè)與驗(yàn)證模塊、命令生成模塊,其中決策模塊是主智能體,擁有最高決策權(quán)。
圖6 多智能體自主控制體系結(jié)構(gòu)Fig.6 Architecture of multi-agent autonomous control system
體系結(jié)構(gòu)最低層的兩級(jí)結(jié)構(gòu)相當(dāng)于一個(gè)自動(dòng)化控制系統(tǒng)。較低層智能體實(shí)現(xiàn)可靠的、容錯(cuò)的嵌入式功能,為實(shí)現(xiàn)響應(yīng)快速事件和適應(yīng)變化或降質(zhì)工況也可集成一些與控制/監(jiān)視/診斷級(jí)別相關(guān)聯(lián)的基本決策能力。較高層級(jí)智能體將承擔(dān)更高程度的決策能力。
體系結(jié)構(gòu)中嵌入式智能體功能有:數(shù)據(jù)采集、執(zhí)行器激活、驗(yàn)證、仲裁、控制、限制、檢查、監(jiān)視、命令、預(yù)測(cè)、通信、故障管理和配置管理。
多智能體體系結(jié)構(gòu)的功能分配必須基于自主程度、技術(shù)成熟度、可靠性和故障管理、軟件開(kāi)發(fā)實(shí)踐和平臺(tái)功能,以及反應(yīng)堆控制系統(tǒng)硬件的物理體系結(jié)構(gòu),這有待于今后進(jìn)一步開(kāi)發(fā)細(xì)化。
雖然在機(jī)器人、航天等應(yīng)用領(lǐng)域把自動(dòng)化增強(qiáng)為自主化已經(jīng)取得了顯著進(jìn)展,但核能行業(yè)在將人的作用和職責(zé)轉(zhuǎn)移到機(jī)器(系統(tǒng))方面的進(jìn)展并不大。尤其是有限的幾乎是學(xué)術(shù)性的研究主要集中在開(kāi)發(fā)先進(jìn)控制和監(jiān)控能力上。實(shí)現(xiàn)空間堆自主控制的主要技術(shù)差距與決策能力(例如戰(zhàn)略、解釋、適應(yīng)、預(yù)測(cè))有關(guān)。采用多智能體自主控制結(jié)構(gòu)將提供高效、有效、經(jīng)濟(jì)的空間堆控制解決方案,滿足空間堆的自主控制需求,提升反應(yīng)堆的經(jīng)濟(jì)競(jìng)爭(zhēng)力。實(shí)現(xiàn)一個(gè)空間反應(yīng)堆自主控制系統(tǒng),需要通過(guò)地面技術(shù)開(kāi)發(fā)和示范活動(dòng)提供所需的技術(shù)準(zhǔn)備,特別是在其功能體系結(jié)構(gòu)中建立監(jiān)視、趨勢(shì)、檢測(cè)、診斷、決策和自我調(diào)節(jié)能力。目前,實(shí)現(xiàn)具有完全自主運(yùn)行、自主保護(hù)和自主管理智能體反應(yīng)堆模塊尚處于設(shè)想階段,但對(duì)于未來(lái)深空探測(cè)能源系統(tǒng)的發(fā)展具有重要意義。