梁建偉
(集美大學 誠毅學院,福建 廈門 361000)
隨著科學發(fā)展中多學科、多領(lǐng)域之間的相互交叉和相互融合,人們不斷從生物信息處理機制的深入研究中獲得靈感,目前已經(jīng)提出許多實用的智能模型和相關(guān)算法.受神經(jīng)系統(tǒng)、免疫系統(tǒng)、遺傳系統(tǒng)的啟發(fā),分別提出人工神經(jīng)網(wǎng)絡(luò)、人工免疫系統(tǒng)和遺傳算法,相關(guān)研究已經(jīng)取得重大成就.內(nèi)分泌系統(tǒng)、神經(jīng)系統(tǒng)和免疫系統(tǒng)相互作用、相互協(xié)作,使生物體的各項生命活動正常運轉(zhuǎn),神經(jīng)系統(tǒng)和免疫系統(tǒng)的成功引起人們對內(nèi)分泌系統(tǒng)的濃厚興趣.目前,典型的研究工作包括:Arkin借鑒內(nèi)分泌系統(tǒng)在維持機體內(nèi)穩(wěn)態(tài)中的重要作用,在機器人控制結(jié)構(gòu)中模擬內(nèi)分泌系統(tǒng),可以對機器人的行為規(guī)劃進行相應(yīng)調(diào)整[1-2].Shen W M借鑒內(nèi)分泌系統(tǒng)所發(fā)揮的調(diào)節(jié)機制,提出一種獨特的數(shù)字激素模型,對多機器人系統(tǒng)中的通信和控制問題提供了解決方案[3-4].Avila-Garcia根據(jù)生存理論及生物活動的周期性,提出仿激素機制,用于調(diào)控機器人的行為[5].黃國銳根據(jù)內(nèi)分泌系統(tǒng)和神經(jīng)系統(tǒng)的相互作用機制,提出集神經(jīng)、遺傳、內(nèi)分泌系統(tǒng)于一體的自主體控制模型[6].林廣棟等人在激素生理機制的啟發(fā)下,提出一種用于解決多機器人控制問題的分布式控制模型[7].
人類智能不僅需要正常的邏輯推理能力,還必須具備正常的情感能力,情感對于智能系統(tǒng)的重要影響已經(jīng)得到研究者的廣泛關(guān)注.Caamero通過模擬人體生理變化提出一種情感模型,利用智能體內(nèi)激素濃度的變化做出基于動機的行為選擇,當動機得到某種滿足后,體內(nèi)激素就會發(fā)生相應(yīng)變化,從而維持體內(nèi)環(huán)境的動態(tài)平衡[8-9].Velásquez提出一種模塊化的情感體系,說明擁有情感機制的機器人系統(tǒng)具有較強的自適應(yīng)性[10-11].Sloman在研究智能體的控制系統(tǒng)中指出,對于資源相對有限的智能體而言,情感機制是一種必然要求[12].
生物體的行為受內(nèi)分泌系統(tǒng)和情感的共同作用,兩者的交互是生物體維持生存活動的關(guān)鍵.在生物內(nèi)分泌情感反應(yīng)機制的啟發(fā)下,本文提出一種人工內(nèi)分泌情感模型及算法,綜合利用內(nèi)分泌系統(tǒng)的調(diào)節(jié)機制和情感的生理反應(yīng)機制,控制自主體的行為決策,使其能夠在動態(tài)環(huán)境中具備一定的自適應(yīng)能力.
內(nèi)分泌系統(tǒng)是由內(nèi)分泌腺(包括甲狀腺、腎上腺、下丘腦等)及具有分泌功能的組織細胞組成的調(diào)節(jié)系統(tǒng),通過分泌各種激素調(diào)節(jié)各項生命活動,和神經(jīng)系統(tǒng)相互配合實現(xiàn)體內(nèi)環(huán)境的動態(tài)平衡[13].內(nèi)分泌系統(tǒng)是通過反饋方式發(fā)揮調(diào)節(jié)作用的,包括正反饋和負反饋兩種方式,并以負反饋為主.內(nèi)分泌系統(tǒng)通過激素發(fā)揮調(diào)節(jié)作用的過程如圖1所示.其中,下丘腦屬于調(diào)節(jié)作用的中樞,它通過分泌激素對垂體產(chǎn)生影響,垂體通過激素調(diào)節(jié)靶腺細胞的效應(yīng).如果靶腺細胞分泌的激素濃度過大,則會抑制下丘腦和垂體的激素分泌功能.
圖1 激素調(diào)節(jié)機制
內(nèi)分泌系統(tǒng)和情感是相互關(guān)聯(lián)、相互作用的.情感雖然是一種心理現(xiàn)象,但是情感會導致體內(nèi)發(fā)生多種生理變化,稱為情感的生理反應(yīng).生理學的實驗證明,疼痛、視覺、嗅覺等刺激,都可以在一定的條件下產(chǎn)生情感的生理反應(yīng).情感的生理反應(yīng)是多樣性的,內(nèi)分泌系統(tǒng)的情感反應(yīng)非常重要,通常表現(xiàn)為甲狀腺素、腎上腺素等激素的分泌在某些情感狀態(tài)下發(fā)生變化.同時,內(nèi)分泌系統(tǒng)也對情感產(chǎn)生顯著的調(diào)節(jié)作用[14].
在前述生物內(nèi)分泌情感反應(yīng)機制的啟發(fā)下,將內(nèi)分泌系統(tǒng)和情感相結(jié)合,提出一種人工內(nèi)分泌情感模型(Artificial Endocrine Emotion Model, AEEM).圖2展示了該模型.
圖2 人工內(nèi)分泌情感模型
該模型主要由內(nèi)分泌系統(tǒng)模塊、情感系統(tǒng)模塊和行為模塊組成.情感系統(tǒng)根據(jù)所感知到的內(nèi)外環(huán)境信息產(chǎn)生初級情感,生成的情感刺激內(nèi)分泌系統(tǒng)分泌相應(yīng)激素,激素對情感進行調(diào)節(jié)后產(chǎn)生高級情感,情感作用于行為模塊進行行為決策,所執(zhí)行的行為結(jié)果反饋到內(nèi)外環(huán)境,由此形成一個回路.下面對各個模塊進行介紹.
內(nèi)分泌系統(tǒng)具有重要的調(diào)節(jié)作用,其功能包括四個方面:①維持內(nèi)環(huán)境相對穩(wěn)定.激素可以直接或者間接調(diào)節(jié)體內(nèi)酸堿平衡、體溫、血糖、血壓等參數(shù).②調(diào)節(jié)機體的新陳代謝.例如,甲狀腺素、生長激素等都會影響生物體內(nèi)的新陳代謝過程.③促進細胞的分化成熟.例如,甲狀腺素能夠調(diào)節(jié)神經(jīng)系統(tǒng)的發(fā)育過程,生長激素能夠促進很多組織的生長成熟.④調(diào)節(jié)生殖器官的發(fā)育成熟.例如,性激素可以促進生殖器官的生長發(fā)育.體內(nèi)激素雖然存在很多種類,但都是產(chǎn)生增強或者減弱細胞生理效應(yīng)的作用.因此,本文抽象出兩種激素,分別是促進激素(Activator Hormone)和抑制激素(Inhibitor Hormone).促進激素對相關(guān)情感起著強化作用,抑制激素對相關(guān)情感起著減弱作用.
內(nèi)分泌系統(tǒng)的主要功能是在情感的刺激下分泌激素,各種情感所分泌的激素種類不同.在某種情感的刺激下,所分泌激素的數(shù)量一方面與該情感的強度有關(guān),情感的強度越大所分泌的激素越多;另一方面也受該激素自身濃度的影響,激素的濃度越高,在相同的情感刺激下,新分泌出的激素就越少.本文使用參數(shù)1-α表示各種激素的消逝速率.每經(jīng)過一個時間單元后,各種激素的濃度按照公式1更新.
(1)
其中,C(t)表示t時刻某種激素的濃度,C(t+1)表示t+1時刻該激素的濃度,ΔC表示所有與該激素相關(guān)的情感在本次循環(huán)中新生成的激素濃度,ΔCi表示和該激素相關(guān)的情感i所產(chǎn)生的激素濃度.ΔCi的計算公式如2所示:
(2)
其中,Ei(t)是指情感i在t時刻的強度,MAXEV是指情感強度的最大值,MAXHC是指單次循環(huán)中激素濃度的最大改變量,MAXHV是指激素濃度的最大值.從公式可以看出,某一情感所生成的激素濃度隨著情感強度的增加而增大,同時隨著激素本身濃度的增加而減小.
情感系統(tǒng)包含四種基本情感:憤怒、高興、恐懼和悲傷,它們可以通過機器人對環(huán)境的感知而得到,和機器人的各種生存活動緊密聯(lián)系.考慮到內(nèi)分泌系統(tǒng)對情感的調(diào)節(jié)功能,本文將情感分為初級情感和高級情感兩類.初級情感是根據(jù)內(nèi)外環(huán)境信息直接產(chǎn)生的情感,高級情感則是經(jīng)過內(nèi)分泌系統(tǒng)調(diào)節(jié)后的情感,高級情感作用于行為模塊,用于智能體的行為決策.在任何時刻都存在著多種情感,其強度用0~1之間的數(shù)值來表示.在某個時刻,如果某種情感強度接近于0,表示該種情感比較弱;如果某種情感強度接近于1,則表示該種情感非常強.
(1)初級情感.各種情感強度隨著時間推移逐漸減弱,這里用參數(shù)1-β表示情感的衰減程度.每經(jīng)過一個時間單元,情感強度按照公式3進行調(diào)整.
E(t+1)=β*E(t)+ΔEβ∈(0,1)
(3)
其中,E(t)表示t時刻某種情感的強度,E(t+1)表示t+1時刻該情感的強度,ΔE表示新生成的情感強度.對于不同的情感,ΔE計算公式并不同.例如,對于“恐懼”情感,ΔE與主體距離障礙物的遠近有關(guān).主體和障礙物的距離越近時,新生成的“恐懼”情感強度越大;反之,新生成的“恐懼”情感強度越小.對于“高興”情感,ΔE取決于主體當前的生理參數(shù).如果主體的生理參數(shù)較好,則新生成的“高興”情感強度較大,否則較小.
(2)高級情感.由于受到激素的調(diào)節(jié),各種情感的強度會得到增強或者減弱,其變化取決于相關(guān)聯(lián)的激素種類及其強度.對于和促進激素相關(guān)的情感,促進激素濃度越高,情感強度增加越大;對于和抑制激素相關(guān)的情感,抑制激素濃度越高,情感強度減少越多.
(3)過濾機制.智能體在任意時刻都存在多種情感,而在某個時刻,具有最大強度的情感是機器人情感狀態(tài)的主要特征,稱為主導情感.如果某時刻存在兩種以上的情感,其強度同為最大值,則任選一種情感作為主導情感.這種選擇過程稱為情感的過濾機制.情感模塊將主導情感傳遞到行為模塊,以便做出有效的行為決策.
根據(jù)機器人所分配的任務(wù),可以設(shè)定多種不同的行為.例如,在機器人漫游環(huán)境中,可以包含進食、避障、休息和漫游等行為.根據(jù)主導情感,可以激發(fā)不同的行為,行為執(zhí)行后的結(jié)果反饋于內(nèi)外環(huán)境.
本文所提出的模型算法描述如下:
①設(shè)置各種情感、激素和內(nèi)外參數(shù)的初始值;
②機器人根據(jù)內(nèi)外環(huán)境信息計算出初級情感;
③根據(jù)初級情感按照公式計算各種激素濃度;
④激素對初級情感進行調(diào)節(jié)后產(chǎn)生高級情感;
⑤求出當前時刻主導情感并作用于行為模塊;
⑥根據(jù)主導情感選擇某種預設(shè)行為,并執(zhí)行;
⑦重復步驟②~⑥,直到滿足設(shè)定的結(jié)束條件.
為驗證模型及算法的有效性,設(shè)計了機器人漫游仿真實驗.初始實驗場景如圖3所示.
圖3 初始實驗場景
實驗環(huán)境為一個50x50的二維格空間.實驗中有機器人、食物和障礙物三種物體.其中,★表示機器人,◆表示食物,▲表示障礙物,□表示格子沒有任何物體.機器人可以感知食物和障礙物的存在,并且包含能量和活力兩種內(nèi)部參數(shù).為了保持生存活動,能量和活力必須同時大于零,當其中一項為零時本次實驗結(jié)束.為對比效果,進行兩種實驗:基于人工內(nèi)分泌情感模型的實驗(AEEM)和隨機漫游實驗(Random),前者根據(jù)情感狀態(tài)進行行為選擇,后者根據(jù)內(nèi)部參數(shù)進行行為選擇.
根據(jù)所設(shè)計的實驗,得出的實驗結(jié)果如表1所示:
可以看出,AEEM的效果明顯優(yōu)于Random,主要表現(xiàn)在兩個方面:一方面,前者具有更強的生存能力,在同樣的實驗場景和感知能力下,前者的最大生存步數(shù)和平均生存步數(shù)均大于后者;另一方面,前者的穩(wěn)定性更強.在其他條件不變的情況下,隨著感知能力的增加,前者的生存能力體現(xiàn)出穩(wěn)定的增加趨勢.然而,由于行為決策過程中隨機因素的存在,感知距離增加并不能保證其生存能力一定得到提高,這是符合實際情況的.從表中還可以看出,當機器人的感知距離很大時,兩種實驗效果比較接近,原因在于機器人的生存能力同時取決于環(huán)境中的食物總量、自身的感知能力及所做的行為決策.如果機器人的感知能力非常強,其生存能力將取決于環(huán)境中的食物總量,此時行為選擇不具有決定作用.然而,在現(xiàn)實世界中,機器人的感知能力總是有限的,行為決策對于其生存非常重要.此外,AEEM和Random相比,前者使得機器人能夠更加有效地避開障礙物,具有更強的避障能力.
本文首先介紹了內(nèi)分泌情感反應(yīng)機制,在此基礎(chǔ)上提出一種人工內(nèi)分泌情感模型,通過仿真實驗對模型進行驗證.實驗結(jié)果表明,該模型能有效實現(xiàn)智能體的行為決策,可以使智能體在不斷變化的復雜環(huán)境中具有較強的自適應(yīng)能力.