, ,
(1.華東理工大學(xué)信息科學(xué)與工程學(xué)院,上海 200237; 2.西安交通大學(xué)電氣與控制工程學(xué)院,西安 710049)
基于數(shù)據(jù)驅(qū)動(dòng)的閉環(huán)腦機(jī)接口設(shè)計(jì)
孫京誥1,戚川1,潘紅光2
(1.華東理工大學(xué)信息科學(xué)與工程學(xué)院,上海200237;2.西安交通大學(xué)電氣與控制工程學(xué)院,西安710049)
基于神經(jīng)元峰電位的植入式腦機(jī)接口開展相關(guān)研究,通過搭建大腦皮層仿真模型,并在控制理論分析的基礎(chǔ)上進(jìn)行自發(fā)單關(guān)節(jié)運(yùn)動(dòng)任務(wù)。使用自適應(yīng)維納濾波器完成神經(jīng)元放電活動(dòng)的線性解碼器設(shè)計(jì)。通過分析發(fā)現(xiàn)在視覺反饋信息缺失時(shí),解碼器性能嚴(yán)重下降。針對(duì)此問題,使用基于數(shù)據(jù)驅(qū)動(dòng)算法的緊格式無(wú)模型控制算法產(chǎn)生刺激信號(hào)來刺激仿真大腦皮層感覺區(qū)神經(jīng)元,使其跟蹤存在感官反饋時(shí)感覺區(qū)神經(jīng)元的放電活動(dòng)。由于感覺區(qū)神經(jīng)元放電信息的恢復(fù),解碼器在感覺反饋信息缺失時(shí)的性能也得到了恢復(fù)。最后,通過仿真驗(yàn)證了基于數(shù)據(jù)驅(qū)動(dòng)算法的人工感官反饋有效性,并與整定的PID控制算法對(duì)比,結(jié)果驗(yàn)證了本文設(shè)計(jì)的閉環(huán)系統(tǒng)的有效性。
大腦皮層仿真模型; 無(wú)模型控制; 解碼器; 數(shù)據(jù)驅(qū)動(dòng)
腦機(jī)交互系統(tǒng)主要包括皮層神經(jīng)元活動(dòng)測(cè)量和外界交互設(shè)備,目的是為殘障人士恢復(fù)受損的運(yùn)動(dòng)機(jī)能[1]。閉環(huán)腦機(jī)接口主要包括皮層神經(jīng)元活動(dòng)信息的測(cè)量、對(duì)任務(wù)運(yùn)動(dòng)意圖進(jìn)行提取的解碼器、反饋給大腦的感覺信息編碼器、完成運(yùn)動(dòng)任務(wù)的肢體。因此,大腦皮層、肢體、編碼器和解碼器共同組成了閉環(huán)腦機(jī)接口系統(tǒng)[2]。
近年來,基于腦機(jī)接口的運(yùn)動(dòng)意圖信息提取及人造假肢系統(tǒng)已經(jīng)被廣泛研究[3-5]。在這些研究中,訓(xùn)練健康的受試者執(zhí)行特定的運(yùn)動(dòng)任務(wù),例如伸手或者抓取物體的任務(wù)[6]。在進(jìn)行單關(guān)節(jié)伸展任務(wù)中,記錄大腦皮層的放電數(shù)據(jù),然后,根據(jù)記錄的數(shù)據(jù)完成解碼器的設(shè)計(jì)[7]。解碼器從連續(xù)記錄的皮層神經(jīng)元放電活動(dòng)中提取運(yùn)動(dòng)信息,它的性能好壞可以通過將解碼器輸出的信息應(yīng)用到假肢系統(tǒng)的效果來觀察。假肢的運(yùn)動(dòng)誤差是受試者使用視覺反饋信息來修正的,如果缺少受試者的視覺反饋,則不能完成指定運(yùn)動(dòng)任務(wù)。
最近,在腦機(jī)接口設(shè)計(jì)上結(jié)合主動(dòng)觸覺探索[8]和皮層刺激[9],實(shí)現(xiàn)了將控制信息反饋給受試者,形成閉合回路。這些嘗試中,在大腦皮層上的指定區(qū)域進(jìn)行微刺激,把運(yùn)動(dòng)任務(wù)的相關(guān)信息反饋給大腦是一種有效的途徑。雖然這項(xiàng)技術(shù)在閉環(huán)腦機(jī)接口的設(shè)計(jì)上是有效的,但是,設(shè)計(jì)反饋大腦皮層的激勵(lì)電流的一些實(shí)驗(yàn)或者是錯(cuò)誤的方法可能會(huì)改變大腦的自然功能,甚至?xí)斐纱竽X不可恢復(fù)的損傷。使用基于數(shù)據(jù)驅(qū)動(dòng)的控制方法來設(shè)計(jì)反饋激勵(lì)電流可以增強(qiáng)閉環(huán)腦機(jī)接口設(shè)計(jì)的準(zhǔn)確性,另外,由于不依賴于系統(tǒng)模型,該方法在設(shè)計(jì)輸入激勵(lì)電流的閉環(huán)腦機(jī)接口系統(tǒng)時(shí)提供了靈活性。
大多數(shù)情況下,控制方法都是圍繞被控對(duì)象的具體模型來研究,但是有時(shí)由于被控對(duì)象的復(fù)雜性導(dǎo)致不容易甚至不能建模。而數(shù)據(jù)驅(qū)動(dòng)算法對(duì)具有非線性、強(qiáng)耦合、時(shí)變等特性的被控系統(tǒng)具有良好的控制效果[10]。
本文研究的內(nèi)容為運(yùn)動(dòng)型植入式腦機(jī)接口,埋植的電極所記錄的信號(hào)為神經(jīng)元峰電位(spike)。將數(shù)據(jù)驅(qū)動(dòng)算法引入到閉環(huán)腦機(jī)接口的算法設(shè)計(jì)中,并通過與其他控制算法比較控制效果證明其可靠性。首先,通過對(duì)受試者進(jìn)行多次重復(fù)單關(guān)節(jié)伸展任務(wù),并使用結(jié)果數(shù)據(jù)集進(jìn)行解碼器設(shè)計(jì);然后,實(shí)驗(yàn)在視覺反饋缺失時(shí)解碼器性能好壞,隨后使用基于數(shù)據(jù)驅(qū)動(dòng)的緊格式無(wú)模型控制方法來補(bǔ)償受試者視覺反饋的缺失性能;最后,從實(shí)驗(yàn)結(jié)果上說明了在缺少受試者視覺反饋的情況下數(shù)據(jù)驅(qū)動(dòng)算法可以恢復(fù)腦機(jī)接口的閉環(huán)性能。
1.1皮層電路模型描述
為了進(jìn)行自發(fā)單關(guān)節(jié)運(yùn)動(dòng)的仿真實(shí)驗(yàn),Bullock等[11]提出了生理皮層電路模型,如圖1 所示。
圖1 生理皮層電路模型Fig.1 Physiological cortical circuit model
圖1區(qū)域5中的DV計(jì)算目標(biāo)位置矢量(TPV)和感知肢體位置矢量(PPV)之間的差。此區(qū)域神經(jīng)元的平均放電活動(dòng)可以表述如下:
ri(t)=max{Ti-xi(t)+Br,0}
(1)
其中,0≤ri(t)≤1,下標(biāo)i和j表示主動(dòng)肌神經(jīng)元和對(duì)抗肌神經(jīng)元的平均放電活動(dòng);Ti為目標(biāo)位置矢量(TPV)中主動(dòng)肌的目標(biāo)位置;xi(t)是區(qū)域5中感知位置矢量神經(jīng)元(PPV)的平均放電活動(dòng),此神經(jīng)元可以實(shí)時(shí)地計(jì)算主動(dòng)肌的當(dāng)前位置;Br表示DV神經(jīng)元的初始放電大小。
連續(xù)地計(jì)算差矢量信息之后,通過區(qū)域4中期望速度向量神經(jīng)元(DVV)進(jìn)行縮放,DVV神經(jīng)元的描述如下:
ui(t)=max{g(t)(ri(t)-rj(t))+Bu,0}
(2)
式中:ui(t)是區(qū)域4中DVV神經(jīng)元的平均放電活動(dòng);Bu表示DVV神經(jīng)元的初始放電大小;g(t)表示內(nèi)部GO信號(hào),由大腦的決策中心產(chǎn)生,在單關(guān)節(jié)運(yùn)動(dòng)期間具有反曲函數(shù)增長(zhǎng)趨勢(shì),它的模型表述如下:
(3)
式中:l={1,2};ε是常數(shù),代表結(jié)合速率;C是常數(shù),表示GO神經(jīng)元的飽和度。輸出位置向量神經(jīng)元(OPV)的平均放電活動(dòng)表述如下:
uj(t),0})-yi(t)(ηxj(t)+max{uj(t)-ui(t),0})
(4)
其中,η為比例因子。靜態(tài)γ神經(jīng)元和動(dòng)態(tài)γ神經(jīng)元的平均放電如下:
(5)
式中,ρ為縮放因子。初始肌梭傳入和第二肌梭傳入的平均放電活動(dòng)可以表示為
(6)
式中:pi(t)表示主動(dòng)肌的位置;θ表示靜態(tài)核袋和鏈纖維的靈敏度;φ表示動(dòng)態(tài)核袋的敏感度;肌梭傳入的飽和度由函數(shù)S(ω)=ω/(1+100ω2)給出。區(qū)域5中PPV神經(jīng)元的平均放電活動(dòng)xi(t)可以表示為
(7)
式中:τ為主軸反饋的延時(shí)時(shí)間;Θ為常數(shù)增益。區(qū)域4中的慣性力矢量神經(jīng)元(IFV)的平均放電活動(dòng)qi(t)可以表示為
(8)
式中,Λ是一個(gè)常數(shù)閾值。區(qū)域4中靜態(tài)力矢量神經(jīng)元(SFV)的平均放電活動(dòng)fi(t)可以表示為
(9)
式中:h為常數(shù)增益,它控制著外部負(fù)載補(bǔ)償?shù)牧Χ群退俣?Ψ是用來抑制縮放的參數(shù)。在區(qū)域4中輸出力和位置矢量神經(jīng)元(OFPV)的平均放電活動(dòng)ai(t)可以表示為
ai(t)=yi(t)+qi(t)+fi(t)
(10)
運(yùn)動(dòng)神經(jīng)元α的平均放電活動(dòng)αi(t)可以表示為
(11)
式中,δ是伸展反射增益。
1.2肢體動(dòng)態(tài)描述
肢體的動(dòng)態(tài)為肢體和肌肉的數(shù)學(xué)模型,此模型同樣由Bullock等[11]提出,目的是為了實(shí)現(xiàn)外界設(shè)備與大腦皮層神經(jīng)的交互,表示大腦運(yùn)動(dòng)區(qū)對(duì)肢體的控制作用的好壞。肢體動(dòng)態(tài)可以描述為
(12)
式中:pi(t)是主動(dòng)肌的位置,其運(yùn)動(dòng)過程為從起始位置到終止位置;pj(t)為對(duì)抗肌的位置,其滿足pi(t)+pj(t)=1;I是肢體的轉(zhuǎn)動(dòng)慣量;V表示關(guān)節(jié)的黏度;Ei表示作用在肢體系統(tǒng)上的外部力;M(ci(t)-pi(t))=max{ci(t)-pi(t),0}表示主動(dòng)肌所受到的力;ci(t)表示為肌肉收縮活動(dòng)動(dòng)態(tài),可以表示如下:
(13)
通過運(yùn)動(dòng)神經(jīng)元(式11)來驅(qū)動(dòng)肌肉模型(式13),肌肉模型驅(qū)動(dòng)肢體模型(式12),進(jìn)行自發(fā)的肢體運(yùn)動(dòng)。通過對(duì)肢體運(yùn)動(dòng)的狀態(tài)來判斷任務(wù)的完成情況,這也是后續(xù)進(jìn)行觀察任務(wù)完成實(shí)驗(yàn)時(shí)所需要的組成部分。
2.1Simulink仿真及數(shù)據(jù)獲取
為了驗(yàn)證所述機(jī)理模型的準(zhǔn)確性,并將產(chǎn)生的數(shù)據(jù)集應(yīng)用于解碼器的設(shè)計(jì),本文使用Matlab軟件,并在Simulink中建立了圖2所示模型,將設(shè)計(jì)的控制器應(yīng)用于此模型來驗(yàn)證控制器的可靠性。
圖2為式(1)~式(13)的Matlab仿真模型,其中ci為式(13)模塊的輸出結(jié)果值,pi和dpi為式(12)模塊的輸出,同時(shí)也是式(6)的輸入。
2.2數(shù)據(jù)集的獲取
對(duì)上述模型在Matlab中進(jìn)行迭代仿真,通過完成單關(guān)節(jié)伸展任務(wù)來獲得綜合數(shù)據(jù)集。在t=0時(shí)設(shè)置主動(dòng)肌的目標(biāo)位置,在t=50 ms時(shí)打開皮層網(wǎng)絡(luò)中的GO信號(hào),在前50 ms內(nèi)系統(tǒng)處于啟動(dòng)狀態(tài)。系統(tǒng)的初始條件設(shè)置如下:yj(0)=0.5,yi(0)=0.5,xi(0)=0.5,xj(0)=0.5,pi(0)=0.5,pj(0)=0.5,ui(0)=Bu,uj(0)=Bu,rj(0)=Br,ri(0)=Br。其余的初始狀態(tài)設(shè)置為0。其他的仿真參數(shù)引用文獻(xiàn)[11]中的參數(shù):I=200,V=10,ν=0.15,Br=0.01,Bu=0.01,Θ=0.5,φ=1,η=0.7,ρ=0.04,λi=150,Λ=0.001,δ=0.1,C=25,ε=0.05,Ψ=4,h=0.01,Ti=0.7,τ=0。
圖2 Simulink仿真模型Fig.2 simulation model of Simulink
在人機(jī)交互實(shí)驗(yàn)中,如果受試者在給定的時(shí)間內(nèi)成功完成指定的運(yùn)動(dòng)任務(wù),那么這次任務(wù)就可以被認(rèn)為是成功的。在具體的一次任務(wù)中,g0是常數(shù)。對(duì)于單獨(dú)的任務(wù),可設(shè)置g0=0.75。
實(shí)驗(yàn)中,完成任務(wù)的時(shí)間可以是變化的。對(duì)于一次任務(wù),輸入的GO信號(hào)控制著關(guān)節(jié)運(yùn)動(dòng)的速度,也就是能夠控制完成任務(wù)的時(shí)間,因此,在每次任務(wù)中內(nèi)部GO信號(hào)有一定的波動(dòng)。為了說明GO信號(hào)在任務(wù)與任務(wù)之間的波動(dòng)性,定義g0為變量,其服從期望為0.75、方差為0.002 5的高斯隨機(jī)分布。進(jìn)行1 500次同樣的伸展運(yùn)動(dòng)任務(wù),而且,在每次任務(wù)中設(shè)置仿真執(zhí)行時(shí)間為1 s,其中包括主動(dòng)肌達(dá)到目標(biāo)位置后的保持時(shí)間。為了產(chǎn)生綜合數(shù)據(jù)集,每10 ms測(cè)量一次區(qū)域4中的DVV、OPV、OFPV模塊的主動(dòng)神經(jīng)元和對(duì)應(yīng)的對(duì)抗神經(jīng)元的平均放電活動(dòng),同時(shí),測(cè)量肢體的主動(dòng)肌和對(duì)抗肌的總力差,如式(14)。
ΔM(k)=M(ci(t),pi(t))-M(cj(t),pj(t))
(14)
式中k=1,2,…,表示離散采樣時(shí)間點(diǎn),對(duì)于每次給定的任務(wù),數(shù)據(jù)在采樣點(diǎn)進(jìn)行記錄。通過這種方式,可以在1 500次實(shí)驗(yàn)中得到150 000個(gè)采樣點(diǎn)數(shù)據(jù)。使用此數(shù)據(jù)集進(jìn)行基于自適應(yīng)維納濾波的線性解碼器的開發(fā)。
2.3解碼器的設(shè)計(jì)
神經(jīng)生理學(xué)和人機(jī)交互實(shí)驗(yàn)研究表明,與運(yùn)動(dòng)任務(wù)相關(guān)的編碼信息和大腦皮層區(qū)域4神經(jīng)元放電的尖峰序列有關(guān)。對(duì)于一個(gè)給定的運(yùn)動(dòng)任務(wù),為了獲得和運(yùn)動(dòng)相關(guān)的皮層放電信息,設(shè)計(jì)一個(gè)解碼器,用來從連續(xù)放電尖峰序列中提取信息。很多的線性和非線性解碼器已經(jīng)被應(yīng)用于神經(jīng)元峰電位的研究中,比如基于維納濾波器(WF)、最速卡爾曼濾波(VKF)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)[12-13]算法的解碼器。本文使用線性濾波即維納濾波方法,從區(qū)域4中的DVV、OPV、OFPV神經(jīng)元放電活動(dòng)中提取主動(dòng)肌和對(duì)應(yīng)的對(duì)抗肌的總力差ΔM(k)。
ΔM(k)和平均放電活動(dòng)之間的關(guān)系如下:
(15)
式中:L是延時(shí)單元的個(gè)數(shù);N表示入口參數(shù)個(gè)數(shù),本文中N=6;zm(k-l)代表第m個(gè)入口參數(shù)延時(shí)l個(gè)采樣點(diǎn)的平均放電活動(dòng);wml是所對(duì)應(yīng)的權(quán)重;w是一個(gè)(L×N)×1的權(quán)重向量。
本文中,z1=yi,z2=yj,z3=ui,z4=uj,z5=ai,z6=aj。假設(shè)延時(shí)單元的數(shù)目L=10,因此,w是一個(gè)60×1的向量。
采用記錄的綜合數(shù)據(jù)集中的149 500個(gè)采樣點(diǎn)數(shù)據(jù)來訓(xùn)練權(quán)重向量w,設(shè)計(jì)的解碼器使用如下的歸一化最小方差算法:
(16)
式中:η∈(0,2);β是一個(gè)小正常數(shù);‖·‖表示歐幾里德范數(shù);e(k)是記錄的ΔM(k)與通過式(14)估計(jì)值的差。其中式(16)中的參數(shù)設(shè)置為η=0.01,β=1。訓(xùn)練后,保存最終的權(quán)值,然后,使用剩下的500個(gè)采樣值驗(yàn)證解碼器的性能,結(jié)果如圖3所示。其中,虛線表示實(shí)際的ΔM(k),實(shí)線表示估計(jì)的ΔM(k)。
圖3 解碼器性能測(cè)試Fig.3 Decoder performance test
2.4開環(huán)解碼性能
首先研究在不使用解碼器的系統(tǒng)中存在或缺少感官反饋時(shí)系統(tǒng)的性能。在這兩種情形下,仿真等式(1)~式(13),并設(shè)定g0=0.75。如果存在感官反饋,其系統(tǒng)初始狀態(tài)和參數(shù)設(shè)置與2.1節(jié)中的參數(shù)設(shè)置相同。如果不存在感官反饋,則令θ=0和ρ=0,其余參數(shù)相同。
研究使用解碼器的系統(tǒng)性能時(shí)分兩種情況,使用閉環(huán)(存在自然本體反饋信息)和開環(huán)(缺失自然本體反饋信息)的皮層神經(jīng)元數(shù)據(jù)。為此,用設(shè)計(jì)的解碼器(式14)來更換α運(yùn)動(dòng)神經(jīng)元活動(dòng)(式11)和收縮活動(dòng)(式13);然后,仿真式(1)~式(10)、式(12)和式(14)。對(duì)于開環(huán)皮層神經(jīng)元數(shù)據(jù),令θ=0和ρ=0。圖4示出了解碼器和實(shí)際系統(tǒng)在存在感官反饋和不存在感官反饋情形下主動(dòng)肌的位置軌跡。
在實(shí)際系統(tǒng)中,存在視覺反饋和不存在視覺反饋兩種情況下,主動(dòng)肌到達(dá)期望位置是可以實(shí)現(xiàn)的,其結(jié)果和現(xiàn)有的神經(jīng)生理學(xué)實(shí)驗(yàn)一致[14]。這里的神經(jīng)生理學(xué)實(shí)驗(yàn)是指一只被訓(xùn)練的沒有視覺反饋的猴子,在存在和缺失本體感受器的情況下達(dá)到期望的目標(biāo)位置實(shí)驗(yàn)[15]。
從圖4可以清楚地看到,使用閉環(huán)系統(tǒng)數(shù)據(jù)來訓(xùn)練解碼器,然后應(yīng)用到開環(huán)系統(tǒng)中,解碼器的性能大幅下降。在仿真中我們也觀察到,在缺失自然本體反饋信息的情況下,OPV、DVV、OFPV神經(jīng)元的放電活動(dòng)有顯著的變化。在視覺反饋信息缺失的情況下,肢體不能實(shí)時(shí)、準(zhǔn)確地到達(dá)指定位置,與存在視覺反饋時(shí)的肢體位置存在較大偏差,導(dǎo)致反饋到初級(jí)感覺區(qū)的編碼信息存在偏差。由于設(shè)計(jì)的解碼器的權(quán)重不能適應(yīng)大偏差,導(dǎo)致在缺失視覺反饋信息時(shí)解碼器的性能大幅下降,不能完成指定任務(wù)。為了獲得解碼器在缺失自然本體反饋信息的情況下的閉環(huán)性能,本文設(shè)計(jì)了根據(jù)皮層神經(jīng)元的輸入電流刺激和期望的理想刺激來實(shí)現(xiàn)控制策略的人工反饋。
圖4 存在和缺失視覺反饋時(shí)解碼器的主動(dòng)肌位置對(duì)比Fig.4 Comparison of decoder data in the presence and absence of visual feedback
3.1概述
為了恢復(fù)解碼器的閉環(huán)性能,通過設(shè)計(jì)人工反饋來刺激區(qū)域5中PPV神經(jīng)元的主動(dòng)部分,使PPV神經(jīng)元的主動(dòng)部分的平均放電活動(dòng)匹配它的自然放電活動(dòng)。該放電速率軌跡跟蹤問題可以等價(jià)于人機(jī)交互實(shí)驗(yàn)中通過刺激皮層中的初級(jí)軀體感覺區(qū)來恢復(fù)自然本體感覺信息。
3.2數(shù)據(jù)驅(qū)動(dòng)算法
對(duì)于開環(huán)情況下的性能缺失,使用基于數(shù)據(jù)驅(qū)動(dòng)算法的無(wú)模型控制策略來恢復(fù)開環(huán)腦機(jī)接口性能。考慮如下控制輸入準(zhǔn)則函數(shù):
(17)
其中λ是一個(gè)正的權(quán)重系數(shù)。此準(zhǔn)則函數(shù)中,由于λ[u(k)-u(k-1)]2項(xiàng)的引入,使得控制輸入量的變化受到限制。根據(jù)文獻(xiàn)[16]提出的對(duì)于單輸入單輸出非線性系統(tǒng)的3個(gè)假設(shè),基于緊格式動(dòng)態(tài)線性化方法的時(shí)變線性化模型為
y(k+1)=y(k)+φ(k)[u(k)-u(k-1)]
(18)
其中:y(k)、u(k)分別表示系統(tǒng)的輸出與輸入;φ(k)為偽偏導(dǎo)數(shù)。將式(18)代入準(zhǔn)則函數(shù)式(17)中,對(duì)u(k)求導(dǎo),并令其等于零,結(jié)果如下:
(19)
(20)
偽偏導(dǎo)數(shù)的估計(jì)準(zhǔn)則函數(shù)為
J(φ(k))=[y(k+1)-y(k)-φ(k)Δu(k)]2+
μ[φ(k)-φ(k-1))2
(21)
其中:y(k)表示系統(tǒng)的實(shí)際輸出;μ為正的權(quán)重系數(shù)。由式(18)和式(21),根據(jù)最優(yōu)條件可得偽偏導(dǎo)數(shù)的估計(jì)算法:
(22)
其中:η1為估計(jì)器的步長(zhǎng);μ為權(quán)重因子。式(21)中μ的作用有2個(gè):
(1) 它限制了Δu(k)的變化,從而限制了非線性系統(tǒng)由動(dòng)態(tài)線性系統(tǒng)線性替代的范圍,因此可以間接地限制偽偏導(dǎo)數(shù)值的變化。
(2) 它可以避免式(20)中分母可能為零的奇異情況。文獻(xiàn)[17]中加入收縮約束,使跟蹤誤差逐漸衰減。從控制律算法中可以看出,此類控制律與受控系統(tǒng)的數(shù)學(xué)模型結(jié)構(gòu)、系統(tǒng)階數(shù)無(wú)關(guān),僅利用系統(tǒng)I/O數(shù)據(jù)進(jìn)行設(shè)計(jì)。
這里,u(k)是設(shè)計(jì)的人工感官輸入。在時(shí)刻k測(cè)量的系統(tǒng)輸出y(k)就是區(qū)域5中PPV神經(jīng)元的平均放電活動(dòng)。y*(k+1)代表區(qū)域5中PPV神經(jīng)元的期望平均放電活動(dòng)。為了解決控制問題,首先計(jì)算期望平均放電活動(dòng),為此,計(jì)算式(1)~式(5)、式(6)、式(7)、式(10)、式(12)、式(14)。應(yīng)該注意的是使用了自然感官反饋到區(qū)域5中的PPV神經(jīng)元來計(jì)算期望的軌跡曲線。缺少了自然本體到區(qū)域4中的IFV和SFV神經(jīng)元,即在等式(10)中qi(k)=fi(k)=0。在要解的問題中計(jì)算xi(k),為此,使用了系統(tǒng)模型式(1)~式(4)、式(10)、式(12)、式(14)及PPV神經(jīng)元的放電活動(dòng)動(dòng)態(tài):
xi(t)max{Θyi(t)+u(k),0}
(23)
這里u(k)在tms到(t+10) ms采樣點(diǎn)期間是常量。
3.3仿真驗(yàn)證及結(jié)果分析
利用上述基于數(shù)據(jù)驅(qū)動(dòng)算法的緊格式無(wú)模型控制器,設(shè)計(jì)了人工反饋來刺激PPV神經(jīng)元,使用PPV神經(jīng)元的放電速率來模仿期望的PPV神經(jīng)元放電速率。其中對(duì)比實(shí)驗(yàn)為PID算法,其參數(shù)整定為通過調(diào)試選取最優(yōu)的控制器參數(shù)。
如圖5和圖6所示,控制器在跟蹤期望位置軌跡上執(zhí)行得很好,而且,通過設(shè)計(jì)的人工感官反饋來刺激區(qū)域5中PPV神經(jīng)元,恢復(fù)了主動(dòng)肌位置軌跡,因此,在缺少自然本體反饋時(shí)通過數(shù)據(jù)驅(qū)動(dòng)算法產(chǎn)生人工感官反饋來恢復(fù)解碼器的閉環(huán)性能是有效的?;謴?fù)了在這種條件下的解碼器的閉環(huán)性能,而且在一定程度上恢復(fù)了皮層神經(jīng)元的自然放電活動(dòng)。
圖5 PPV神經(jīng)元放電控制效果Fig.5 PPV neuron discharge control effect
圖6 肢體動(dòng)態(tài)控制效果對(duì)比Fig.6 Contrast of dynamic control effect of limbs
本文首先通過對(duì)皮層神經(jīng)元模型進(jìn)行仿真獲取存在視覺反饋時(shí)運(yùn)動(dòng)感覺區(qū)的放電活動(dòng)數(shù)據(jù)集;其次,通過使用存在視覺反饋時(shí)的神經(jīng)元放電數(shù)據(jù)集進(jìn)行解碼器的設(shè)計(jì),得到了維納濾波器最優(yōu)權(quán)值。然而,在使用此最優(yōu)權(quán)值解碼器進(jìn)行實(shí)驗(yàn)時(shí),發(fā)現(xiàn)其性能顯著下降,于是根據(jù)模型的輸入輸出數(shù)據(jù)設(shè)計(jì)的人工激勵(lì)電流反饋可以解決上述問題。即通過使用基于數(shù)據(jù)驅(qū)動(dòng)算法的緊格式無(wú)模型控制算法來產(chǎn)生人工激勵(lì)電流反饋恢復(fù)自發(fā)單關(guān)節(jié)伸展運(yùn)動(dòng)中的閉環(huán)性能。這是首次將數(shù)據(jù)驅(qū)動(dòng)算法系統(tǒng)性地應(yīng)用于恢復(fù)基于皮層神經(jīng)元模型的閉環(huán)性能。
通過對(duì)數(shù)據(jù)驅(qū)動(dòng)算法和PID控制算法在恢復(fù)閉環(huán)性能的效果進(jìn)行對(duì)比,可以看出前者的效果好于后者,另外,國(guó)內(nèi)外已經(jīng)驗(yàn)證了在跟蹤大腦皮層感覺神經(jīng)元的自然放電活動(dòng)時(shí)通過使用一個(gè)外在的刺激能接近運(yùn)動(dòng)任務(wù)時(shí)的自然性能[18]。這為系統(tǒng)模型未知時(shí),僅根據(jù)對(duì)象的輸入、輸出數(shù)據(jù)來恢復(fù)閉環(huán)性能提供了新的思路。
[1] NICOLELIS M A L,LEBEDEV M A.Principles of neural ensemble physiology underlying the operation of brain-machine interfaces[J].Nature Reviews Neuroscience,2009,10(7):530-540.
[2] PAN H,DING B,ZHONG W,etal.Designing closed-loop brain-machine interfaces with network of spiking neurons using MPC strategy[C]//American Control Conference IEEE.USA:IEEE, 2015:2543-2548.
[3] CUNNINGHAM J P,NUYUJUKIAN P,GILJA V,etal.A closed-loop human simulator for investigating the role of feedback control in brain-machine interfaces[J].Journal of Neurophysiology,2011,105(4):1932-1949.
[4] KOBER S E,WOOD G,KURZMANN J,etal.Near-infrared spectroscopy based neuron feedback training increases specific motor imagery related cortical activation compared to sham feedback[J].Biological Psychology,2014,95(1):21-30.
[5] BIRBAUMER N,COHEN L G.Brain-computer interfaces:Communication and restoration of movement in paralysis[J].Journal of Physiology,2007,579(3):621-636.
[7] KOYAMA S,CHASE S M,WHITFORD A S,etal.Comparison of brain-computer interface decoding algorithms in open-loop and closed-loop control[J].Journal of Computational Neuroscience,2010,29(1):73-87.
[8] ODOHERTY J E,LEBEDEV M A,IFFT P J,etal.Active tactile exploration using a brain-machine-brain interface[J].Nature,2011,479(7372):228-31.
[9] DOUGLAS J W,BRIAN M L,JAMES A H,etal.Limb-state information encoded by peripheral and central somatosensory neurons:Implications for an afferent interface[J].IEEE Transactions on Neural Systems & Rehabilitation Engineering A Publication of the IEEE Engineering in Medicine & Biology Society,2011,19(5):501-513.
[10] 侯忠生,許建新.數(shù)據(jù)驅(qū)動(dòng)控制理論及方法的回顧和展望[J].自動(dòng)化學(xué)報(bào),2009,35(6):650-667.
[11] BULLOCK D,CISEK P,GROSSBERG S.Cortical networks for control of voluntary arm movements under variable force conditions[J].Cerebral Cortex,1998,8(1):48-62.
[12] KIM S P,SANCHEZ J C,RAO Y N,etal.A comparison of optimal MIMO linear and nonlinear models for brain-machine interfaces[J].Journal of Neural Engineering,2006,3(2):145-61.
[13] SUSSILLO D,NUYUJUKIAN P,JOLINE M F,etal.A recurrent neural network for closed-loop intracortical brain-machine interface decoders[J].Journal of Neural Engineering,2012,9(2):026027.
[14] LI S,ZHUANG C,HAO M,etal.Coordinated alpha and gamma control of muscles and spindles in movement and posture[J].Frontiers in Computational Neuroscience,2015,9:122.
[15] ALEXANDER G E,CRUTCHER M D.Preparation for movement:Neural representations of intended direction in three motor areas of the monkey[J].Journal of Neurophysiology,1990, 64(1):133-150.
[16] JIN S T,HOU Z S,CHI R H,etal.Data-driven model-free adaptive iterative learning control for a class of discrete-time nonlinear systems[J].Control Theory & Applications,2012,29:1001-1009.
[17] LENG Yancun,LI Hongxin,WANG Pu,etal.Model-free adaptive control with contractive constraints for nonlinear systems[C]//International Conference on Intelligent Human-Machine Systems & Cybernetics.USA:IEEE,2014:288-291.
[18] KUMAR G,SCHIEBER M H,THAKOR N V,etal.Designing closed-loop brain-machine interfaces using optimal receding horizon control[C]//American Control Conference.USA:IEEE,2013:5029-5034.
DesignofClosedLoopBrainComputerInterfaceBasedonDataDriven
SUNJing-gao1,QIChuan1,PANHong-guang2
(1.SchoolofInformationScienceandEngineering,EastChinaUniversityofScienceandTechnology,Shanghai200237,China;2.SchoolofElectricalandControlEngineering,Xi’anJiaotongUniversity,Xi’an710049,China)
In this paper,we consider the simulation model of cortical neural network and the analysis of the single joint movement tasks based on the control theory.The linear decoder design of neuron discharge activity is designed using adaptive Wiener filter.The performance of the decoder is severely reduced when the visual feedback information is missing.Hence,this paper further utilizes a data driven tightly formatted model-free control algorithm to generate stimulus signals such that the neurons in the sensory area of the cerebral cortex can be stimulated to track the neuronal firing activity in sensory areas.Due to the recovery of neuron discharge information in the sensory area,the performance of the decoder in the absence of sensory feedback information can be also restored.Finally,the simulation results illustrate the effectiveness of the artificial sensory feedback based on data driven algorithm,which also verify the performance of the closed loop system in this work,compared with PID algorithm.
cerebral cortex simulation model; modeling free control; decoder; data driven
TP273
A
1006-3080(2017)05-0655-07
10.14135/j.cnki.1006-3080.2017.05.009
2016-11-15
國(guó)家自然科學(xué)基金青年基金(61603295)
孫京誥(1971-),男,山東人,副研究員,研究方向?yàn)檫^程控制、先進(jìn)控制算法及應(yīng)用。E-mail:sunjinggao@126.com
戚 川,E-mail:13816389335@163.com