馮 宇
(長安大學 電子與控制工程學院,陜西 西安 710064)
預測模型廣泛應用于科學研究和工業(yè)生產(chǎn)的各個領域,系統(tǒng)的預測模型是指用數(shù)學語言或公式來描述系統(tǒng)的輸入與輸出間的關系,其主要功能是建立連續(xù)或離散的函數(shù)模型,預測給定自變量對應的因變量的值[1],其數(shù)學本質(zhì)是建立一個預測函數(shù),使得對于每一個提前期,實際值與預測值之間的偏差的均方盡可能小[2]。建立預測模型有多種思路,例如趨勢外推預測、回歸預測、卡爾曼濾波預測、組合預測等[3-6],在這些思路的基礎上已有多種預測模型被建立并廣泛使用,但多數(shù)預測模型針對的是一維輸出系統(tǒng),即需要預測的參數(shù)是一維的。隨著數(shù)據(jù)量和系統(tǒng)復雜程度的增加,需要尋求建立同時預測多維輸出的預測模型。文中研究基于張量偏最小二乘法(tensor partial least squares,TPLS)的高維輸入輸出預測模型的建模方法,該方法可在不進行降維操作的情況下直接處理輸入輸出均為張量的高維數(shù)據(jù),從而降低了因數(shù)據(jù)結(jié)構(gòu)遭到破壞而導致信息丟失的風險。建模實驗數(shù)據(jù)來源于心臟傳導系統(tǒng)的電生理信息,通過正常和急性高血糖環(huán)境下電生理信息數(shù)據(jù)的特征,同時預測急性高血糖的濃度和作用時間。
(1)
按照元素可以表示為:
(2)
圖1 張量偏最小二乘法分解示意
(3)
為了解決唯一性問題和潛變量的維數(shù)問題,可以增加約束條件:
(4)
‖tr‖F(xiàn)=1
(5)
式4表示負載矩陣序列是列正交的;
式5表示潛變量的維數(shù)為1。
定義核張量:
(6)
則式3可以寫成:
(7)
為了在保證共同隱向量t的前提下使殘差E和F最小,需要引入三個定理:
(8)
式8的最小二乘解可以寫為:
(9)
s.t. 矩陣P(n)列正交,且‖t‖F(xiàn)=1
(10)
(11)
s.t. 矩陣P(n)列正交,且‖t‖F(xiàn)=1
(12)
三個定理的證明可參考文獻[8-9,12]。
假設已知正交矩陣P(n)和Q(m)以及向量t,根據(jù)定理1,式3的核張量可以寫成如下形式:
(13)
(14)
(15)
則優(yōu)化問題可以表示為:
(16)
其中,P(n)(n=1,2,…,N-1),Q(m)(m=1,2,…,M-1)為待優(yōu)化的參數(shù)。
上述的計算步驟循環(huán)進行,直到所有元素都被計算一次或者殘差小于給定的范圍為止。
//r=1,2,…,R;n=1,2,…,N-1;m=1,2,…,M-1
forr=1 toRdo
{
{
}
else
break;
}
本實驗使用MED64微電極陣列測量系統(tǒng)(AlphaMedScience,日本)來進行數(shù)據(jù)采集和分析。系統(tǒng)包括傳感器、信號放大電路、控制器、采集和處理數(shù)據(jù)所用的計算機以及生物實驗相關設備(顯微鏡、灌流槽、蠕動泵等)。實驗動物使用雄性C57/BL6J小鼠(年齡8~12周,體重20~25 g),實驗操作過程符合長安大學生物實驗操作規(guī)程和倫理學要求。實驗中首先取出小鼠心臟,使用有鈣臺式液和Langendorff離體心臟灌流方法進行離體灌流,然后將右心房置于下方,直接與傳感器測量平面接觸,進行信號測量。整個測量過程中,給樣本持續(xù)提供有鈣臺式液(溶液中加入5%二氧化碳和95%氧氣),流速為5 ml/min,每次實驗中給樣本加入不同濃度的高糖溶液(濃度分別為20 mM、30 mM、40 mM和50 mM)。在每次實驗中,首先記錄對照樣的測量信號,隨后,從第0分鐘開始加入高糖溶液,持續(xù)加入40分鐘。每種濃度加入后,從第0分鐘開始,每間隔5分鐘測量一次,采樣頻率為20 kHz,每次測量持續(xù)30 s。
(19)
表1 三種二維輸出預測模型的預測結(jié)果
圖2 三種方法預測值和實際值的對比
文中使用基于張量偏最小二乘法的高維輸入輸出預測模型,實現(xiàn)了高糖溶液對生物樣本的作用時間和高糖溶液濃度兩個輸出變量的同時預測。與傳統(tǒng)的多向偏最小二乘法和多維偏最小二乘法相比較,基于張量偏最小二乘法的預測模型最適合用于對急性高血糖濃度和作用時間同時預測。
未來應研究不同維度的輸出數(shù)據(jù)間存在關聯(lián)時預測模型的優(yōu)化問題,并且應關注該方法的臨床可操作性,即如何在體表提取與急性高血糖密切相關的電生理信號,使該方法可以為急性高血糖的臨床醫(yī)學診斷提供指導與建議。