韓 亮,蔡文濤,蒲秀娟,羅統(tǒng)軍,黃 謙
(1.重慶大學微電子與通信工程學院,重慶 400044;2.生物感知與智能信息處理重慶市重點實驗室,重慶 400044)
胎兒電子監(jiān)護能反映胎兒健康狀況,便于各類胎兒疾病的早期診斷與及時治療,從而降低圍產(chǎn)兒的發(fā)病率[1].目前在臨床中使用最多的胎兒電子監(jiān)護技術是胎心宮縮圖[2],但利用胎心宮縮圖難以獲取可靠的瞬時胎兒心率變異信息[3].胎兒心電信號(Fetal Electro-CardioGram,F(xiàn)ECG)能無創(chuàng)地對胎兒健康狀況進行長期連續(xù)監(jiān)護,并實時提供高精度的胎兒心率信息,具有廣闊應用前景.
非侵入式FECG 采集方法置電極于孕婦體表,能長期連續(xù)監(jiān)護胎兒健康狀況[4].但采用該方法從母體腹壁獲得的FECG 受到以母體心電(Maternal ElectroCardioGram,MECG)成分為主的各種干擾的污染[5].FECG和MECG 成分在時域和頻域都大部分重疊在一起,且MECG 成分的時域幅度和頻域能量均遠大于FECG,因此,如何從母體腹壁混合信號中有效抑制MECG 成分是一個巨大挑戰(zhàn).
基于非侵入式采集方法的FECG 信號提取方法分為組合源方法和腹部源方法[6].組合源方法需置電極于母體胸部和腹部,主要包括自適應濾波[7]、人工神經(jīng)網(wǎng)絡[8]、支持向量機[9]等.腹部源方法僅需置電極于母體腹部,便于臨床應用,主要包括模版相減法[10]、卡爾曼濾波[11]、小波變換[12]、盲源分離[13]等.
應用于FECG 提取的機器學習方法通常使用均方誤差(Mean Squared Error,MSE)損失函數(shù)作為目標函數(shù),將輸出信號與目標信號差值作為FECG.但是,MSE損失函數(shù)僅表示輸出信號與目標信號之間的均方誤差最小,并不意味著FECG 的質(zhì)量最好.LightGBM[14,15]是一種基于梯度提升決策樹的集成學習模型,常用于分類和回歸等機器學習任務.Outram[16]將互相關分析用于估計FECG 的信噪比,其信噪比越高,說明FECG 質(zhì)量越好.為此,本文提出一種使用信噪比正則化Light-GBM 的FECG 提取方法.針對原始母體腹壁混合信號,先使用傳統(tǒng)濾波方法進行噪聲抑制;再使用FastICA 從中分離得到MECG 估計和FECG估計;構建信噪比正則化LightGBM 模型并使用該模型估計殘留于FECG 估計中的MECG 成分,將其抑制后最終獲得高質(zhì)量的FECG.
基于非侵入式采集方法的FECG 提取方法分為組合源方法和腹部源方法,如圖1所示.
圖1 FECG采集示意圖
其中,腹部源方法僅需采集母體腹壁混合信號,主要分為兩類:一類是模版相減法,針對心電信號在時域中的特點,利用母體腹壁混合信號的相關信息生成其中包含的MECG 成分模板,然后將其抑制;另一類是盲源分離法,該方法基于空間技術,通過使用相關源信號的空間分布信息提取FECG.針對原始母體腹壁混合信號,運用這兩大類腹部源方法能夠提取FECG,但其中仍殘留有MECG成分等噪聲.
為從母體腹壁混合信號中提取高質(zhì)量的FECG,本文提出一種使用信噪比正則化LightGBM 的FECG 提取方法,如圖2所示.
圖2 使用信噪比正則化LightGBM的FECG提取方法
LightGBM[14]是對梯度提升決策樹的高效實現(xiàn)框架,在不損失預測準確率的前提下具有更快的訓練速度、更高的效率和更低的內(nèi)存消耗.LightGBM 用于解決回歸問題,通常采用MSE 損失函數(shù)作為目標函數(shù),其定義如下:
其中,L(θ)表示損失函數(shù),xi表示輸入向量,yi表示相應的目標值,f(xi;θ)表示在輸入向量xi和網(wǎng)絡參數(shù)θ條件下的LightGBM網(wǎng)絡的輸出.
由2.2 節(jié)的分析可知:MSE 損失函數(shù)不能直接表征提取得到的FECG 的質(zhì)量.為此,本文在傳統(tǒng)LightGBM模型的目標函數(shù)中增加FECG 的信噪比作為正則項,構建信噪比正則化LightGBM模型,其目標函數(shù)優(yōu)化為
其中,L(θ)為損失函數(shù),本文選擇MSE 損失函數(shù),其定義如式(6)所示;R(θ)為正則項,表示FECG 的信噪比,其定義如式(8),即
其中,f(xi;θ)表示在輸入向量xi和網(wǎng)絡參數(shù)θ條件下的LightGBM 網(wǎng)絡的輸出,(yi-f(xi;θ))表示FECG 估計.λ為加權系數(shù),用于控制損失項和正則項的權重.
根據(jù)式(7)和式(8),信噪比正則化LightGBM 模型優(yōu)化后的目標函數(shù)為
由于胎兒心電信號信噪比越高表示FECG 質(zhì)量越好,所以λ取負值.改進后的目標函數(shù)的最小化同時反映了MECG成分的最優(yōu)估計和FECG的最佳質(zhì)量.
FECG信噪比的計算方法如下[18].
步驟1使用傳統(tǒng)QRS檢測算法[19]確定FECG 的R峰位置.以R峰位置為基準將FECG 分為等長的L段,每段均含有一個完整的QRS 波群.構建一個K行L列的矩陣MK×L,其中,K為每段采樣點數(shù).
步驟2基于互相關系數(shù)估計的信噪比如下:
步驟3基于特征值分析估計的信噪比如下:
其中,λi是矩陣MTM的特征值,λ1是矩陣MTM的最大特征值.
SNRcor和SNRsvd越高,說明FECG 質(zhì)量越高.在高信噪比條件下,SNRcor和SNRsvd都具有很高的估計精度,但是,在低信噪比條件下,SNRcor的估計精度要明顯優(yōu)于SNRsvd,這是由于SNRcor估計方法不依賴信號成分的精確估計[16].因此,本文選擇SNRcor作為信噪比正則化LightGBM模型的正則項.
本文使用PhysioNet 2013 挑戰(zhàn)賽[20]SET-A 中的7 組真實腹部源心電數(shù)據(jù)進行實驗,每組數(shù)據(jù)中包含4路腹壁混合信號,其采樣頻率為1 000 Hz,采集時間為1 min.在A15中截取一段長為2 000個采樣點(40~42 s)的數(shù)據(jù)繪制于圖3(縱坐標表示相對幅度,橫坐標表示采樣點).
圖3 A15(40~42 s)預處理后數(shù)據(jù)
在圖3 中,虛線框1~3 分別顯示了MECG 成分與FECG部分重疊、不重疊和完全重疊的情況.
主觀評價通過觀察FECG 波形是否理想和MECG成分殘留情況來分析FECG提取方法的性能.
客觀評價方法如下.
(1)臨床評價指標
使用傳統(tǒng)QRS 檢測算法[19]確定提取得到的FECG的R 峰位置,并依據(jù)PhysioNet 2013 挑戰(zhàn)賽[20]SET-A 給定的FECG 的R 峰的標準位置,計算靈敏度(Se)、陽性預測值(PPV)和F1分數(shù)[21,22]:
其中,TP(True Positive)、FP(False Positive)和FN(False Negative)分別表示正確檢測的、錯誤檢測的和漏檢的FECG 的R 峰位置個數(shù).靈敏度(Se)、陽性預測值(PPV)和F1分數(shù)的值越高,表示性能越好.
(2)信噪比指標
采用如2.4 節(jié)所述SNRcor和SNRsvd評價提取得到的FECG質(zhì)量.
本文所有實驗采用的計算機CPU 為Intel Core i7-9700K,CPU主頻為3.60 GHz,內(nèi)存為32 GB,操作系統(tǒng)為Windows 10 專業(yè)版,編程工具為Python和Matlab R2019a,機器學習庫使用Scikit-Learn和Lightgbm3.3.0.
采用第3 節(jié)所述的使用信噪比正則化LightGBM 的FECG 提取方法,對4.1 節(jié)所述真實腹部源心電數(shù)據(jù)進行實驗.首先對原始母體腹壁混合信號進行噪聲抑制,然后使用FastICA 分離得到MECG 估計(t)和FECG估計(t),參數(shù)設定為源數(shù)量n=4.選取A15第40~42 s的實驗結果繪制于圖4.
由圖4 可知,信號經(jīng)FastICA 分解后輸出的獨立成分中,前兩個獨立成分為噪聲,第3 個獨立成分含有較好形態(tài)的MECG,選擇其作為MECG 估計(t),第4 個獨立成分含有較為明顯的FECG,選擇其作為FECG 估計(t).進一步仔細觀察圖4 中的第4 路信號,可以發(fā)現(xiàn)其中殘留了明顯的MECG 成分和其他噪聲,需要對其進行進一步抑制.
圖4 A15(40~42 s)經(jīng)FastICA分解得到的獨立成分
使用信噪比正則化LightGBM 模型進一步抑制FECG 估計(t)中殘留的MECG 成分.使用網(wǎng)格搜索法進行參數(shù)優(yōu)化后確定的模型參數(shù)見表1.選取A15第40~42 s的實驗結果繪制于圖5.
圖5 A15(40~42 s)經(jīng)FastICA-信噪比正則化LightGBM提取的FECG
表1 信噪比正則化LightGBM模型參數(shù)
由圖5 可知,與FastICA 分離得到的FECG 估計(t)相比,在MECG 成分與FECG 成分部分重疊、不重疊和完全重疊(虛線框1~3)情況下,經(jīng)FastICA-信噪比正則化LightGBM 均能提取得到的清晰完整的FECG,且其中殘留的MECG成分明顯減少,F(xiàn)ECG質(zhì)量更高.
采用4.2 節(jié)所述客觀評價方法對經(jīng)FastICA和經(jīng)FastICA-信噪比正則化LightGBM 提取得到的FECG 進行計算,結果分別見表2和表3.
表2 使用FastICA的FECG提取方法的性能評價
表3 使用FastICA-信噪比正則化LightGBM的FECG提取方法的性能評價
由表2和表3 可知,使用FastICA 直接提取的FECG質(zhì)量較低,需進一步抑制其中殘留的MECG 成分和其他噪聲.與使用FastICA 的FECG 提取方法相比,使用FastICA-信噪比正則化LightGBM 提取得到的FECG 的各項性能指標均有顯著提升,其中SNRcor平均提高了2.9 dB,SNRsvd平均提高了2.7 dB,PPV 平均提高了10.8%,F(xiàn)1分數(shù)平均提高了6.7%,Se 在接近99%的情況下也平均提高了1.3%.這充分表明使用信噪比正則化LightGBM 模型能有效抑制殘留的MECG 成分和其他噪聲,提取高質(zhì)量的FECG.
綜上所述,主觀和客觀性能評價都充分表明本論文提出的使用信噪比正則化LightGBM 的FECG 提取方法能夠從母體腹壁混合信號中提取得到完整清晰的FECG,且其質(zhì)量明顯高于使用FastICA直接提取的FECG.
為進一步驗證本文提出的使用信噪比正則化LightGBM 的FECG 提取方法,使用4.1 節(jié)所述真實心電數(shù)據(jù)進行實驗,首先對原始母體腹壁混合信號進行噪聲抑制,然后分別進行如下對比實驗.
實驗1:分別使用TFBSS,TFBSS-LightGBM和TFBSS-信噪比正則化LightGBM 提取FECG,選取A15第40~42 s的實驗結果繪制于圖6.
圖6 A15(40~42 s)對比實驗1
實驗2:分別使用RobustICA,RobustICA-LightGBM和RobustICA-信噪比正則化LightGBM 提取FECG,選取A15第40~42 s的實驗結果繪制于圖7.
圖7 A15(40~42 s)對比實驗2
實驗3:分別使用FastICA,F(xiàn)astICA-LightGBM和FastICA-信噪比正則化LightGBM 提取FECG,選取A15第40~42 s的實驗結果繪制于圖8.
其中,TFBSS參數(shù)設定為n=4,Nf=256,Nt=256,tol=1256,RobustICA 的參數(shù)設定為prewhi=true,F(xiàn)astICA的參數(shù)設定為n=4;信噪比正則化LightGBM 的參數(shù)如表1 所示;除不含目標函數(shù)加權系數(shù)λ這個參數(shù)外,傳統(tǒng)LightGBM 的其余參數(shù)與信噪比正則化LightGBM 的參數(shù)一致.
由圖6~圖8可知:
圖8 A15(40~42 s)對比實驗3
(1)使用TFBSS,RobustICA和FastICA 直接提 取FECG,在MECG 成分和FECG 成分部分重疊(虛線框1)的情況下,TFBSS,RobustICA和FastICA 均未能有效抑制MECG成分;
(2)采用傳統(tǒng)LightGBM 抑制MECG 成分后,在MECG 成分和FECG 成分部分重疊、不重疊和完全重疊(虛線框1~3)情況下,TFBSS-LightGBM,RobustICALightGBM和FastICA-LightGBM 均較為有效地抑制了MECG成分;
(3)采用信噪比正則化LightGBM 抑制MECG 成分后,在MECG 成分和FECG 成分部分重疊、不重疊和完全重疊(虛線框1~3)情況下,TFBSS-信噪比正則化LightGBM、RobustICA-信噪比正則化LightGBM和FastICA-信噪比正則化LightGBM 均有效抑制了MECG 成分和部分噪聲,且其性能分別優(yōu)于TFBSS-LightGBM,RobustICA-LightGBM和FastICA-LightGBM,這表明信噪比正則化LightGBM 模型比傳統(tǒng)LightGBM 模型更適用于FECG提取.
采用4.2 節(jié)所述臨床評價指標和信噪比指標計算方法分別對實驗1~3 提取得到的FECG 進行計算,對每種方法在7 組數(shù)據(jù)集上實驗結果的客觀性能評價指標取平均值,如表4所示.
由表4可知:
表4 FECG提取方法性能對比(平均值)
(1)使用TFBSS,RobustICA和FastICA 直接提取的FECG的客觀評價指標均不太高,其質(zhì)量相對較低;
(2)分別使用TFBSS-LightGBM,RobustICA-LightGBM和FastICA-LightGBM 三種方法提取的FECG,相對于使用TFBSS,RobustICA和FastICA直接提取的FECG,其客觀評價指標有所提高,這說明盲源分離方法結合Light-GBM是有效的,其中,F(xiàn)astICA-LightGBM方法優(yōu)于TFBSS-LightGBM和RobustICA-LightGBM方法;
(3)分別使用TFBSS-信噪比正則化LightGBM,RobustICA-信噪比正則化LightGBM和FastICA-信噪比正則化LightGBM三種方法提取的FECG,其客觀評價指標明顯提高,這說明本論文提出的信噪比正則化LightGBM模型在性能上優(yōu)于傳統(tǒng)LightGBM模型,更適用于FECG提取,其中,F(xiàn)astICA-信噪比正則化LightGBM 提取的FECG 的客觀評價指標最高,這說明FastICA-信噪比正則化LightGBM方法的性能優(yōu)于其他FECG提取方法.
綜上所述,本文提出的使用信噪比正則化Light-GBM 的FECG 提取方法無論在主觀視覺評價還是在客觀性能指標上都明顯優(yōu)于其他傳統(tǒng)的FECG提取方法.本文提出的信噪比正則化LightGBM 模型比傳統(tǒng)Light-GBM模型更適用于FECG提取,采用本文提出的信噪比正則化方法有效提高了FECG提取方法的性能.
本論文提出一種使用信噪比正則化LightGBM 的FECG 提取方法.針對母體腹壁混合信號,首先使用傳統(tǒng)濾波方法進行噪聲抑制,然后使用FastICA 分離得到MECG 估計和FECG 估計,再使用信噪比正則化Light-GBM 模型擬合MECG 成分與MECG 之間的非線性變換,抑制FECG 估計中殘留的MECG 成分,得到高質(zhì)量的FECG.實驗結果表明,本文提出的使用信噪比正則化LightGBM 的FECG 提取方法是有效的,且無論在主觀視覺效果還是在臨床評價指標和信噪比評價指標上,均優(yōu)于基于盲源分離的FECG 提取方法,也優(yōu)于盲源分離結合傳統(tǒng)LightGBM 的FECG 提取方法.本文提出的FECG 提取方法能夠從母體腹壁混合信號中直接提取FECG,更便于臨床應用.
除LightGBM 模型外,還有大量的機器學習模型被廣泛應用于生物醫(yī)學信號處理領域,因此,研究如何將本文提出的信噪比正則化方法與其他機器學習模型相結合,提取得到更高質(zhì)量的FECG是下一步研究方向.