宋 群,袁青霞,王俊江
(1.西北工業(yè)大學 自動化學院,陜西 西安 710072;2.中科銳眼(天津)科技有限公司,天津 300350;3.天津城建大學 體育部,天津 300384)
心臟疾病已經(jīng)成為當今世界上最主要的公共衛(wèi)生挑戰(zhàn)之一,對人類的健康和生命造成了極大的威脅[1]。隨著現(xiàn)代生活方式的改變和人口老齡化程度的加深,心臟疾病的發(fā)病率不斷攀升。因此,心臟疾病的監(jiān)測變得至關重要,它可以幫助醫(yī)務人員盡早發(fā)現(xiàn)心臟問題,及時采取干預措施,避免悲劇性后果的發(fā)生。有效的監(jiān)測不僅有助于診斷心臟病癥,還可以評估患者的風險因素,制定個體化的診療方案。因此,進行實時心電監(jiān)測并對監(jiān)測結果進行分析和解釋,對于保障人類健康、提高全人類生活質量具有重要意義。
心電圖(electrocardiogram,ECG)是記錄心臟電活動的無創(chuàng)方法,由于其簡單、低成本和高精度,已經(jīng)成為心血管病診斷中最常用的工具之一[2]。運動ECG技術是一種能夠記錄運動過程中ECG變化的技術,通過實時檢測ECG信號,研究對象在物理活動條件下的心臟生理學。近年來,運動ECG技術得到了廣泛應用,成為評估運動員運動期間心臟功能的常用工具[3]。而隨著傳感器和信號處理技術的快速進步,運動ECG監(jiān)測設備的靈敏度和特異性也得到了極大的提高,使其成為篩查運動員是否患有潛在心血管疾病的有效工具之一。在此基礎上,高錦煒設計了一種基于離散小波變換(discrete wavelet transformation,DWT)的低功耗實時ECG信號處理器[4]。該處理器通過使用DWT算法將ECG信號轉換為時頻域信號,并采用自適應閾值算法進行去噪和R波檢測。實驗結果表明,該處理器準確性高,節(jié)能效果顯著,非常適合移動設備上的應用。楊宇等人探討了基于小波變換和支持向量機(support vector machine,SVM)的ECG信號分類方法[5]。該方法用小波變換將ECG信號轉換到小波域,然后,使用SVM分類器對不同類別的ECG信號進行分類。研究結果表明,該方法在分類準確率和魯棒性方面表現(xiàn)優(yōu)異。Park等人提出了一種改進的小波變換算法WTSEE用于R波檢測[6]。該算法在常規(guī)小波變換的基礎上,增加了非線性閾值控制和動態(tài)滑動窗口等優(yōu)化方式,能夠提高R波檢測的準確性和穩(wěn)定性。實驗結果表明,該算法比傳統(tǒng)的R波檢測算法更具優(yōu)勢。朱俊江等人討論了基于小波分析的ECG信號去噪方法[7]。該方法將小波分析與濾波技術相結合,能夠克服傳統(tǒng)帶通濾波器存在的較大幅度漂移和陡峭濾波器存在的過度去噪問題,效果顯著。王鳳提出了一種基于多尺度分析的ECG信號分類算法[8]。該算法通過多尺度小波分解實現(xiàn)了對ECG信號的多層次特征提取,然后,使用基于集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)的自適應閾值算法對不同類別的ECG信號進行分類。研究結果表明,該算法在分類準確率和穩(wěn)定性方面都表現(xiàn)良好。馬金偉探討了如何使用深度學習技術對ECG信號進行自動分類[9]。其提出的融合網(wǎng)絡模型可以從ECG信號中學習到有效的特征,并且能夠實現(xiàn)高精度的分類,同時還可以用于檢測不同類型的心臟病。Prakash等人探討了如何改善ECG信號檢測中的假陽性問題[10]。該研究采用隨機森林算法對ECG信號進行分類和去噪,能夠有效地減少假陽性率,并提高整體的診斷準確性,同時也適用于其他醫(yī)學領域中的信號處理問題。孟琭等人提出了一種基于卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的ECG信號分類算法[11]。該算法具有較高的分類準確率,可以有效地區(qū)分正常和異常ECG信號,此外,還表現(xiàn)出較強的魯棒性,適用于不同的數(shù)據(jù)集和應用場景。吳佳全提出了一種基于雙向長短時記憶網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的ECG信號分類算法[12]。該算法模擬了人類心臟的生理特性,能夠高效地提取和識別ECG信號中的特征,并且在分類準確率和穩(wěn)定性方面都表現(xiàn)良好。孟瑤開發(fā)了一款基于移動設備的實時ECG信號檢測系統(tǒng)[13]。該系統(tǒng)采用低功耗計算架構和自適應閾值算法,可以實時獲取、去噪和分析ECG信號,具有良好的性能和可靠性,適用于臨床和家庭健康監(jiān)測等領域。然而,由于人體生理特征和運動狀態(tài)下心臟電信號變化等因素的影響,ECG實時檢測技術在精度上還有一定的提升空間。
近年來,機器學習在時序信號領域的應用備受關注,其中,ECG信號是一個典型的例子[14]。過去,基于物理模型的方法如差分方程和傅里葉變換等被廣泛應用于處理這類信號,但需要手動提取信號特征,往往過于簡化實際情況。在近年的一些研究中,一些學者通過引入機器學習算法自動提取時序信號特征,并對信號進行分類和預測。然而,目前主流的機器學習模型都是由專家進行人工設計,需要手動調(diào)整模型結構和超參數(shù)設置,導致這些模型在不同數(shù)據(jù)集中的泛化性和靈活性受到限制。為了實現(xiàn)對模型結構和參數(shù)的自適應調(diào)整,有學者提出了新的理論,即神經(jīng)網(wǎng)絡架構搜索(neural architecture search,NAS)。該理論旨在自動化地發(fā)現(xiàn)合適的神經(jīng)網(wǎng)絡結構以完成特定的人工智能任務。其中, Liu等人提出了利用梯度下降算法搜索卷積神經(jīng)網(wǎng)絡架構的高效策略DARTS,并在ImageNet數(shù)據(jù)集上獲得了令人矚目的結果[15]。Pham等人通過強化學習訓練一個控制器,從大量計算圖中選擇最優(yōu)子圖,并預測子圖驗證準確度,輕松構建最優(yōu)神經(jīng)網(wǎng)絡結構[16]。Chen等人提出采用序列化的模型優(yōu)化方法對更大規(guī)模的問題進行了優(yōu)化[17]。Cai等人提出一種基于梯度的可微架構搜索算法,采用管道連接將神經(jīng)網(wǎng)絡分解為3個基本構建塊:卷積、標準化和非線性變換[18]。Brock等人為每個可能的子網(wǎng)絡賦予一個共享的向量,并使用共享的控制器搜索網(wǎng)絡結構和權重,以支持快速、大規(guī)模的架構搜索[19]。Shen等人通過采用新的搜索策略,將多個搜索過程組合起來,更好地探索架構空間,并使用注意力機制關注重要部分,實現(xiàn)高效的架構搜索[20]。Wu等人采用自適應資源分配來實現(xiàn)高效的訓練,從一個較小的“種子”網(wǎng)絡開始,逐步迭代并強化網(wǎng)絡性能[21]。Liu等人提出一種新型的、基于進化算法的NAS方法,使用最小變異操作作為遺傳機制,并使用多目標優(yōu)化算法進行訓練[22]。Huang等人使用3個模塊來優(yōu)化模型結構,其中一個模塊負責架構搜索,另一個模塊用于權重學習和更新,第3個模塊負責共享參數(shù)[23]。Tan等人利用自動化設計優(yōu)化神經(jīng)網(wǎng)絡、加速模型訓練和推斷,并在圖像分類、對象檢測等方面獲得了較好的結果[24]。
雖然自動機器學習方法在其他領域已經(jīng)取得了顯著進展,但在ECG信號檢測領域尚未被廣泛應用。因此,采用自動機器學習方法設計更具泛化能力的模型,實現(xiàn)更高精度的ECG信號檢測,具有重要的研究意義。本文旨在通過自動機器學習理論,自動設計和調(diào)整模型結構,更高效地提取和分類ECG信號特征。
針對當前ECG檢測技術存在的瓶頸,創(chuàng)新性的將ECG時序信號轉換為圖像數(shù)據(jù),并結合計算機視覺領域成功的神經(jīng)網(wǎng)絡架構搜索算法實現(xiàn)了針對不同類型ECG數(shù)據(jù)的有效分類辨識。算法流程框架如圖1所示。
圖1 算法流程框架圖Fig.1 Algorithm flow framework diagram
針對原始ECG信號,首先將其轉換為3種不同的圖像數(shù)據(jù),分別為格拉姆角場(gramian angular field,GAF)、遞歸圖(recurrence plot,PR)以及馬爾可夫轉移場(Markov transition field,MTF)。
1.1.1 格拉姆角場
格拉姆角場[25]是一種用于處理時間序列數(shù)據(jù)的特征提取方法,基于格拉姆矩陣和極角場的概念,將時間序列轉換為圖像形式,以便利用計算機視覺和圖像處理領域的成熟技術進行分析。
格拉姆角場技術的基本思想是將時間序列分成多個時間段,并使用極坐標系將每個時間段轉換為一個圖像。在極坐標系中,每個時間點被轉換為一個點,該點的半徑由時間序列的幅度確定,角度由時間序列的相位確定。然后,使用格拉姆矩陣將這些圖像轉換為對稱正定矩陣,以便使用特征向量分解等方法進行進一步分析。最后,使用基于格拉姆角場的特征向量進行分類、聚類等任務。
具體而言,給定一個長度為n的ECG時間序列x={x1,x2,…,xn},首先,將其分為k個時間段x(1),x(2),…,x(k)。對于每個時間段,使用以下公式將其轉換為極角場,
(1)
式中:p和q為當前時間段中的時間點;τ為極角場的周期(通常取為N);l為當前子序列序號。然后,使用以下公式計算格拉姆矩陣,
(2)
式中:i和j為不同時間段中對應的時間點。最終,格拉姆矩陣可以看作是一個N×N的對稱正定矩陣,其中,每個元素都是k個時間段中對應位置的極角場之間的相似度。
格拉姆角場的優(yōu)點在于它能夠很好地處理時間序列中的非線性關系,并且可以使用計算機視覺和圖像處理領域的技術對其進行進一步分析。此外,格拉姆角場的計算量較小,適用于大規(guī)模數(shù)據(jù)集。因此,本節(jié)使用格拉姆角場對ECG信號進行特征提取。
1.1.2 遞歸圖
遞歸圖也稱為重現(xiàn)性圖,是一個圖形化的工具,用于分析時間序列中的重復模式[26]。其通過在時間序列上構造一個二維圖像來顯示序列中的周期性或混沌性。遞歸圖現(xiàn)已廣泛應用于各種領域,如物理學、生物學、經(jīng)濟學和氣象學等。
遞歸圖的構造基于嵌入定理(embedding theorem)。該定理指出,可以通過將時間序列轉換為高維空間中的向量來捕捉序列中的結構信息。遞歸圖的構造涉及計算時間序列中任意兩個時間點之間的歐幾里得距離,并將距離值轉換為二進制0或1。這樣,遞歸圖可以視為一個二維矩陣,其中行和列代表時間序列中的時間點,而單元格中的數(shù)字表示相應時間點之間的距離是否小于給定的閾值?;?.1.1節(jié)的ECG信號定義,其遞歸圖可通過下式進行計算,
R=α(λ-‖xp-xq‖)
(3)
式中:λ為閾值;α為重邊函數(shù);p和q為時間點。
遞歸圖的圖形化特征可以用于識別和分類時間序列中的不同模式,例如周期性和混沌性,因此,本節(jié)利用遞歸圖提取ECG信號特征。
1.1.3 馬爾可夫轉移場
馬爾可夫轉移場是一種將時間序列轉換為二維圖像的方法,用于描述時間序列數(shù)據(jù)的時空結構。遵循已有方法[25],將ECG信號轉換為馬爾可夫轉移場。
在馬爾可夫轉移場中,首先,將ECG時間序列x={x1,x2,…,xn}分成k個長度為N的子序列,然后,計算每個子序列i中連續(xù)兩個值j和f之間的轉移概率,這些概率被組合成一個N×N的轉移矩陣。
(4)
式中:P為轉移概率函數(shù);t為當前時間點;l為當前子序列序號;Pl為j和f間轉移概率。然后,使用這個轉移矩陣來生成一個二維圖像,其中,每個像素表示從一個狀態(tài)到另一個狀態(tài)的概率,
ml(j,f)=F(Pl(j,f))
(5)
式中:F是一個將概率值映射到像素值的函數(shù)。將所有時間點的圖像ml拼接起來,即可得到當前時間序列的馬爾可夫轉移場。
1.1.4 ECG信號圖像
將同一段ECG信號的格拉姆角場、遞歸圖以及馬爾可夫轉移場進行合并,得到格式類似于紅綠藍(RGB)圖像的三通道ECG信號圖像。這一圖像將作為神經(jīng)網(wǎng)絡架構搜索算法的輸入,實現(xiàn)對ECG信號的分類辨識。
1.2.1 搜索空間
由于ECG信號圖像其數(shù)據(jù)結構與RGB圖像相似,因此,使用計算機視覺中常用的3×3最大池化,3×3的平均池化,3×3、5×5的可分離卷積,3×3、5×5的擴展卷積,直接連接和無連接作為候選操作,所有卷積核的數(shù)量被設定為16。
1.2.2 模型架構
在將ECG信號圖像輸入模型前,首先,使用3×3卷積組成的根節(jié)點1與根節(jié)點2對ECG信號圖像進行特征提取。根節(jié)點1與根節(jié)點2的輸出構成模型主體的輸入。模型主體由普通模塊和壓縮模塊堆疊而成,二者使用相同的內(nèi)部結構。
在模塊內(nèi)部,設置4個節(jié)點,不包括2個輸入節(jié)點和1個輸出節(jié)點。節(jié)點的概念繼承自PC-DARTS,它本質上代表了對網(wǎng)絡中張量的連接操作,這些張量來自前面位置的節(jié)點或模塊的輸出。節(jié)點這一特殊概念的引入促進了網(wǎng)絡結構的設計和改變。每個節(jié)點可以接收其前進方向上任何2個節(jié)點的輸出,模塊內(nèi)所有節(jié)點的輸出將被串聯(lián)成模塊的輸出。
在模塊的外部,網(wǎng)絡由2個普通模塊與1個壓縮模塊交替構建,壓縮模塊是一個特殊的模塊,引入的目的是減少通過網(wǎng)絡的特征圖的大小,提升模型感受野。為了達到這個目的,與壓縮模塊的輸入節(jié)點相鄰的所有節(jié)點都設置步長為2。每個模塊將前面2個模塊的輸出作為輸入。
在交替堆疊2層普通模塊、1層壓縮模塊和2層普通模塊后,已經(jīng)高度抽象化的特征被輸入平均池化層和全連接層,得到最終的分類便是結果。
1.2.3 算法流程
為了能夠針對ECG信號圖像特征構建針對性的辨識模型,引入基于梯度的神經(jīng)網(wǎng)絡架構搜索算法,在超空間中尋找最優(yōu)的模型架構。PC-DARTS是一種基于梯度下降的架構搜索算法[27],它的基本思想是在超圖空間中搜索最優(yōu)的神經(jīng)網(wǎng)絡結構,超圖由節(jié)點和邊組成。其中,節(jié)點表示神經(jīng)網(wǎng)絡中的隱藏層,邊表示神經(jīng)元之間的連接關系。在PC-DARTS中,每個節(jié)點可以選擇不同的操作,如卷積、池化或空間變換。通過搜索最優(yōu)的節(jié)點操作和連接關系,PC-DARTS可以得到最優(yōu)的神經(jīng)網(wǎng)絡結構。
具體來說,PC-DARTS算法包括2個階段。
第1階段是基于弱監(jiān)督的搜索階段,通過對訓練集進行小批量采樣來更新神經(jīng)網(wǎng)絡結構。在每個小批量中,PC-DARTS使用梯度下降法優(yōu)化超圖中的權重,同時,使用基于Softmax的方法更新節(jié)點的離散操作分布。
o(Si,j·xi)+(1-Si,j)·xi
(6)
為了保證采樣過程中無參數(shù)操作不會占據(jù)主導地位,引入邊緣歸一化來平衡所有候選操作的出現(xiàn)概率,
(7)
式中:βi,j代表了輸入xi的歸一化權重。
第2階段是基于強監(jiān)督的微調(diào)階段。在這個階段,PC-DARTS使用整個訓練集來微調(diào)網(wǎng)絡結構,以得到最終的網(wǎng)絡模型。此時,搜索過程已經(jīng)完成,PC-DARTS將使用之前搜索得到的結構訓練神經(jīng)網(wǎng)絡。在微調(diào)過程中,PC-DARTS使用正常的反向傳播更新權重,使得模型的性能最大化。
PC-DARTS的優(yōu)點在于能夠自動搜索最優(yōu)的神經(jīng)網(wǎng)絡結構,無需人為地指定網(wǎng)絡的結構和超參數(shù),還可以在較短的時間內(nèi)得到最優(yōu)的結果,并且具有良好的可擴展性。使用PC-DARTS對ECG信號圖像進行針對性的模型搭建,對應對不同的ECG分類檢測場景極為有效。
本節(jié)介紹研究所采用的2個ECG數(shù)據(jù)集,分別是PhysioNet MIT-BIH心律失常數(shù)據(jù)集和PTB診斷性ECG數(shù)據(jù)集。這2個數(shù)據(jù)集是常用的ECG信號分類和心肌梗塞檢測任務的基準數(shù)據(jù)集。在實驗中,采用采樣頻率為125 Hz的ECG第二導聯(lián)重采樣數(shù)據(jù)作為輸入,并使用ECG Heartbeat Categorization[28]提供的標準化形式的數(shù)據(jù)集,這些數(shù)據(jù)集已經(jīng)去噪,并且訓練和測試部分以標準ECG心跳的形式提供。在此基礎上,還介紹了本研究的模型訓練與優(yōu)化細節(jié)。
PhysioNet MIT-BIH[29]心律失常數(shù)據(jù)集是一個常用于ECG信號處理研究的數(shù)據(jù)集,該數(shù)據(jù)集包含來自MIT-BIH心律失常數(shù)據(jù)庫的47名被試的ECG記錄,是一組由麻省理工學院研究者在波士頓貝斯以色列醫(yī)療中心的患者身上采集的ECG數(shù)據(jù)。
該數(shù)據(jù)集包含48個半小時的ECG記錄,每個記錄都由專家團隊逐拍注釋。記錄使用雙通道ECG采集設備,采樣率為360 Hz,每個樣本的分辨率為11位。這些記錄來自47名受試者,其中一些人患有心律失常,另一些人則身體健康。共有109 446個心拍被2名專家共同手動注釋,利用這些注釋,按照AAMI EC57標準[30],創(chuàng)建了5個不同的心跳分類,如表1所示。
表1 數(shù)據(jù)集標注與AAMI EC57類別之間映射關系
這個數(shù)據(jù)集已經(jīng)被廣泛應用于心律失常識別、ECG信號分析、分類、噪聲去除等方面的研究。該數(shù)據(jù)集的標準化格式和詳細注釋使得研究人員可以更容易地使用這些數(shù)據(jù)進行研究和比較不同算法的性能。
同時,該數(shù)據(jù)集也帶有一些挑戰(zhàn),比如心律失常的種類和數(shù)量、ECG信號的噪聲和干擾等,使得研究人員需要使用一些高效的算法來處理這些問題。因此,該數(shù)據(jù)集為研究ECG信號處理和心律失常識別提供了重要的基礎和平臺。
由于PhysioNet MIT-BIH數(shù)據(jù)集中不同類別的樣本量嚴重失衡,且部分類別樣本量過少無法支撐深度學習模型完成訓練。因此,使用SMOTE[31]對少數(shù)類別進行上采樣,最終,各個類別的樣本數(shù)如表2所示。
表2 PhysioNet MIT-BIH數(shù)據(jù)集數(shù)據(jù)增強后不同類別樣本量對比
PTB 診斷性ECG數(shù)據(jù)集[32]是一組經(jīng)過標記的ECG數(shù)據(jù),用于心臟疾病的分類和診斷。該數(shù)據(jù)集由德國基爾大學的心臟病學家Heinrich Schiller教授領導的團隊收集和標記,旨在提供一個可靠的數(shù)據(jù)集,用于評估和比較不同的ECG分析算法。該數(shù)據(jù)集包含來自549名患者的549個12導聯(lián)ECG記錄,其中包括正常記錄和各種心臟病例,如心肌缺血、心肌梗死、心肌肥厚和心律失常等。每個記錄都由ECG機器記錄,并由一名經(jīng)驗豐富的ECG技術人員進行了手動標記。標記包括了QRS波群、ST段、T波、P波等波形的位置和形態(tài)。
研究使用的數(shù)據(jù)為其中被診斷為心肌梗死的148名被試的ECG數(shù)據(jù),以及52名健康被試的數(shù)據(jù)。
為了驗證算法的性能, 本研究將2個數(shù)據(jù)集分別進行了劃分, 劃分結果如表3所示。 其中, MIT-BIH數(shù)據(jù)集在數(shù)據(jù)集提供者的劃分方式的基礎上, 使用SMOTE進行數(shù)據(jù)增強, 最終選取152 471個樣本作為訓練集,21 892個樣本作為測試集。在PTB上,隨機選取6 400個樣本作為訓練集,8 152個樣本作為測試集。
表3 訓練集與測試集樣本劃分Tab.3 The samples split of the train and test set
在模型架構搜索階段,即神經(jīng)網(wǎng)絡架構搜索算法的第1階段,使用訓練集中70%的數(shù)據(jù)進行模型架構迭代,剩余的30%用于模型權重訓練。在再訓練階段,即神經(jīng)網(wǎng)絡架構搜索算法的第2階段,使用訓練集中的全部數(shù)據(jù)對架構固定的模型進行權重再訓練。
在將數(shù)據(jù)送入神經(jīng)架構搜索算法前,首先,將ECG圖像大小調(diào)整為227×227。對2個不同的數(shù)據(jù)集分別選取不同的超參數(shù),以保證模型具有較高的辨識分類精度,如表4所示。
表4 模型超參數(shù)設定Tab.4 The hyperparameter setting of the model
對于PhysioNet MIT-BIH心律失常數(shù)據(jù)集,在模型架構搜索階段設定批次大小為16,drop概率為0.35,初始通道數(shù)為8,模塊堆疊數(shù)為5,學習率為0.001,權重衰減為0.001,訓練epoch數(shù)為50。在再訓練階段,將批次大小設定為64,drop概率改為0.25,其余超參數(shù)保持不變。
對于PTB數(shù)據(jù)集,在模型架構搜索階段設定批次大小為16,drop概率為0.35,初始通道數(shù)為8,模塊堆疊數(shù)為5,學習率為0.001,權重衰減為0.001,訓練epoch數(shù)為50。在再訓練階段,將批次大小設定為32,drop概率改為0.25,其余超參數(shù)保持不變。對于2個數(shù)據(jù)集,均采用動量為0.99的Adam優(yōu)化器進行優(yōu)化。
本研究所提出的方法在PyTorch中實現(xiàn),基于AMD CPU(R9-3950X,3.5 GHz)和NVIDIA GPU(RTX 3090)。
本節(jié)將展示在PhysioNet MIT-BIH和PTB數(shù)據(jù)集上的神經(jīng)架構搜索結果,并將分類辨識精度與其他先進算法進行對比,以證明本研究算法的泛化性與魯棒性。
網(wǎng)絡架構搜索算法在PhysioNet MIT-BIH數(shù)據(jù)集上搜索得到的模型最終架構如圖2所示,其中,內(nèi)部連接結構和候選操作選擇在表5中展示。在圖2中,壓縮模塊從模塊k和k-1引出的連線表示步長為2的操作,這些操作進一步壓縮了特征圖大小,提高了模型的感受野。從搜索結果中可以看出,在普通模塊中,模型傾向于選擇擴張卷積和壓縮卷積來提取輸入的局部特征。而在壓縮模塊中,模型更傾向于選擇平均池化和最大池化來獲取輸入的全局特征,這一現(xiàn)象也符合模型最初的設計理念。
表5 在PhysioNet MIT-BIH數(shù)據(jù)集上搜索得到的網(wǎng)絡架構參數(shù)Tab.5 The network architecture parameters obtained through searching on the PhysioNet MIT-BIH dataset
圖2 網(wǎng)絡架構搜索在PhysioNet MIT-BIH數(shù)據(jù)集上的結果Fig.2 Result of the neural architecture search on the PhysioNet MIT-BIH dataset
表6展示了本研究所提出的模型和其他先進模型的分類識別效果??梢钥闯?本研究的模型以98.7%的平均分類準確率明顯優(yōu)于絕大多數(shù)的對比算法。
表6 在PhysioNet MIT-BIH數(shù)據(jù)集上的分類辨識結果
此外,本研究利用網(wǎng)絡架構搜索技術,避免了模型架構設計的過程,大幅縮短了模型的部署時間,能夠有效應對更多的應用場景,并且具有更高的分類識別精度。因此,在與Pham等人模型[38]進行比較時,本研究具有一定的優(yōu)勢。
圖3展示了在PTB數(shù)據(jù)集上進行的架構搜索結果,其中,內(nèi)部連接結構和候選操作選擇在表7中展示。與PhysioNet MIT-BIH數(shù)據(jù)集不同,PTB數(shù)據(jù)集上的普通模塊和壓縮模塊都包含了大量的卷積操作,而壓縮模塊中池化操作的使用頻率明顯降低。這可能是由于PTB數(shù)據(jù)集中樣本數(shù)量和樣本類別相對較少,模型只需提取局部特征就可以獲得足夠的分類準確度。
表7 在PTB數(shù)據(jù)集上搜索得到的網(wǎng)絡架構參數(shù)Tab.7 The network architecture parameters obtained through searching on the PTB dataset
圖3 網(wǎng)絡架構搜索在PTB數(shù)據(jù)集上的結果Fig.3 Result of the neural architecture search on the PTB dataset
在表8中與其他先進算法進行比較,本研究的模型在PTB數(shù)據(jù)集上具有最優(yōu)秀的分類準確度。此外,本研究的模型具有無需手動調(diào)整架構的優(yōu)點。綜上所述,本研究所設計的算法具有足夠的泛化能力,可以應對不同的ECG識別場景,并具有廣泛的應用前景。
表8 在PTB數(shù)據(jù)集上的分類辨識結果Tab.8 Discrimination results on the PTB dataset
本研究設計基于自動機器學習的心電檢測算法,有效降低了在不同應用場景下網(wǎng)絡結構設計所需要的人工時間與成本,提升了網(wǎng)絡架構的可解釋性,為心電信號分類任務提供可靠的數(shù)據(jù)支撐和新的技術途徑。將心電時序信號轉換為圖像的操作進一步提取了心電信號的抽象特征,提升了心電辨識準確性。所設計的模型在PhysioNet MIT-BIH心律失常數(shù)據(jù)集和PTB診斷性ECG數(shù)據(jù)集上,分別取得了98.7%和99.0%的分類辨識精度,其性能優(yōu)于以往的最優(yōu)算法,且在實際應用場景中具備更強的自適應能力,未來將進一步在運動健康領域開展落地應用。