□ 陳蒙蒙 CHEN Meng-meng 方振紅 FANG Zhen-hong 涂文怡 TU Wen-yi 溫偉偉 WEN Wei-wei
心力衰竭是心臟病發(fā)展至嚴重階段的綜合征,死亡率較高[1],在得到有效治療之前心力衰竭患者的死亡率和惡性腫瘤患者死亡率相似[2-4]。病情較重的心力衰竭患者,其1年的存活率只有50%,而病情較輕的,其4~5年的存活率,大約為50%。關于心衰患者死亡率相關因素的研究,已經(jīng)有很多研究成果[5-6]。一項來自加州大學洛杉磯分校的研究表明,神經(jīng)肽Y水平較高的患者在1~3年內死亡的可能性是神經(jīng)肽Y水平較低患者的10倍[7]。同型半胱氨酸可影響冠心病合并心衰患者PCI術后死亡[8]。抑郁癥能夠增加心衰患者的死亡率[9]。
現(xiàn)有的心力衰竭患者死亡率預測模型,基本都沒有綜合考慮多種影響心力衰竭患者死亡率的因素,因此綜合考慮多種因素來預測心力衰竭患者的死亡率是本文要解決的問題。布谷鳥算法是一種新興的啟發(fā)式算法,它由劍橋大學博士楊新社于2009年提出[10]。布谷鳥算法以其高效的尋優(yōu)能力,一經(jīng)提出就獲得了廣泛關注。本文提出的心力衰竭患者死亡率預測模型,是基于多因素布谷鳥算法的一種新型心力衰竭患者的死亡率預測模型。本研究旨在提出基于多因素布谷鳥算法的心力衰竭患者死亡率預測模型并探討其在預測心力衰竭患者死亡率問題中的應用效果。
1.多因素原則。假設影響心力衰竭患者死亡的n個因素,記為X=[x1,...,xn]。給出本文模型的多因素測試函數(shù)如下:
2.基于多因素布谷鳥算法的心力衰竭患者死亡率預測模型。基于多因素布谷鳥算法的心力衰竭患者死亡率預測模型步驟如下:
(1)根據(jù)數(shù)據(jù)集的樣本設置好所有的參數(shù)與測試函數(shù)⑴;
(2)隨機生成可行解的集合,規(guī)模為n,記錄其中最優(yōu)解;
(5)若不滿足算法終止條件,執(zhí)行步驟2;否則輸出式(1)中的權重wi和閾值Ψ。
(6)根據(jù)權重wi和閾值Ψ,度量數(shù)據(jù)集中患者的死亡率。
3.基于多因素布谷鳥算法的心力衰竭患者死亡率預測模型流程圖,見圖1。
圖1 基于多因素布谷鳥算法的心力衰竭患者死亡率預測模型流程圖
1.一般資料。使用加州大學歐文機器學習庫的心力衰竭臨床記錄數(shù)據(jù)集[11]驗證被提出的模型在預測心力衰竭患者死亡時的有效性。該數(shù)據(jù)集的299個心力衰竭患者分為訓練集(n=203)和測試集(n=96)。該數(shù)據(jù)集有13個特征,這些特征的信息如表1所示。
表1 數(shù)據(jù)集特征的含義、度量單位和區(qū)間
該數(shù)據(jù)集的13個特征之間的相關性度量如表2所示。
從表2中我們看出,該數(shù)據(jù)集的13個特征之間的相關度不高,一個特征不能很好地被另一個或者另幾個特征所表示,所以在計算心力衰竭患者死亡情況時,需要把所有的特征都考慮進去才更科學合理。
表2 數(shù)據(jù)集的特征之間的相關度
2.方法。使用多因素模型預測心力衰竭患者的死亡率,采用Matlab R2019a軟件進行數(shù)據(jù)分析。
3.結果。表3是多因素模型預測心力衰竭患者的死亡率準確率情況。
表3 本文數(shù)據(jù)集(n=299)的實際死亡率和預測死亡率
表3表明多因素模型能夠準確地預測出心力衰竭患者的死亡率,因為多因素模型充分考慮了心力衰竭臨床患者的多種因素,比如是否貧血、是否患有高血壓、血液中CPK酶的水平、是否患有糖尿病、心臟每次收縮時的血流百分比、血液中的血小板濃度、性別、血液中肌酸的水平、血液中鈉的含量、是否吸煙等因素,多因素模型是一種非常合理和人性化的死亡率預測模型。多因素模型基于布谷鳥算法充分考慮了多種影響心力衰竭患者死亡率的因素。布谷鳥算法基于Levy飛行,能夠在給定空間中高效地進行尋優(yōu)。布谷鳥算法被證明在很多方面都比傳統(tǒng)的啟發(fā)式算法具有更好的信息搜索能力。本文測試函數(shù)中的權重和閾值都是通過布谷鳥算法計算得出的,因此非??茖W有效。
針對傳統(tǒng)的心力衰竭患者死亡率預測模型不能充分考慮多因素的問題,因此提出基于多因素布谷鳥算法的心力衰竭患者死亡率預測模型。使用加州大學歐文機器學習庫的心力衰竭臨床記錄數(shù)據(jù)集來測試多因素模型在預測心力衰竭患者死亡率問題上的準確率,實驗結果顯示,多因素模型能夠高效地預測心力衰竭患者死亡率。