曹小鳳 謝紅薇 安建成 郝曉燕 曹 杰
(太原理工大學計算機科學與技術(shù)學院 山西 太原 030024)
?
基于模糊理論的高血壓藥物療效預(yù)測模型研究
曹小鳳謝紅薇*安建成郝曉燕曹杰
(太原理工大學計算機科學與技術(shù)學院山西 太原 030024)
摘要針對評估期內(nèi)藥物占有率MPR(Medication Possession Ratio)和血壓進行分析研究,建立用于發(fā)現(xiàn)二者關(guān)系的貝塔分布模型。利用模糊理論和遺傳算法通過交叉驗證對模型進行優(yōu)化并與線性分布模型進行對比。實驗結(jié)果表明,利用貝塔分布模型確定的MPR與血壓值的關(guān)系能很好地對患者的用藥療效進行預(yù)測。對于大多數(shù)高血壓患者,只有接受長期的藥物治療,才能使血壓得到有效控制。
關(guān)鍵詞高血壓貝塔分布模型遺傳算法交叉驗證模糊理論
ON PREDICTION MODEL OF HYPERTENSION DRUGS EFFICACY BASED ON FUZZY THEORY
Cao XiaofengXie Hongwei*An JianchengHao XiaoyanCao Jie
(School of Computer College of Science and Technology,Taiyuan University of Technology,Taiyuan 030024,Shanxi,China)
AbstractAiming at the medication possession ratio (MPR) and blood pressure within evaluation period we carried out analysis and study, and built a beta distribution model for finding the relationship between them. Then we employed fuzzy theory, genetic algorithms (GA) and cross validation to optimise the model, and compared it with linear distribution model. Experimental results showed that the MPR and blood pressure value determined by using the beta distribution model can well forecast the meditation efficacy on patients. For most hypertensives, only by long-term treatment with medicine can the blood pressure be effectively controlled.
KeywordsHypertensionBeta distribution modelGenetic algorithmCross-validationFuzzy theory
0引言
2013年世界衛(wèi)生日主題“控制你的血壓,減少心臟病突發(fā)和卒中風險”,可見高血壓已成為全球矚目的公共健康問題。高血壓是一種常見的威脅人類健康的慢性疾病,位居引起死亡的十大危險因素之首。因此,有效控制血壓對于提高人類的健康水平有重大現(xiàn)實意義。
《中國高血壓防治指南》[1]指出,高血壓是可以控制的疾病,有效地控制血壓可以減少患者心腦血管及其他并發(fā)癥的發(fā)生,進而提高患者的生存質(zhì)量。Laura等人[2]通過研究發(fā)現(xiàn),在老年人中使用阿替洛爾這類降壓藥會增加中風的風險;趙艷平[3]通過對治療原發(fā)性高血壓的不同藥物療效進行分析,發(fā)現(xiàn)洛沙坦和非洛地平的聯(lián)合用藥降低血壓變異性更為明顯,患者預(yù)后更佳;林彩美[4]利用統(tǒng)計分析的方法,研究抗高血壓藥物對治療老年人高血壓的效果,實驗結(jié)果表明,卡托普利聯(lián)合硝苯地平藥物治療高血壓效果顯著、不良反應(yīng)少、易耐受, 是治療老年人高血壓的安全有效用藥方法。進行藥物治療是控制高血壓的有效方式,通過對患者堅持服藥程度和血壓值進行分析。根據(jù)Thusitha等人提出的計算框架[5]從電子處方中計算出患者的MPR,進而建立二者之間的關(guān)系,利用遺傳算法對所建立的模型進行評估優(yōu)化,最終得出患者服藥時間與血壓的模型圖。此模型的建立,不僅可以通過患者堅持服藥程度對其血壓趨勢進行預(yù)測,還可以給患者提供堅持用藥建議,對于高血壓慢性病的控制與治療有一定的指導意義。
1高血壓定義和狀態(tài)分類
在沒有使用降壓藥物的情況下,非同日測量3次血壓,收縮壓≥140 mmHg和(或)舒張壓≥90 mmHg,被診斷為高血壓;患者有既往高血壓史,且目前正在服用降壓藥物,雖然血壓低于140/90 mmHg,也被診斷為高血壓[1]。通過對文獻[6]進行研究與總結(jié),現(xiàn)將使用的收縮壓SBP(Systolic Blood Pressure)及其狀態(tài)定義如表1所示。
表1 收縮壓值與狀態(tài)對應(yīng)關(guān)系 單位:mm Hg
2模型選擇
根據(jù)山西省某醫(yī)院提供的高血壓數(shù)據(jù),通過研究發(fā)現(xiàn),患者的收縮壓值和持續(xù)吃藥時間近似符合貝塔分布曲線。由于正態(tài)分布的曲線分布特點是以均數(shù)為中心,左右兩邊呈現(xiàn)對稱性并由均數(shù)處開始,分別向左右兩側(cè)呈逐漸均勻下降趨勢。而相比于正態(tài)分布,貝塔分布具有多種不同的分布形狀,其中包括對稱的和非對稱的分布,根據(jù)參數(shù)的不同呈現(xiàn)出完全不同的形狀,體現(xiàn)出良好的適應(yīng)性和普適性。在此,選擇貝塔分布對數(shù)據(jù)進行研究分析。
2.1貝塔分布特點
貝塔分布的密度函數(shù)定義如下:
f(x;a,b)=xa-1(1-x)b-1/B(a,b)
(1)
2.2MPR值的計算
此處所研究的是患者持續(xù)吃藥時間與收縮壓的關(guān)系,由式(1)可知,該分布函數(shù)的自變量范圍為(0,1),因此,文中將持續(xù)吃藥時間轉(zhuǎn)換為MPR進行研究。MPR是計算有效藥物供給時間在一個評估期[5]EP內(nèi)占有的比例。EP指從病人的電子處方記錄中選取感興趣的一段時期(此處選擇的是一年),根據(jù)Thusitha等人在文獻[5]中提出的一種方法[4]來計算藥物占有率,其計算如下:
(2)
3基于模糊規(guī)則的模型
Takagi 與 Sugeno(1985)和 Sugeno 與 Kang(1988)[7]給出了一個產(chǎn)生式規(guī)則系統(tǒng)的模糊推理工具。他們提出了一個多維模糊推理,該模糊模型是基于規(guī)則的[8,9],其輸出不是一個語言變量,而是輸入變量的函數(shù)。 規(guī)則庫由n條規(guī)則組成,規(guī)則的形式如下:
(3)
(4)
(5)
這里使用的“and”是在模糊系統(tǒng)中經(jīng)常使用的運算。通常使用由Sugeno提供的模糊規(guī)則[10]得到復(fù)雜過程的輸出,其形式描述如下:
(6)
這樣,最終的輸出y可以按下式計算:
(7)
根據(jù)式(7),最終的輸出是由參數(shù)決定的復(fù)雜的非線性函數(shù),參數(shù)的確定不能由傳統(tǒng)的方法得到。為了使用遺傳算法[11]確定式(7)的最優(yōu)參數(shù),必須建立適應(yīng)度函數(shù),表示如下:
(8)
4實驗過程及運行結(jié)果
4.1實驗過程
由于研究的是SBP與MPR之間的關(guān)系,根據(jù)前面的模型得出的數(shù)據(jù)值應(yīng)該符合SBP的取值范圍。因此,需要對數(shù)據(jù)進行尺度變換,將模型得出的數(shù)據(jù)值模糊化為SBP值所符合的范圍,即是轉(zhuǎn)換為第一部分所列出的范圍。數(shù)據(jù)模糊化過程中用到的三個式子如下:
bph=u1/Maxu1×70+160
(9)
bpm=u2/Maxu2×30+130
(10)
bpa=u3/Maxu3×40+90
(11)
其中,ui是n維向量,其值是由式(2)計算出的MPR值根據(jù)初始的貝塔分布函數(shù)所確定的(初始貝塔分布的參數(shù)值說明如表2所示),Maxui是ui中的最大值,ui/Maxui表示相應(yīng)規(guī)則(此處的規(guī)則是表1中所描述的3條規(guī)則)的隸屬度。通過式(10)-式(12)將相應(yīng)的精確值分別模糊化為對應(yīng)的規(guī)則區(qū)間。
根據(jù)山西某醫(yī)院提供的30 461條患者高血壓數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗得到本實驗所使用的200條相關(guān)數(shù)據(jù),將數(shù)據(jù)分成10組,每組20條數(shù)據(jù),選取其中的8組作為訓練集,另外2組作為測試集。根據(jù)訓練集180條數(shù)據(jù)得到參數(shù)初值如表2所示。
表2 參數(shù)初值及種群初始范圍
實驗在MATLAB 7.0平臺下進行,根據(jù)表2的初值、范圍和適應(yīng)度函數(shù)式(8),交叉概率Pc=0.8,變異概率Pm=0.05,利用遺傳算法對訓練集進行多次訓練得到參數(shù)的優(yōu)化結(jié)果。表3給出了不同的訓練集得到的優(yōu)化參數(shù)結(jié)果(由于篇幅有限,只列舉部分數(shù)據(jù)進行說明)。
表3 仿真算法得到的優(yōu)化參數(shù)值
4.2參數(shù)對比
研究的最終目的是確定SBP與MPR的關(guān)系,每一個MPR值對應(yīng)于三個屬于不同范圍的SBP值,也就是有三條不同的曲線。因此需要根據(jù)不同范圍的SBP值所對應(yīng)的隸屬度對數(shù)據(jù)進行去模糊化處理,得到最終的輸出結(jié)果。對最終結(jié)果好壞的評價,通常用平均誤差來衡量,計算如下所示:
(12)
在對大量數(shù)據(jù)進行研究和實驗的基礎(chǔ)上,根據(jù)式(12)分別計算不同組的平均誤差如表4所示。
表4 4組模型對應(yīng)的平均誤差
通過比較發(fā)現(xiàn)第4組所確定的模型所得到的平均誤差值最小,準確度最高;進行模糊化分段線性分布計算得到最終的RMSE為5.74473,相應(yīng)的參數(shù)a4、b4、a5、b5、a6、b6值如表5所示。因此將第4組對應(yīng)的模型作為我們的最佳預(yù)測模型,用于對持續(xù)吃藥時間和血壓值的預(yù)測。
表5 分段線性擬合的參數(shù)值
通過大量實驗得到表3-表5中的參數(shù)值,圖1-圖3分別是對得到的貝塔分布函數(shù),分段線性分布函數(shù)及貝塔分布函數(shù)和分段線性分布函數(shù)的對比進行描述。
圖1 貝塔分布函數(shù)結(jié)果
圖2 分段線性分布函數(shù)結(jié)果
圖3 分段線性分布函數(shù)和貝塔分布函數(shù)比較結(jié)果
經(jīng)過實驗對比,確定圖1為最終的持續(xù)吃藥時間與血壓關(guān)系模型圖。由圖1的描述可以得到:當患者血壓水平處于90~130 mmHg時,患者持續(xù)服藥8個月,可以使血壓基本維持在較低水平;當患者血壓水平處于130~160 mmHg時,由于患者體質(zhì)不同,服用的降壓藥的差別可能在短期內(nèi)會使患者血壓有所上升,但服用半年后,這部分高血壓患者的血壓也可以維持在相對較低的水平;對于血壓水平處于160~230 mmHg的高血壓患者,在初期服用降壓藥的效果比較明顯,但是需要進行長期的藥物治療,才能使血壓維持在較低的水平。
5結(jié)語
通過對持續(xù)吃藥時間和血壓值的分析,建立用于預(yù)測二者關(guān)系的貝塔分布模型。與線性分布模型相比,該模型能夠很好地進行血壓趨勢分析,增強患者可持續(xù)服藥程度,更好地對血壓進行控制。在此研究的基礎(chǔ)上建立藥物、時間與血壓的模型,進而發(fā)現(xiàn)三者之間的關(guān)系對于指導患者用藥,對于提高患者生存質(zhì)量有重大現(xiàn)實意義,建立相關(guān)的模型是下一步所要進行的工作。
參考文獻
[1] 劉力生,王文,姚崇華.中國高血壓防治指南(2010年基層版)[J].中華高血壓雜志,2011,18(1):11-18.
[2] Laura M Kuyper,MD Nadia A Khan,MD MSc.Atenolol vs Nonatenolol β-Blockers for the Treatment of Hypertension:A Meta-analysis[J].Canadian Journal of Cardiology,2014,30(5):S47-S53.
[3] 趙艷平.不同藥物治療原發(fā)性高血壓的療效分析與預(yù)后評價[J].醫(yī)藥論壇雜志,2012,33(7):96-97.
[4] 林彩美.卡托普利聯(lián)合硝苯地平藥物治療高血壓的臨床療效分析[J].中外醫(yī)療,2009,28(8):71.
[5] Thusitha Mabotuwana,Jim Warren,John Kennelly.A computational framework to identify patients with poor adherence to blood pressure lowering medication[J].International Journal of Medical Informatics,2009,78(11):745-756.
[6] 陳建華.國內(nèi)外的高血壓診斷標準[J].中華實用中西醫(yī)雜志,2010,23(4):33-34.
[7] Jose Luis Aznarte,Jesus Alcala-Fdez,Antonio Arauzo-Azofra,et al.Financial time series forecasting with a bio-inspired fuzzy model[J].Expert Systems with Applications,2012,39(16):12302-12309.
[8] 張德豐.MATLAB模糊系統(tǒng)設(shè)計[M].北京:國防工業(yè)出版社,2009.
[9] Chen Chunhao,Hong Tzungpei,Tseng Vincent S.Fuzzy data mining for time-series data[J].Applied Soft Computing,2012,12(1):536-542.
[10] Chamani M R,Pourshahabi S,Sheikholeslam F.Fuzzy genetic algorithm approach for optimization of surge tanks[J].Scientis Iranica A,2013,20(2):278-285.
[11] 雷英杰.MATLAB遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學出版社,2005.
中圖分類號TP18
文獻標識碼A
DOI:10.3969/j.issn.1000-386x.2016.02.013
收稿日期:2014-08-25。山西省國際合作計劃項目(2014081018-2);山西省科技基礎(chǔ)條件平臺建設(shè)基金項目(2013091003-0103);山西省基礎(chǔ)研究基金項目(2012011011-2)。曹小鳳,碩士生,主研領(lǐng)域:人工智能,醫(yī)學信息學。謝紅薇,教授。安建成,副教授。郝曉燕,副教授。曹杰,碩士生。