李曉平,張亞同
(1.廣西中醫(yī)藥大學(xué)附屬瑞康醫(yī)院藥學(xué)部,廣西 南寧 530011; 2.北京醫(yī)院藥學(xué)部,北京 100730)
華法林是目前臨床常用的口服抗凝藥,臨床多根據(jù)凝血酶原時間和國際標(biāo)準(zhǔn)化比值(INR)來調(diào)整用量。構(gòu)建華法林劑量預(yù)測模型被公認(rèn)為是實現(xiàn)華法林個體化用藥、降低其不良反應(yīng)發(fā)生風(fēng)險的可行方法,主要方法有多元線性回歸方程和機(jī)器學(xué)習(xí)算法兩大類,后者中的人工神經(jīng)網(wǎng)絡(luò)(ANN)是近年來的研究熱點(diǎn)。本研究中對應(yīng)用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建華法林劑量模型的研究進(jìn)行歸納總結(jié),為華法林的臨床研究提供參考。
影響華法林抗凝血作用的因素包括非遺傳因素和遺傳因素,非遺傳因素主要有種族、年齡、性別、身高、體質(zhì)量、體表面積、吸煙史、飲食習(xí)慣、疾病狀態(tài)、環(huán)境、藥物的相互作用等。遺傳因素包括細(xì)胞色素P4502C9(CYP2C9)、維生素 K環(huán)氧化物還原酶復(fù)合體 1(VKORC1)、CYP4F2、γ 谷氨酰羧化酶(GGCX)、微粒體環(huán) 氧 化 物 水 解 酶 (EPHX1)、載 脂 蛋 白 E(ApoE)、CYP2A6、CYP2C18、葉酸聚谷氨酸合酶(FPGS)、STX4 基因、多藥耐藥基因(MRDl)、凝血因子Ⅱ基因(F2)、凝血因子Ⅶ基因(F7)等[1]。CYP2C9 基因多態(tài)性僅占華法林劑量變異的12%(4% ~20%);VKORC1的貢獻(xiàn)比例為27%(6% ~25%),高于 CYP2C9;CYP4F2僅可解釋約2%,GGCX也僅可解釋約2.3%華法林個體劑量差異[2];其他基因?qū)θA法林劑量雖有影響,但貢獻(xiàn)不大,還有待進(jìn)一步研究。
1998年,OATES等[3]就患者的臨床因素與華法林劑量需求之間的關(guān)系開始研究并構(gòu)建了給藥模型。遺傳因素隨著藥物基因組學(xué)研究的深入被作為重要的變量加入之后的研究模型中。2005年,SCONCE等[4]率先在華法林穩(wěn)定劑量預(yù)測模型中納入了遺傳因素。迄今已發(fā)表的華法林劑量預(yù)測公式達(dá)10余個[5-14]。目前,最常用的是國際華法林藥物基因組學(xué)協(xié)會于2009年發(fā)表在《新英格蘭醫(yī)學(xué)雜志》上的預(yù)測模型。
以上模型大多數(shù)都納入了基因多態(tài)性參數(shù)。盡管對于華法林基因?qū)虻娜A法林個體化用藥預(yù)測模型與臨床常規(guī)給藥比較,尚有爭議,但國內(nèi)外多項研究表明,基于基因因素創(chuàng)建的華法林劑量預(yù)測模型更有助于劑量調(diào)整,并降低不良反應(yīng)發(fā)生率[15-16]。
目前,建立華法林個體化用藥預(yù)測模型的方法大體可分為多元線性回歸和機(jī)器學(xué)習(xí)算法兩類。因臨床因素以數(shù)值變量為主,數(shù)據(jù)處理起來更簡單方便,大多數(shù)研究選擇了多元線性回歸進(jìn)行建模,但很難模擬藥物在人體內(nèi)的真實代謝過程。因此,機(jī)器學(xué)習(xí)算法因此應(yīng)運(yùn)而生,ANN則是其中常用的算法。
ANN是一種由大量的節(jié)點(diǎn)(或稱神經(jīng)元)和節(jié)點(diǎn)間相互聯(lián)接構(gòu)成的信息處理系統(tǒng),能模擬大腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能。通過分析輸入和輸出數(shù)據(jù)之間的關(guān)系和規(guī)律,形成一個復(fù)雜的非線性系統(tǒng)函數(shù),其過程類似于“訓(xùn)練”。目前,各領(lǐng)域應(yīng)用廣泛的是反向傳播(BP)神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)神經(jīng)元的每一個輸入連接強(qiáng)度一般以權(quán)重來表示,輸出量一般是權(quán)重和的函數(shù)。實質(zhì)上,ANN是一種把輸入轉(zhuǎn)化為輸出的數(shù)學(xué)表達(dá)式,通過強(qiáng)大的網(wǎng)絡(luò)學(xué)習(xí)、記憶和聯(lián)想功能分析和預(yù)測大數(shù)據(jù)信息,特別適合智能化地處理非線性問題,近年來在信息處理、醫(yī)學(xué)、工程學(xué)、經(jīng)濟(jì)學(xué)等多個領(lǐng)域的應(yīng)用日益增多,且效果較好[17]。
最早報道的神經(jīng)網(wǎng)絡(luò)應(yīng)用于華法林劑量模型見于1993年 NARAYANAN 等[18]的研究。研究顯示,利用華法林基因數(shù)據(jù)來遴選神經(jīng)網(wǎng)絡(luò)的預(yù)測變量子集,通過識別出重要的預(yù)測參數(shù)來減小神經(jīng)網(wǎng)絡(luò)的規(guī)模,從而加快其訓(xùn)練速度和對過度訓(xùn)練的敏感性,能顯著增強(qiáng)神經(jīng)網(wǎng)絡(luò)的預(yù)測能力。但僅基于對3個患者的分析描述,未提及華法林劑量模型的具體情況。
2004年,SOLOMON等[19]報道了以色列一項應(yīng)用ANN構(gòu)建華法林劑量模型的研究,研究組根據(jù)148份1996年至1997年參與抗凝治療研究的病歷資料構(gòu)建了一個華法林維持劑量的BP人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型。該模型利用其中2/3的樣本作為分析訓(xùn)練資料,剩下的1/3樣本則用作測試,最終篩選出7個輸入變量,然后以華法林的維持劑量作為輸出變量。結(jié)果顯示,該模型預(yù)測結(jié)果與實際維持劑量相近,可認(rèn)為該人工神經(jīng)網(wǎng)絡(luò)模型能對個體化的維持劑量給出合理的預(yù)測值。但該模型只納入了人口統(tǒng)計學(xué)和臨床影響因素作為輸入變量,基因變量被排除在外。
ZHOU等[20]收集了中國心臟瓣膜置換術(shù)后低強(qiáng)度抗凝治療多中心臨床研究數(shù)據(jù)庫中2011年1月至2012年9月的1093例合適患者的臨床數(shù)據(jù),按3∶1比例分為訓(xùn)練集和驗證集構(gòu)建ANN模型。這些患者的目標(biāo)INR都是1.5~2.5。結(jié)果對華法林維持劑量的平均預(yù)測準(zhǔn)確率為65.93% ~68.50%(中等劑量組的預(yù)測準(zhǔn)確率為 77.68% ~83.48% ),而用多元線性回歸(MLR)建立的模型預(yù)測準(zhǔn)確率為 45.42% ~66.30%,故認(rèn)為ANN模型能為接受低強(qiáng)度抗凝治療的中國心臟瓣膜疾病患者提供理想和穩(wěn)定的華法林維持劑量預(yù)測,其預(yù)測準(zhǔn)確率比 MLR 高,且對中等劑量(1.875~3.125 mg/d)患者的預(yù)測準(zhǔn)確率要高于低劑量(1.875 mg/d)和高劑量(>3.125 mg/d)患者。同樣,該項研究也只納入了人口統(tǒng)計學(xué)和臨床影響因素,基因因素也被排除在外。
SALEH等[21]針對阿拉伯裔人群的研究收集了3415例INR 2~3范圍患者的臨床數(shù)據(jù)作為訓(xùn)練集,另外收集856例患者的數(shù)據(jù)作為測試集,通過ANN算法識別出年齡、身高、體質(zhì)量、CYP2C9基因型、VKORC1基因型、合并使用的多種藥物為最佳參數(shù)構(gòu)建華法林劑量模型,結(jié)果對訓(xùn)練集和測試集患者的預(yù)測準(zhǔn)確率分別為48%和43%,認(rèn)為ANN算法能預(yù)測合適的華法林劑量。
在一項針對高加索人群的研究中,GROSSI等[22]收集了377例2008年12月至2009年2月接受華法林治療患者的數(shù)據(jù),通過TWIST?系統(tǒng)最終篩選出23個人口統(tǒng)計學(xué)、臨床和基因數(shù)據(jù)(CYP2C9和VKORC1基因多態(tài)性)作為輸入量構(gòu)建ANN模型。該模型對華法林劑量預(yù)測的準(zhǔn)確率平均達(dá)48%,尤其是每周劑量≤21 mg和21~49 mg患者組中分別高達(dá)72%和74%,故認(rèn)為ANN模型是準(zhǔn)確預(yù)測華法林維持劑量的有效工具。
ISMA′EEL 等[23]報道了黎巴嫩的一項研究,通過收集174例患者的臨床數(shù)據(jù)和基因數(shù)據(jù)建立的ANN華法林劑量模型能比線性模型減少到達(dá)目標(biāo)INR的劑量錯誤,故認(rèn)為基于藥物基因組學(xué)的ANN華法林劑量模型在預(yù)測華法林劑量、減少不良反應(yīng)方面具有較好前景。
PAVANI等[24]針對印度人群以240例患者的年齡、性別、體質(zhì)量指數(shù)、維生素K血漿濃度、甲狀腺功能狀態(tài)和 CYP2C9*2,CYP2C9*3,CYP2C9*8,CYP2C9*13,VKORC1*3,VKORC1*4,VKORC1 D36Y,VKORC1-1639 G>A,CYP4F2 V433M,GGCX 10個基因變量作為輸入量,華法林治療劑量為輸出量,采用雙曲正切函數(shù)構(gòu)建ANN結(jié)構(gòu),可解釋華法林劑量差異達(dá)93.5%??蓽?zhǔn)確預(yù)測INR 2.0以下的74.5%患者和INR 3.5以上的83.3%患者,且能減少超范圍INR值、不良反應(yīng)發(fā)生率和縮短到達(dá)目標(biāo)INR值的時間,甲狀腺功能正常和減退患者均可使用該模型。因此認(rèn)為,ANN算法可有效提高華法林劑量預(yù)測準(zhǔn)確度,并提供安全有效的劑量。
ALZUBIEDI等[25]以163例非洲裔美國人的年齡、體 質(zhì) 量 、CYP2C9*1/*1、VKORC1、rs12777823、rs2108622、充血性心力衰竭和胺碘酮使用作為參數(shù),研究對比了線性回歸與ANN 2種劑量模型,二者可解釋的劑量差異分別為48%和52%,即除了每周劑量不低于49 mg的患者組,ANN并不能比線性回歸模型更好地預(yù)測劑量。
已報道的ANN華法林劑量模型中,初期的模型主要以人口統(tǒng)計學(xué)和臨床影響因素為參數(shù),后面則有越來越多的研究納入了基因參數(shù)。關(guān)于基因參數(shù)是否有利于構(gòu)建ANN模型存在一定爭議。部分研究者認(rèn)為,基因參數(shù)對ANN建模貢獻(xiàn)不大,但遺傳因素對華法林劑量的影響共識已越來越多。更多學(xué)者對于華法林藥物基因?qū)W研究的臨床價值持樂觀態(tài)度,才有更多研究把基因參數(shù)納入ANN華法林劑量模型中,并在一定程度上得到了驗證。初期的研究模型未納入基因參數(shù),也可能與收集到的數(shù)據(jù)類型有關(guān),研究均為回顧性分析研究,在基因檢測并沒有那么普遍的情況下,想要收集過去病例的基因數(shù)據(jù)極其困難,故只能采用能收集到的人口統(tǒng)計學(xué)和臨床數(shù)據(jù)進(jìn)行研究。隨著基因檢測技術(shù)在臨床的深入推廣,未來開展更多納入基因參數(shù)的前瞻性研究將成為可能。
絕大多數(shù)基于線性回歸構(gòu)建的劑量模型的預(yù)測準(zhǔn)確率為 50%(33.3% ~60.8%),其中非遺傳因素可解釋17% ~22%的劑量差異[26]。原因可能是很多剩余變量還有待發(fā)現(xiàn),而現(xiàn)有很多變量無法用公式來量化表示,如飲食情況、藥物相互作用等。
首先,線性模型對于非線性的因變量結(jié)果往往預(yù)測效果不佳;其次,線性模型對極端值預(yù)測不準(zhǔn)。實際運(yùn)用中,極端劑量的患者用藥風(fēng)險最高。將線性回歸模型應(yīng)用于華法林劑量研究可能并非最佳。ANN技術(shù)能模擬人的大腦對信息進(jìn)行處理和非線型轉(zhuǎn)換,在復(fù)雜的藥動學(xué)和藥效學(xué)研究中更有優(yōu)勢。因此,應(yīng)用ANN技術(shù)預(yù)測華法林的療效和劑量,與線性回歸模型相比,具有一定的優(yōu)越性。但ANN等機(jī)器算法是否更優(yōu)于傳統(tǒng)的線性回歸算法,也存在一定的爭議[27],目前尚未達(dá)成共識。
原因之一,是缺乏有效的學(xué)習(xí)算法及新型計算機(jī)的軟硬件支持。20世紀(jì)80年代,Hopfield網(wǎng)絡(luò)模型和BP算法提出后,ANN技術(shù)才迅速發(fā)展起來。如今,已有上100種神經(jīng)網(wǎng)絡(luò)模型及算法來解決實際問題,大量的神經(jīng)網(wǎng)絡(luò)軟件也已被開發(fā)應(yīng)用,如Matlab神經(jīng)網(wǎng)絡(luò)工具箱、NeuroSolutions,Neuroshell,Netset,Casenet等,這也將為ANN技術(shù)應(yīng)用到華法林劑量研究中提供更多支持[28]。
和眾多的線性回歸模型一樣,華法林的ANN劑量模型研究雖然取得了一定進(jìn)展,但離臨床推廣和應(yīng)用還有較大距離。同一劑量模型對不同人群可解釋的劑量差異各不相同,這可能與不同種族間基因分布及相關(guān)非遺傳因素的差異相關(guān)。因此,將更多已被公認(rèn)和華法林劑量相關(guān)的遺傳和非遺傳因素一同列入劑量方程中,開展目標(biāo)人群針對性更強(qiáng)的大樣本、多因素研究并利用更大規(guī)模的臨床試驗去驗證其可靠性,或能建立更加適用的劑量預(yù)測模型,患者獲益更好。
隨著信息處理技術(shù)和藥物基因組學(xué)研究技術(shù)的飛速發(fā)展及華法林藥物研究的進(jìn)一步深入,更多的影響華法林劑量的遺傳和非遺傳因素將被發(fā)現(xiàn),相關(guān)研究數(shù)據(jù)將日趨完善,華法林個體化用藥預(yù)測模型的構(gòu)建將步入新時代,ANN技術(shù)的優(yōu)勢也將越來越被充分利用。相信今后將有更多的有價值的華法林人工神經(jīng)網(wǎng)絡(luò)用藥預(yù)測模型被構(gòu)建。