蔡旭, 肖劍偉, 郭粉蓮, 程釩釩, 胡鑫玉, 許楚花, 陳澤建
1深圳市福田區(qū)風(fēng)濕病專科醫(yī)院風(fēng)濕免疫科(廣東深圳 518000); 2深圳市福田區(qū)婦幼保健院計算機中心(廣東深圳 518000)
強直性脊柱炎(ankylosing spondylitis, AS)是一種典型的炎癥性疾病,它屬于脊柱關(guān)節(jié)炎中的一種,其特征是脊柱、外周關(guān)節(jié)、韌帶和肌腱炎癥[1]。AS的病程通常逐漸進展,隨之而來的是與脊柱相關(guān)的功能的惡化,導(dǎo)致生活質(zhì)量下降[2]。隨著生物制劑的研發(fā)和發(fā)展,目前其已經(jīng)在AS中獲得了廣泛的應(yīng)用,并使眾多患者獲益。然而,在臨床應(yīng)用中,也存在部分患者因為依從性差,導(dǎo)致治療效果欠佳的現(xiàn)象,從而影響了患者的預(yù)后。依從性是與治療結(jié)果密切相關(guān)的重要因素之一,不依從性是日常臨床實踐中的一個具有挑戰(zhàn)性的問題。研究顯示,依從性不足會導(dǎo)致疾病的發(fā)病率和病死率增加。此外,依從性差會給醫(yī)療帶來重大經(jīng)濟負(fù)擔(dān)[3-5],生活質(zhì)量下降、治療效果差、住院風(fēng)險增加和住院時間延長、由于低估治療效果而做出不適當(dāng)?shù)闹委煕Q定以及患者滿意度下降[6]。依從性領(lǐng)域的研究證實,提高依從性干預(yù)措施的有效性,對人群健康的影響可能遠(yuǎn)遠(yuǎn)大于具體醫(yī)療方法的任何改進[7]。幾項研究調(diào)查了風(fēng)濕性疾病如類風(fēng)濕性關(guān)節(jié)炎、系統(tǒng)性硬化癥 (SSc)、幼年特發(fā)性關(guān)節(jié)炎和系統(tǒng)性紅斑狼瘡的不依從性風(fēng)險[8-9],證實藥物依從性與年齡、疾病感知、藥物選擇和給藥途徑有關(guān)。關(guān)于AS的依從性研究顯示,AS患者在隨訪第一年治療依從性為41.0%,在兩年的隨訪結(jié)束時,比率降至20.0%[10]。慢性病的藥物的不依從性受到多種因素的影響,如年齡、性別、收入和受教育程度、病情活動度等[11]??紤]到藥物治療不依從性嚴(yán)重影響患者預(yù)后,同時,大量因素影響了藥物的不依從性。因而,建立可靠的依從性的預(yù)測工具,及時發(fā)現(xiàn)依從性差的患者并進行干預(yù),是改善患者預(yù)后,避免患者出現(xiàn)各種并發(fā)癥的有效方法之一。常見評估不依從性有直接和間接兩種方法,直接法包括治療藥物監(jiān)測和藥物或代謝物測量等提供了可量化的值,從而提供了藥物攝入的證據(jù)。然而,這些方法費用昂貴而且對患者極不方便。而間接方法,包括了藥丸計數(shù)法、自我報告方法等,其操作較為便利,但是因為主觀性較高,可能高估了依從性。兩種方法各有優(yōu)點和缺點,目前仍然沒有一種方法可以準(zhǔn)確地衡量治療依從性。本研究通過機器學(xué)習(xí),旨在開發(fā)一種有效但簡單的預(yù)測工具來評估AS患者使用生物制劑的不依從性的風(fēng)險。
1.1 一般資料 機器學(xué)習(xí)樣本量需為納入因子的5~10倍,同時按照失訪率20%計算,需納入患者不能低于160名,樣本量越大其結(jié)果越可靠。按照樣本量測算,選取我院2020年1月至2022年10月我院門診及住院確診AS患者共220例,所有入院患者均為首次使用生物制劑治療(阿達(dá)木單抗、依那西普、司庫奇尤單抗)。本研究經(jīng)深圳市福田區(qū)風(fēng)濕病??漆t(yī)院倫理委員會審查同意通過(FS202001001)。
納入標(biāo)準(zhǔn):(1)年齡>18歲,符合修訂的AS 紐約標(biāo)準(zhǔn)(1984年)[12];(2)具有小學(xué)以上文化水平,能夠進行有效溝通及填寫問卷;(3)簽署知情同意書。
排除標(biāo)準(zhǔn):(1)存在上述生物制劑過敏患者;(2)妊娠、哺乳期患者;(3)合并有惡性腫瘤及精神類疾病無法配合者。
1.2 方法 所有入組患者在第一次使用生物制劑時由門診或病房專科護士收集患者年齡、性別、身高、體重、是否參與醫(yī)保、月收入、受教育水平、疾病活動度,是否存在藥物不良反應(yīng)、居住地到醫(yī)院的距離、藥物每月使用頻次、焦慮程度、醫(yī)患信任度、是否合并使用非甾體類藥物等資料。其中,疾病活動度使用強直性脊柱炎疾病活動指數(shù)(bath ankylosing spondylitis disease activity index, BASDAI);體質(zhì)指數(shù)(body mass index, BMI)通過身高體重計算得出;醫(yī)患信任度采用維克森林醫(yī)師信任量表中文修訂版評估[13],焦慮程度采用漢密爾頓焦慮量表評估[14];在患者首次接受治療后,在第1周,第1、2、6個月通過微信或電話進行隨訪,在半年內(nèi)出現(xiàn)皮疹、肝腎功能異常、注射部位異常及結(jié)核等感染均視為存在不良反應(yīng)。共納入13個預(yù)測因子。
藥物使用依從性通過治療覆蓋時間比例(propotion of days covered, PDC)來確認(rèn)[15]。PDC>80%認(rèn)定該患者依從性良好[16]。所有的患者均在第1周,第1、2、6個月時通過微信、電話或門診隨診,研究終點為在第6個月最后1次隨訪時,患者是否仍繼續(xù)堅持治療,同時查詢醫(yī)院處方信息系統(tǒng),最終計算得出PDC。根據(jù)總病例數(shù)減去PDC結(jié)果得到的依從性良好病例數(shù),得到不依從性人數(shù)。
1.3 數(shù)據(jù)處理及統(tǒng)計學(xué)分析 所有研究數(shù)據(jù)均采用 Microsoft office EXCEL軟件,由雙人平行錄入。由另外2名工作人員進行一致性核對和異常值核查。如出現(xiàn)缺失值超過50%的特征變量,予以刪除。對于缺失值<50%的變量,如變量為分類變量,采用KNN分類器進行缺失填補;如變量為連續(xù)變量,采用隨機森林分類器進行缺失填補。
在分析前,對變量進行因子轉(zhuǎn)換,年齡因子<50歲設(shè)置為0,≥50歲設(shè)置為1;性別因子男性設(shè)置為0,女性設(shè)置為1;BMI<23.9 kg/m2設(shè)置為0,≥23.9 kg/m2設(shè)置為1;醫(yī)保因子根據(jù)是否醫(yī)保設(shè)置為0/1;月收入因子根據(jù)收入水平<5 000元,5 000~10 000元及10 000元以上分別設(shè)置為0/1/2;教育水平因根據(jù)其學(xué)歷水平(初中及以下,高中,大專及以上)子分別設(shè)置為0/1/2;疾病活動度使用BASDAI評分,<4分設(shè)置為0,≥4分<7分設(shè)置為1,≥7分設(shè)置為2。無藥物不良反應(yīng)設(shè)置為0,出現(xiàn)藥物不良反設(shè)置為1;到醫(yī)院的距離,<20 km設(shè)置為1,≥20 km設(shè)置為2;藥物每月使用頻次,每月1次設(shè)置為1,每月2次設(shè)置為2,每月>2次設(shè)置為3;根據(jù)漢密爾頓量表評分結(jié)果,將焦慮評分<7分設(shè)置為0,7~14分設(shè)置為1,15~28分設(shè)置為2,≥29分設(shè)置為3;醫(yī)患信任度以量表評估結(jié)果為非常認(rèn)同及比較認(rèn)同設(shè)置為1,余設(shè)置為0。合并使用非甾體類藥物設(shè)置為1,未使用設(shè)置為0。
所有收集到的數(shù)據(jù)以百分比(%)表示。使用R軟件(版本號4.2.0)進行分析。使用R軟件corrplot包分析各因子相關(guān)性。使用LASSO(least absolute shrinkage and selection operator)回歸分析、支持向量機(support vector machine, SVM)分別進行因子篩選。使用R中的glmnet包,通過LASSO算法采取10折交叉驗證對特征因子進行篩選。通過R的e1071包進行SVM分析,其中核函數(shù)設(shè)置為線性核函數(shù),懲罰系數(shù)C設(shè)置為0.1。LASSO回歸及SVM計算結(jié)果取交集獲得最佳因子。分析各個因子相關(guān)性。隨后使用多變量logistic回歸建立預(yù)測模型,同時繪制諾模圖。通過測量C 指數(shù)來辨別諾模圖的預(yù)測能力;繪制受試者工作特征(receiver operating characteristic,ROC)曲線及校正曲線評估預(yù)測模型的準(zhǔn)確性;繪制決策分析曲線來評估不同閾值概率下的凈收益以確定預(yù)測模型的臨床實用性。通過AdaBoost算法及Lightgbm算法對構(gòu)建的二分類模型進行驗證,繪制ROC曲線及PR (precision-recall)曲線驗證模型預(yù)測能力,并通過SHAP值(SHapley Additive exPlanation)可視化顯示各變量重要性。隨后,對原始數(shù)據(jù)集進行隨機抽樣70%,通過C指數(shù)、校正曲線、ROC曲線進行內(nèi)部驗證。
2.1 臨床特征 共有201例患者納入研究, 19例因失訪、不良反應(yīng)及數(shù)據(jù)缺失等原因退組。201例患者中,依從性組為107例,不依從性組為94例。兩組納入數(shù)據(jù)具體見表1。
2.2 特征因子篩選及多變量logistic回歸構(gòu)建模型 LASSO回歸篩選出教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動度、年齡6個因子。SVM篩選出教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動度、年齡、性別7個因子,兩者取交集得到教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動度、年齡作為構(gòu)建預(yù)測模型的因子(圖1)。相關(guān)性分析顯示,各因子之間無明顯相關(guān)性,提示各因子不存在多重共線性(圖2)。通過多變量logistic回歸將納入的6個因子構(gòu)建臨床預(yù)測模型(β=0.3996,OR=1.491, 95%CI=0.490~4.601,P<0.05),通過諾莫圖可視化(圖3)。
注:A:LASSO回歸;B:SVM篩選特征因子
圖2 特征因子相關(guān)性分析
圖3 藥物不依從性諾模圖
2.3 模型預(yù)測性能評估 模型C指數(shù)結(jié)果為0.739,提示該預(yù)測模型具有良好的區(qū)分性。校準(zhǔn)曲線結(jié)果顯示出良好的一致性(圖4A)。ROC曲線顯示曲線下面積(AUC)為0.715,提示模型有較高的準(zhǔn)確性(圖4B);校準(zhǔn)曲線結(jié)果顯示,在不損害其他患者利益的情況下,該模型可使約90%的患者受益 (圖5)。AdaBoost算法及Lightgbm算法顯示ROC曲線下面積分別為0.643和0.633(圖6A),PR曲線下面積分別為為0.634和0.676(圖6B)。SHAP可視化結(jié)果顯示,AdaBoost算法中,各變量重要性依次為疾病活動度、焦慮水平、月收入、教育水平、用藥頻次及年齡(圖7A);Lightgbm算法各變量重要性依次為焦慮水平、疾病活動度、教育水平、月收入、年齡及用藥頻次(圖7B)。
注:A:對角線的虛線表示理想的模型,實線表示諾模圖實際的性能,實線越接近對角線的虛線表示模型的預(yù)測能力越強;B: ROC曲線顯示AUC為0.715
圖5 臨床決策曲線
注:A:ROC曲線;B:PR曲線
注:A:Adaboost算法;B:Lightgbm算法
2.4 內(nèi)部驗證 隨機抽取70%數(shù)據(jù)進行內(nèi)部驗證,結(jié)果顯示內(nèi)部驗證集C指數(shù)為0.755,ROC曲線顯示AUC為0.733(圖8A),校準(zhǔn)曲線結(jié)果也顯示抽樣數(shù)據(jù)構(gòu)建的模型具有良好的一致性(圖8B)。
注:A:ROC曲線;B:校準(zhǔn)曲線
機器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域取得了令人矚目的進步,多個研究表明,機器學(xué)習(xí)在疾病生物標(biāo)志物、預(yù)后等多個方面發(fā)揮著重要的作用[17-18]。本研究通過多種機器學(xué)習(xí)的方法,篩選出多個因子,構(gòu)建AS患者使用生物制劑不依從性的臨床預(yù)測模型,以期更加精準(zhǔn)識別依從性差的AS患者,及時進行干預(yù)。對該模型進行驗證,C指數(shù)、ROC曲線等均顯示模型具有良好的預(yù)測及校準(zhǔn)能力。而AdaBoost及Lightgbm通過SHAP可視化結(jié)果顯示在6個變量中,疾病活動度及焦慮程度對模型的貢獻值較大,兩個模型與諾莫圖展現(xiàn)的結(jié)果是相一致的,顯示疾病活動度及焦慮程度在患者不依從性中有著重要的作用,建立的模型能夠較有效的識別不依從性高的患者。
不依從性預(yù)測模型可以幫助臨床醫(yī)護人員識別具有不依從性高風(fēng)險的AS患者。根據(jù)這種模型采取干預(yù)措施,通過解決可改變的因素,可以最大限度地提高依從性。本研究發(fā)現(xiàn),有46.8%的AS患者未能堅持使用生物制劑治療。特征重要性分析可以提供對臨床的見解。研究發(fā)現(xiàn)教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動度、年齡可能是AS患者用藥不依從性的相關(guān)風(fēng)險因素。眾所周知,依從性差會導(dǎo)致疾病活動增加[19]。依從性和疾病嚴(yán)重程度之間的關(guān)系可以是雙向的,疾病的嚴(yán)重程度可能是依從性的原因和結(jié)果。在這項研究中,模型結(jié)果顯示,BASDAI是預(yù)測不依從性的重要因素,病情活動度高的患者具有更高的依從性,可能為患者在疾病活動期出現(xiàn)劇烈的疼痛及晨僵,同時其他口服的慢作用抗風(fēng)濕藥物在AS患者中效果較差,讓患者有更大的意愿積極使用生物制劑治療。而在病情緩解后,很多患者會忽視疾病的后續(xù)治療。因而在臨床上,要更加關(guān)注疾病活動度較低的患者,做好疾病相關(guān)知識的宣教,從而提高患者的依從性。
年齡對風(fēng)濕免疫患者治療不依從性的影響在不同的研究有著不同的結(jié)論[20-21]。本研究發(fā)現(xiàn),老年患者對生物制劑的治療有個更高的不依從性,考慮可能為生物制劑多數(shù)需在醫(yī)院注射,同時老年患者部分合并有基礎(chǔ)疾病,治療藥物的增加,導(dǎo)致老年患者治療意愿下降。和既往研究類似,受教育水平越低,不依從性越高[22]。在受教育水平高的患者中,其獲取疾病相關(guān)知識的來源更加多樣,如互聯(lián)網(wǎng)等,同時對于疾病遠(yuǎn)期的損害的理解也更加深刻,因而有更強的意愿規(guī)范治療。慢性風(fēng)濕性疾病給患者及其家屬帶來了沉重的經(jīng)濟負(fù)擔(dān),國內(nèi)一項研究顯示,AS患者年平均費用為29 035.60元[23]。本研究發(fā)現(xiàn),收入較低人群的依從性較差,考慮可能為沉重的經(jīng)濟負(fù)擔(dān)影響了患者治療的依從性,這與一項研究炎性關(guān)節(jié)病患者依從性與經(jīng)濟關(guān)系相關(guān)性分析結(jié)果[24]是一致的,提示在臨床治療中,要更加關(guān)注患者經(jīng)濟情況,選擇更加經(jīng)濟而有效的方案,從而提高患者的依從性。多個報告指出,藥物的使用頻次會影響患者依從性[9,25]。本研究發(fā)現(xiàn),生物制劑每月使用頻次會對患者的依從性產(chǎn)生負(fù)面影響,推測對于每月使用頻次更少的生物制劑有著更好的依從性歸因于更方便的給藥方案,減少了患者反復(fù)就醫(yī)及注射藥物次數(shù),從而提高了依從性。
越來越多的研究關(guān)注風(fēng)濕免疫患者的心理狀況。一項關(guān)注AS患者心理狀況的研究顯示, AS患者更容易患焦慮癥[26]。另一項研究顯示,60%的AS患者合并有焦慮癥[27]。研究結(jié)果顯示,在患有風(fēng)濕免疫疾病人群中,更好的心理健康狀況預(yù)示著更好的依從性[28]。而在AS患者中,目前尚未有報道焦慮程度與依從性相關(guān)的報道,本研究發(fā)現(xiàn),焦慮是AS患者不依從性的危險因素,焦慮程度越高,其不依從性風(fēng)險越高,考慮可能為焦慮患者對治療的信心降低,認(rèn)為藥物無效以及用藥會產(chǎn)生不良反應(yīng),從而對治療采取消極的態(tài)度。
綜上,本研究通過構(gòu)建6個預(yù)測因子構(gòu)建了簡易,操作性強且預(yù)測能力較高的AS患者使用生物制劑不依從性預(yù)測模型,并通過諾莫圖給予可視化,提高了臨床使用的便利性,有利于醫(yī)護人員及早發(fā)現(xiàn)不依從性較高的患者從而及早進行干預(yù)。然而,本研究也存在一定局限性,一是患者數(shù)量有限,無法評估可能的混雜因素,例如患者對治療的反應(yīng)、自身其他合并疾病等,同時可能出現(xiàn)數(shù)據(jù)分布不均情況。二是未能進行外部數(shù)據(jù)驗證,需要在接下來的研究中進一步收集數(shù)據(jù)進行外部驗證。
利益相關(guān)聲明:所有作者聲明無可能影響研究結(jié)果的非財務(wù)沖突關(guān)系,或可能影響本研究結(jié)果和討論的競爭利益。
作者貢獻說明:蔡旭直接參與研究設(shè)計、研究實施、論文起草和批評性審閱;肖劍偉參與研究設(shè)計、數(shù)據(jù)收集、論文修改;郭粉蓮參與數(shù)據(jù)整理、論文起草及修改;程釩釩參與患者隨訪、數(shù)據(jù)收集、論文起草和修改;胡鑫玉參與患者隨訪、數(shù)據(jù)收集、論文起草和修改;許楚花參與患者隨訪、數(shù)據(jù)收集、論文起草和修改;陳澤建參與數(shù)據(jù)分析、模型建立及代碼編寫支持。