楊麗虹,肖晶旻,劉少南,吳大嶸,葛龍,郭新峰
(1.廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院/廣東省中醫(yī)院,廣東廣州 510120;2.蘭州大學(xué)公共衛(wèi)生學(xué)院循證社會科學(xué)研究中心,甘肅蘭州 730000)
最小臨床意義差值(minimal clinically important difference,MCID)亦被稱為最小重要差值(minimal importance difference,MID),是指在沒有副作用和成本負擔的情況下,患者認為有獲益的最小變化值[1-2]。MCID的提出為試驗結(jié)果的臨床意義判斷、樣本量估算以及臨床決策等提供了依據(jù)。MCID常用的估算方法包括效標法、分布法和文獻分析法等。效標法通過分析目標測量指標與效標之間的相關(guān)性,所得結(jié)果可結(jié)合臨床意義進行解釋,但其估算過程中的樣本、效標和統(tǒng)計方法的選擇等均可影響估算結(jié)果。分布法基于樣本數(shù)據(jù)特征或測量工具精確性等進行估算,所得結(jié)果為標化無量綱的指標,可在不同人群和研究之間進行比較,但其結(jié)果的臨床意義解釋存在難度。文獻分析法依賴于已發(fā)表的文獻,是對既往相關(guān)臨床研究的系統(tǒng)回顧和分析,可提供目標測量指標與臨床終點之間相關(guān)性的數(shù)據(jù),為確定MCID提供依據(jù)。各種估算方法的細節(jié)、適用范圍及其利弊可參考《最小臨床意義差值的概念與估算方法》[3]。
MCID的不同估算方法各有優(yōu)缺點,估算結(jié)果有所差異,這對最終的MCID確定及其應(yīng)用帶來了困難。MCID的確定方法尚未有統(tǒng)一標準,故大部分研究同時采用多種方法進行估算,通過不同策略對多個初始估算值進行合并或選擇其一作為MCID。以下對如何整合多個MCID估算值或從中選擇最終的MCID值的方法、MCID的應(yīng)用及其注意事項、MCID評價工具的開發(fā)等進行分析,以期為臨床研究提供參考。
MCID的確定可基于效標法或效標法結(jié)合分布法或綜合多種方法進行。
1.1 基于效標法確定MCID效標法是通過關(guān)聯(lián)一個獨立的測量指標即外部效標來估算目標測量指標的MCID,而分布法是單純從統(tǒng)計角度基于樣本數(shù)據(jù)特征或測量工具精確性等進行估算。主流觀點認為基于分布法的估算結(jié)果對應(yīng)的是最小可測變化值(minimal detectable change,MDC),而不是MCID[4]。MDC是測量工具可以檢測到的最小變化,是對測量工具的可靠性評價[5]。而MCID是對評價結(jié)果的真實性評價。有學(xué)者[6-7]認為兩者有本質(zhì)不同,不應(yīng)使用分布法的估算結(jié)果直接確定MCID。效標法的結(jié)果更能給出合理的臨床解釋。但是,當無法達到效標的要求時,如效標與目標測量指標之間的相關(guān)性較差甚至無相關(guān)性,應(yīng)放棄效標法,采用其他方法做初步估算。
1.2 效標法結(jié)合分布法確定MCID分布法估算出的區(qū)別于測量誤差的MDC可作為MCID選擇的參考范圍,故可采用分布法輔助效標法確定MCID。目前普遍認為MCID應(yīng)大于或等于MDC[8-10],否則無法判斷該變化是存在真實變化或是測量誤差所引起的。當效標法初始估算值大于分布法估算值時(圖1-A),取前者作為MCID。當分布法估算值大于效標法初始估算值時(圖1-B),說明該測量工具對于個體水平變化的測量不夠精確,取分布法估算值為MCID更為保守。
圖1 最小臨床意義差值(MCID)與最小可測變化值(MDC)的關(guān)系及其意義Figure 1 The relationship of minimal clinically important difference(MCID)and minimal detectable change(MDC)and their significance
另有學(xué)者提出需將多個估算結(jié)果合并以確定MCID。如Reddy V K等[10]提出取效標法和分布法得出的全部估算值的均數(shù)來確定MCID;張傳猛[11]和陳銘揚[12]則只取兩種方法得出的最大值和最小值的均數(shù)來確定MCID;許清安等[13]提出對效標法和分布法的估算結(jié)果加權(quán)整合,并根據(jù)效應(yīng)值和測量工具的相關(guān)系數(shù)的大小選擇不同的估計值確定MCID;Yost K J等[14]提議,僅當測量指標的效應(yīng)值在0.2~0.5之間時才考慮將分布法估算的結(jié)果納入確定MCID的參考值,因為該范圍內(nèi)的效應(yīng)值認為是最小效應(yīng),并以分布法多個估算值的均數(shù)和效標法估算值的均數(shù)確定MCID的范圍。
1.3 綜合多種方法確定MCIDRevicki D等[15]建議以效標法為主,先參考文獻分析法和分布法的結(jié)果縮小MCID取值范圍,然后通過專家共識法最終確定一個MCID值或是更小的MCID區(qū)間。
MCID不是測量工具的內(nèi)在特性,樣本特征和統(tǒng)計方法等的選擇都可導(dǎo)致其結(jié)果有所差別。基于西醫(yī)療效評價數(shù)據(jù)估算出來的MCID無法直接應(yīng)用在中醫(yī)藥的療效評價中,因此有必要運用中醫(yī)藥療效評價的數(shù)據(jù)來確定中醫(yī)藥自己的MCID。中醫(yī)藥領(lǐng)域結(jié)局指標的MCID研究尚處于起步狀態(tài)。
姚丹霓等[16]開展了基于一項陽性藥物作對照的隨機對照試驗,分別采用效標法和分布法估算耳穴貼壓治療尋常型銀屑病患者的皮膚病生活質(zhì)量指數(shù)(DLQI)的MCID。該研究以銀屑病皮損面積和嚴重程度指數(shù)(PASI)為效標得出初始估計值為2.53,通過效應(yīng)值、標準差和標準測量誤差估算得到MDC為0.23~2.58。效標法估算結(jié)果包含在分布法估算范圍中,結(jié)合臨床意義考慮,作者最終取效標法估算結(jié)果2.53確定為耳穴貼壓治療尋常型銀屑病患者DLQI的MCID。路桃影等[17]采用中醫(yī)藥治療失眠患者的隨機對照試驗數(shù)據(jù)計算匹茲堡睡眠質(zhì)量指數(shù)(PSQI)的MCID;以WHOQOL-Bref量表中第16個條目即個體關(guān)于睡眠情況的主觀感受為效標,得出治療第29天初始估算值為1.93~2.90,以效應(yīng)值和標準測量誤差估算得到MDC為1.14~1.80。作者僅通過多種方法估算出PSQI的MCID初始值,但未確定其最終值或取值范圍。
3.1 研究結(jié)果的解釋臨床試驗報告規(guī)范(CONSORT)強調(diào),研究報告中下結(jié)論時應(yīng)考慮試驗結(jié)果的臨床意義。Howard A F等[18]回顧了2016年以前發(fā)表的95篇兒童腫瘤的隨機對照試驗,僅22.1%的研究結(jié)合了研究結(jié)果的臨床意義進行結(jié)論推導(dǎo),其中4.2%的研究給出了臨床意義判斷的依據(jù)。研究結(jié)果的臨床意義可以通過比較研究結(jié)果95%可信區(qū)間(95%CI)與MCID的關(guān)系進行判斷。以正向指標(數(shù)值越大,療效越好)為例,在樣本量充足且結(jié)果具有統(tǒng)計學(xué)意義的前提下,當研究結(jié)果95%CI下限大于MCID時,該研究結(jié)果具有臨床意義(圖2-A);當95%CI上限小于MCID時,該研究結(jié)果不具有臨床意義(圖2-B);當95%CI下限小于MCID,但點估計值大于MCID時,該研究結(jié)果可能具有臨床意義(圖2-C);在95%CI上限大于MCID,但其下限和點估計值均小于MCID時,則尚不能確定該研究結(jié)果是否具有臨床意義(圖2-D)[19-21]。
圖2 結(jié)合最小臨床意義差值(MCID)解釋研究結(jié)果臨床意義的示意圖Figure 2 Illustration of the clinical significance of the research results explained by comparing with MCID
例如,在采用可逆性間歇性腹內(nèi)迷走神經(jīng)阻滯術(shù)治療肥胖癥的雙盲隨機對照試驗中,手術(shù)組平均體質(zhì)量減輕22.4%,假手術(shù)組平均體質(zhì)量減輕15.9%,組間差異為8.5%(95%CI[3.1%,13.9%]),差異具有統(tǒng)計學(xué)意義(P<0.05)。但是差異的點估計值未達到項目預(yù)設(shè)的MCID(平均體質(zhì)量減輕10%)且95%CI跨越了MCID,故基于該研究的結(jié)果尚未能確定該手術(shù)治療肥胖癥患者是否具有臨床意義[22]。
在制定臨床指南過程中,需依據(jù)GRADE(Grading of Recommendations,Assessment,Devel?opment and Evaluations)標準對證據(jù)結(jié)果的精確性進行評價,此時需首先判斷95%CI是否跨過推薦或不推薦的臨床決策閾值,MCID即可作為這個臨床決策閾值。如果95%CI跨過決策閾值,則判斷該結(jié)果的精確性不足,證據(jù)可能不具有臨床意義,需要對證據(jù)等級做降級處理[23]。
3.2 響應(yīng)者分析經(jīng)治療干預(yù)后,評價指標變化達到MCID受試者定義的為響應(yīng)者。Cates C等[24]認為研究結(jié)果臨床意義的判斷除了上述比較之外,還需結(jié)合如響應(yīng)者分析等反映個體響應(yīng)度的結(jié)果。均數(shù)差95%CI反映的是群體平均治療效應(yīng)有95%的概率落在該范圍,均數(shù)差95%CI上限未達到MCID,并不意味著95%的患者未達到MCID。在噻托溴銨治療慢性阻塞性肺疾病的系統(tǒng)評價中,與安慰劑相比,噻托溴銨治療后的圣喬治呼吸問卷總分下降-2.89(95%CI[-3.35,-2.44]),差異具有統(tǒng)計學(xué)意義,但未達到該量表的MCID(-4)。依據(jù)95%CI與MCID的關(guān)系判斷,噻托溴銨治療慢性阻塞性肺疾病后患者生存質(zhì)量改善程度沒有達到臨床意義。Karner C等[25]對該系統(tǒng)評價納入的研究進行響應(yīng)者分析,將經(jīng)治療后評分下降大于4分者定義為響應(yīng)者,結(jié)果顯示噻托溴銨的有效率優(yōu)于安慰劑(RR=1.25,95%CI[1.20,1.31])。由于連續(xù)性變量轉(zhuǎn)換為二分類變量會損耗統(tǒng)計效能,Cates C等[24]不建議用響應(yīng)者分析代替95%CI與MCID比較作為臨床意義判斷的依據(jù),但指出應(yīng)在群體結(jié)果的基礎(chǔ)上考慮不同個體對治療的反應(yīng)。
澳大利亞衛(wèi)生部發(fā)布的新藥/新適應(yīng)證申請指南中亦指出,在評價臨床試驗時,除了根據(jù)研究結(jié)果是否大于或等于MCID以判斷其有效性外,還可采用響應(yīng)者分析并以累積分布函數(shù)的形式直觀展現(xiàn)[26](見圖3)。
圖3 累積分布函數(shù)展現(xiàn)研究結(jié)果臨床意義示例Figure 3 Illustration of the clinical significance of the research results showed by cumulative distribution tunction
3.3 樣本量估算理論上可采用MCID作為樣本量估算的臨界值,包括優(yōu)效界值和非劣效界值。Gerlinger C等[27]通過3種方法估算視覺模擬量表評分評價子宮內(nèi)膜異位癥相關(guān)盆腔痛的MCID,3種方法的估算結(jié)果與既往同類非劣效試驗中使用的非劣效界值相近,故而作者認為在非劣效試驗中可以使用MCID作為非劣效界值來計算樣本量。實際使用時,為了避免實際比對照療法差的新療法卻在統(tǒng)計分析中得到優(yōu)于對照療法的錯誤結(jié)論,研究者們會較為保守地選擇小于MCID的數(shù)值,如以MCID的1/2或2/3作為非劣效界值[6]。
隨著系列臨床研究報告規(guī)范的發(fā)表,樣本量估算逐漸受到研究者重視,但目前也僅有少數(shù)的研究報告了樣本量估算參數(shù)確定的依據(jù)。文獻研究結(jié)果顯示,僅4.2%~11.0%的隨機對照試驗采用MCID作為樣本量估算的依據(jù)并報告了該選擇的原因[18]。
3.4 個體療效預(yù)測和臨床決策支持目前MCID估算方法是基于群組數(shù)據(jù),極少研究提供了個體水平的分析。由于不同個體對治療響應(yīng)的差異,未達到MCID的患者未必就沒有臨床獲益,反之亦然。因此基于群體數(shù)據(jù)的MCID不適合直接應(yīng)用于個體臨床決策。Stratford P W等[28]參考診斷試驗的思路,計算樣本中達到MCID的患者比例作為驗前概率,達到MCID的似然比為陽性似然比,未達到MCID的似然比為陰性似然比,再算出達到和未達到MCID的驗后概率,用于個體療效預(yù)測。如對226例腰背痛患者進行治療后并隨訪,采用羅蘭莫里斯腰痛問卷評分進行評價療效。結(jié)果顯示經(jīng)治療后63%的患者達到MCID,陽性似然比和陰性似然比分別為4.00和0.34,算出達到和未達到MCID的驗后概率分別是87%和37%。依據(jù)驗后概率可判斷,臨床特征與樣本人群相似的患者經(jīng)同一方案治療后,羅蘭莫里斯腰痛問卷評分改善達到MCID者將有87%的概率具有臨床獲益,而未達到MCID者但具有臨床獲益的概率為37%。
4.1 MCID的適用范圍有限MCID是為了更好地解釋生活質(zhì)量量表和臨床療效問卷等患者報告結(jié)局分值變化的臨床意義而提出的[1]。后續(xù)應(yīng)用擴展到如6 min步行試驗、摔倒率、肌鈣蛋白等生理功能指標和實驗室指標[29-31]。但基于患者報告結(jié)局提出的MCID估算方法是否完全適用于生理功能和實驗室指標等的估算,仍有待評估和檢驗。硬終點指標死亡率和病死率以及臨床重要結(jié)局指標如心腦血管事件等不需要確定MCID。死亡率和病死率若能減少1%,也同樣具有臨床意義。在確切存在統(tǒng)計學(xué)意義的前提下,應(yīng)用過程中更多的是衛(wèi)生經(jīng)濟學(xué)和資源等方面的考慮。故MCID通常更適用于患者報告結(jié)局和中間指標或替代指標的臨床意義解釋。
4.2 使用MCID時報告細節(jié)不詳因MCID并非測量工具的內(nèi)部特性,在估算過程中各個環(huán)節(jié)的多樣性決定了MCID的使用場景隨方法和樣本變化而不同。樣本人群的臨床特征(如疾病分期、嚴重程度、年齡、性別等)、干預(yù)措施、統(tǒng)計方法等都會影響MCID的結(jié)果。一個MCID無法適用于所有臨床場景。例如,基于早期糖尿病腎病研究確定尿蛋白的MCID可能不適用于晚期患者的臨床研究和臨床決策[32]?;谛朔ㄋ玫腗CID可以是組內(nèi)前后變化值,也可能是組間治療前后變化的差值[33-34];前后變化值的這類MCID不應(yīng)用于作為組間治療差異的臨床意義判斷依據(jù),而組間變化差值在使用時也需了解該MCID估算時對照組與本研究中的對照組是否同質(zhì)。目前存在上述兩類MCID無差別地用于評價組間差異和樣本量估算的應(yīng)用誤區(qū)。對此,在應(yīng)用MCID時必須了解其估算的方法和樣本的特征,方可判斷該MCID是否適用于目前開展的研究或臨床場景。
澳大利亞衛(wèi)生部的新藥/新適用證申請指南中明確提出,提交的臨床試驗材料中應(yīng)包括評價指標的MCID及其估算方法、樣本特征、指標定義等細節(jié)內(nèi)容,以評估該MCID應(yīng)用于這個試驗的樣本量估算和/或結(jié)果判斷的適用性(表1)[35]。
表1 應(yīng)報告的最小臨床意義差值(MCID)細節(jié)Table 1 The details of MCID needing to be reported
4.3 缺少MCID可信區(qū)間MCID一般報告形式是基于人群的點估計值,少數(shù)研究報告MCID的范圍,但是都缺少相應(yīng)的可信區(qū)間估計。在臨床應(yīng)用時可能存在把未達到MCID但實際有臨床獲益的療法錯誤地評價為無效的風(fēng)險[35]。
Johnston B C等[36]于2015年啟動了MCID數(shù)據(jù)庫項目,系統(tǒng)收集基于效標法估算的患者報告結(jié)局的MCID研究,并開發(fā)MCID可信度評價工具??尚哦榷x為MCID研究的設(shè)計和實施方案可防止誤導(dǎo)性結(jié)果產(chǎn)生的程度。項目組初步擬定評價工具條目,通過與GRADE工作組、Cochrane協(xié)作網(wǎng)、WHO以及加拿大藥品與技術(shù)衛(wèi)生局等多個組織和機構(gòu)密切合作,邀請全球范圍內(nèi)參與過臨床試驗、系統(tǒng)評價、患者報告結(jié)局開發(fā)和臨床指南制定等的研究人員,開展多輪專家咨詢。在MCID可信度評價工具達成共識后,對納入數(shù)據(jù)庫的MCID研究開展可靠性評價:每個MCID研究由3名專家采用可行性分析工具進行評價,通過二次加權(quán)Kappa系數(shù)計算評價者之間的可靠性(Kappa系數(shù)≥0.6為最低可接受水平,≥0.7判斷為評價者之間的可靠性良好)。項目的研究成果將整合到GRADEprofiler和MAGICapp(http://magicproject.org/magicapp/,MAGICapp是使用GRADE框架的指南和證據(jù)摘要來創(chuàng)建工具)以供研究者使用[37]。
基于以上分析可知,MCID更適用于患者報告結(jié)局和中間指標或替代指標的臨床意義解釋。而MCID的估算和確定方法尚未達成共識。臨床方法學(xué)家傾向于選擇容易從臨床??平嵌冉忉尩男朔?,而支持分布法的統(tǒng)計學(xué)專家也認識到分布法需要與其他臨床療效標準比較以提高其結(jié)果的臨床可解釋性[37]。目前各種估算方法均存在一定局限,建議同時使用多種估算方法獲得多個MCID初步估算值,并以效標法為主,采用其他方法輔佐或?qū)⒍喾N方法通過統(tǒng)計整合的估算值來確定最終的MCID。MCID可協(xié)助進行臨床研究結(jié)果的臨床意義判斷、樣本量估算以及臨床決策等,但建議在具體應(yīng)用之前,應(yīng)充分了解該MCID的估算方法和樣本特征。