王吉耀 夏君
“臨床實踐指南”(以下簡稱指南)是基于系統(tǒng)評價的證據(jù)和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見。因此,指南是為臨床診療決策提供參考和指導的重要文件,系統(tǒng)地指導臨床醫(yī)生提升臨床診療水平,規(guī)范醫(yī)療行為,提高醫(yī)療質量,改善患者臨床結局;當質量可靠、外推性良好的指南與醫(yī)療保障體系有機結合時,在提高人民健康水平的同時也給國家?guī)砹司薮蟮慕?jīng)濟效益。近年來,我國的臨床專家對于指南的制定熱情高漲,我國發(fā)表的指南數(shù)量快速增長,雖在質量上穩(wěn)步提升,但是總體質量良莠不齊,針對同一臨床問題有多個指南,其推薦意見可能有不同,讓醫(yī)師和患者不知如何選擇。甚至有的專家熱衷于寫共識和指南,但是并不知道共識與指南的區(qū)別,以及如何書寫合格的指南。正由于指南的質量高低、是否具備科學性和實用性,會對患者的診療效果產(chǎn)生重要影響,質量差的所謂“指南”會誤導醫(yī)生和患者,因此必須強調規(guī)范化地制定指南。
2019年筆者使用中國臨床實踐指南評價體系(AGREE-China)[1]對2013年—2018年在消化領域發(fā)表的指南和共識進行評價[2],在48 篇入選的指南或共識中,60 分以上的僅占24% ,有3 篇獲得了高分(>80分),其中2 篇屬于肝病領域,即《膽汁淤積性肝病診斷和治療共識(2015)》[3](86.2 分)和《慢性乙型肝炎防治指南(2015更新版)》[4](80.2 分)。上述兩篇指南共識采用了GRADE 系統(tǒng)對循證醫(yī)學證據(jù)的質量和推薦意見級別進行評估;同時納入了更多高質量的中國研究,并繪制了流程圖,提高了可操作性;在疾病流行病學特征和診療方案推薦上更符合我國臨床實踐。但是在科學性方面還有提高的空間,例如在證據(jù)評價和形成推薦意見方面具有透明性,可溯源。分值低的指南共識存在的主要問題是沒有按照國際通用的GRADE 標準進行證據(jù)評價和形成推薦意見,缺少科學性。總分40.0~59.9 分的入選指南或共識30篇(62.5% ),其中描述了循證醫(yī)學證據(jù)質量和推薦意見等級評價方式的僅占20% (6/30)。2021 年《中華醫(yī)學雜志》發(fā)表的《2020 中華醫(yī)學會雜志社系列期刊發(fā)表指南評價報告》顯示,符合AGREE- China[1]、IOM[5]和RIGHT[6]三種評價標準的指南比例相對較低,60 分以上的僅占7.3% (13/177)。文章指出,在指南注冊、多學科專家組參與、系統(tǒng)檢索和評價證據(jù)、利益沖突管理和規(guī)范化報告方面,仍需要進一步提升和完善[7]。
在查詢文獻時,常??吹接械膶<乙庖娨浴肮沧R”出現(xiàn),共識與指南有什么區(qū)別呢?其實,對共識的認識和理解國內外有所差異[8]。國際上,共識的內涵更多代表了一種為達成指南中的推薦意見而采納的方法或途徑。在國內,大多數(shù)業(yè)內人士認為醫(yī)學領域的專家共識常基于間接證據(jù),并未進行正式的質量評估或者文獻檢索不全,對證據(jù)無法進行評價分級,此時大多數(shù)專家們達成的一致意見稱為共識,是一種質量和影響力低于指南的行業(yè)指導文件。國際同行指出,用“指南”和“共識”來區(qū)別這些文件存在誤導性[9]。原因包括以下幾個方面,首先指南和共識都存在尋找證據(jù)、解讀證據(jù)、依據(jù)證據(jù)達成推薦意見的共識的過程,納入的證據(jù)質量的高低不能成為區(qū)分二者的標準。指南中也經(jīng)常會遇到僅有低質量的證據(jù)甚至沒有研究證據(jù)的情況,而這時指南專家組就需要依據(jù)現(xiàn)的低質量證據(jù)達成推薦意見的共識。其次,二者都要對證據(jù)的含義達成共識。研究證據(jù)都是需要解讀的,這就是每個指南中專家組對證據(jù)提供的信息達成共識的過程。例如對證據(jù)的以下特征達成解讀的共識:研究證據(jù)是否存在偏倚風險、其顯示的干預效果是否達到了有意義的臨床獲益、結果是否精準等等。最后,二者都要對證據(jù)合理恰當?shù)赝馔七_成共識。研究證據(jù)不能直接決定推薦意見,需要指南專家組全面考慮用戶們的價值偏好,結合當?shù)匦l(wèi)生醫(yī)療環(huán)境的現(xiàn)狀對證據(jù)作出外推性和適用性的判斷。既然二者的制作過程中不斷地、重復地出現(xiàn)“共識”的過程,所以用“指南”或“共識”區(qū)別兩者是不恰當?shù)摹?/p>
指南具有科學性、透明性和可靠性的特征。《WHO指南制定手冊》[10]對于如何制定合格的指南有詳細的規(guī)定。指南制定前應根據(jù)臨床需求確定該領域臨床人員和患者最希望解決或者最具爭議的問題,充分了解同領域是否已有相關指南,以及指南制定的證據(jù)基礎是否充分。確立指南項目后,一般由學會牽頭建立指南制定工作組,成員除了臨床專家外,包括方法學家的多學科團隊。每一部指南都為了解決不同的臨床問題,需要將臨床問題分解為不同的PICO 問題(P:人群/患者,I:干預措施,C:對照,O:結局)。然后采用正確、全面的文獻檢索策略進行證據(jù)檢索,對檢索到的證據(jù)進行綜合,形成針對某個問題的證據(jù)體,然后對證據(jù)體進行證據(jù)質量評價和分級,一般采用GRADE 證據(jù)分級系統(tǒng),分為高、中、低、極低級(有時用A、B、C、D 級來表達)。對證據(jù)體采用證據(jù)概要表進行描述,如對證據(jù)體內偏倚,證據(jù)之間的一致性、間接性,證據(jù)效應值的精準度,以及發(fā)表偏倚進行描述。將對于某一個臨床問題證據(jù)體的評估結果(在發(fā)表指南時,應詳細說明推薦意見是否基于系統(tǒng)評價的證據(jù),這些系統(tǒng)評價是否發(fā)表。如果未發(fā)表,應將系統(tǒng)評價作為指南的附件,公開供讀者和使用者獲取)提交到指南制定工作組進行從證據(jù)到推薦意見的討論,從證據(jù)到形成推薦意見應該有科學、正確的方法,如德爾菲法、名義群體法、共識形成會議法、投票系統(tǒng)等。形成推薦意見時不僅要考慮證據(jù)的強度等級,還要考慮干預措施的直接獲益/受損的程度對比、本地的醫(yī)療環(huán)境、醫(yī)療條件、經(jīng)濟成本、患者價值偏好、衛(wèi)生服務公平性、干預措施的可接受度以及可行性等進行綜合性的利弊權衡,推薦方案是否經(jīng)過了衛(wèi)生經(jīng)濟學的評價,如進行了成本-效果分析。通常,指南推薦的方案應該是有效而經(jīng)濟的。當證據(jù)缺失或不足,或者存在爭議的部分,指南應明確指出相應的解決方法(例如采用專家舉證作為補充證據(jù))。根據(jù)討論后形成的共識,應提供清晰、具體且可實施的推薦意見。指南采用專家舉證時應注意區(qū)分專家意見和專家證據(jù),以減少專家意見帶來的偏倚風險[11]。推薦意見應該有非常明確的推薦強度等級和相關的定義,如強推薦或弱推薦。在發(fā)表指南時,應詳細說明專家組成員是通過何種途徑,考慮了哪些因素,最終形成推薦意見的。另外,指南制定后發(fā)表前應該有制定小組以外的專家小組進行審閱。應有指南更新的計劃(說明現(xiàn)在的指南是否是更新版,準備多長時間更新一次)。指南制定小組成員應該說明有無利益沖突,如果有利益沖突是如何管理的,以確保不影響到指南推薦意見的客觀性。國際指南網(wǎng)絡(Guideline Inter-national Network,GIN)對利益沖突的管理有明確的指導原則[12]。最后,指南寫作規(guī)范,條理清晰,推薦意見應該十分明確、詳細,讓人容易理解,不會引起誤解。指南的發(fā)布和傳播方式應充分考慮到各個用戶群體的使用習慣,使其容易獲得和易于在國內推廣。上述是標準指南的制定步驟,當主題為公共衛(wèi)生緊急事件(例如,新型冠狀病毒肺炎),短期內必須有相應的推薦意見指導臨床醫(yī)師和患者應對疾病時制定的是快速指南。另一種是改編指南,如果國際上已有相關的高質量指南時,可考慮對其進行改編和本土化。改編時要關注這個指南在形成推薦意見前證據(jù)體的質量及其具體的研究對本土衛(wèi)生環(huán)境的適用性,必要時可以增補本土的研究證據(jù)形成新的證據(jù)體。在形成改編指南的推薦意見時,必須結合國內的衛(wèi)生醫(yī)療環(huán)境現(xiàn)狀和患者意愿加以考慮,不能照搬國外指南。
綜上所述,指南在規(guī)范診療和醫(yī)療資源的合理使用方面起到重要的指導作用。制定指南是一件重要而嚴肅的事,費時費力,絕對不是經(jīng)過幾個專家討論就能完成的。必須根據(jù)國際標準規(guī)范化地制定具有國際水準而又適合中國國情的指南,提高指南的科學性、可靠性和適用性,以推動中國指南以及相關的臨床證據(jù)在世界范圍的應用。
特約評論員:王吉耀,復旦大學附屬中山醫(yī)院終身榮譽教授,中國臨床實踐指南聯(lián)盟學術委員會主任;夏君,中國臨床實踐指南聯(lián)盟方法學專委會主任。