張海娜,李婧,杜娟
癡呆是以認(rèn)知障礙為核心,伴有精神行為癥狀,導(dǎo)致日常生活能力下降的一組疾?。?]。癡呆作為一種慢性神經(jīng)退行性疾病,具有高患病率、高致殘率、高醫(yī)療花費的特點,已經(jīng)成為世界范圍內(nèi)的一個主要公共衛(wèi)生問題[1-2]。隨著國家政策的引導(dǎo)及全科醫(yī)生對癡呆認(rèn)識的不斷提高,癡呆管理會逐漸下沉到基層醫(yī)療衛(wèi)生機構(gòu)。從早期篩查、評估、初步診斷到患者確診后的健康宣教、定期隨訪,全科醫(yī)生將會發(fā)揮重要的作用[2]。臨床實踐指南是全科醫(yī)生進(jìn)行癡呆社區(qū)管理的臨床決策工具,科學(xué)制定的臨床指南對提高醫(yī)療服務(wù)質(zhì)量、科學(xué)配置醫(yī)療資源和保障患者權(quán)益等起到了至關(guān)重要的作用。對于基層醫(yī)務(wù)人員來說,確定哪些指南是高質(zhì)量的,哪些建議在各指南中是一致的,以及最終如何將指南最佳地整合到臨床實踐中是一個挑戰(zhàn)[3]。為此,本研究采用指南研究和評估工具Ⅱ(The Appraisal of Guidelines for Research& Evaluation Instrument Ⅱ,AGREE Ⅱ)[4-5]對包含癡呆社區(qū)管理內(nèi)容的指南和共識進(jìn)行評價,以期為基層醫(yī)務(wù)人員在癡呆管理工作中合理選用指南提供參考。
1.1 檢索策略 2019年9月至2020年1月,以“癡呆”“阿爾茨海默病”“社區(qū)管理”“臨床實踐指南”“共識”“基層醫(yī)療”“dementia”“Alzheimer disease”“community management”“clinical practice guideline”“consensus”“primary care”為主題詞或關(guān)鍵詞,從PubMed、Medline、Elsevier、中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺、維普網(wǎng)等中英文數(shù)據(jù)庫及google.scholar.com網(wǎng)站,以及美國國家指南交換中心(National Guideline Clearinghouse,NGC)、蘇格蘭校際指南網(wǎng)站(Scottish Intercollegiate Guidelines Network,SIGN)、新西蘭臨床實踐指南網(wǎng)站(New Zealand Guidelines Group National,NZGG)、加拿大臨床實踐指南網(wǎng)站(CMA INFOBASE)及英國國家臨床示范研究所(National Institute Health and Care Excellence,NICE)網(wǎng)站等進(jìn)行檢索,查找2008—2020年發(fā)表的有關(guān)癡呆管理的循證臨床實踐指南、癡呆照護共識等文獻(xiàn)。以萬方數(shù)據(jù)知識服務(wù)平臺和Medline為例展示檢索策略,萬方數(shù)據(jù)知識服務(wù)平臺檢索表達(dá)式為(中英文擴展):(主題:(癡呆 or 阿爾茨海默?。?and 主題:(指南 or 共識)and 全部:(基層醫(yī)療 or 社區(qū)管理)) and 時間跨度:2008—2020;Medline檢 索 表 達(dá) 式 為:TS=(dementia* OR Alzhiemer disease) AND TS=(guideline* OR consensus)AND TS=(primary care* OR community management),Date:2008—2020。
1.2 指南納入和排除標(biāo)準(zhǔn) 指南納入標(biāo)準(zhǔn):(1)2008—2020年出版的指南或共識意見,如有更新版則納入最后更新版本;(2)推薦意見明確;(3)含癡呆管理相關(guān)建議。排除標(biāo)準(zhǔn):(1)非中、英文文獻(xiàn);(2)直接翻譯的或重復(fù)發(fā)表的國外指南;(3)非完整版指南(如指南的摘要或解讀)。
1.3 指南篩選和質(zhì)量評價 由兩名研究者(基層醫(yī)療衛(wèi)生機構(gòu)全科主治醫(yī)師)根據(jù)指南納入和排除標(biāo)準(zhǔn)對指南進(jìn)行篩選,意見不一致時通過商討解決,商討結(jié)果存在異議時由第三人解決。兩名研究者分別獨立使用AGREE Ⅱ?qū)Ω髦改线M(jìn)行評分,意見不一致時通過商討解決。兩名參評員均為研究生學(xué)歷,有較好的英語基礎(chǔ),在評分前對AGREE Ⅱ使用手冊進(jìn)行充分學(xué)習(xí)和解讀。兩位參評員均有多年臨床經(jīng)驗,能夠保證評價的專業(yè)性。
AGREE Ⅱ由6個領(lǐng)域(指南范圍與目的、參與人員、嚴(yán)謹(jǐn)性、清晰性、應(yīng)用性、獨立性)共23個條目和2個總體評估條目組成,每個條目的評分為1~7分,1分表示指南完全不符合該條目,2~6分表示指南不完全符合該條目,7分表示指南完全符合該條目,得分越高說明該條目符合程度越高[4-5]。AGREE Ⅱ具體評分程序:(1)由兩名參評員分別對各指南評分。(2)將兩名參評員對每本指南評分進(jìn)行綜合,通過公式計算各領(lǐng)域標(biāo)準(zhǔn)化百分比得分。領(lǐng)域標(biāo)準(zhǔn)化百分比得分=〔(該領(lǐng)域?qū)嶋H得分-該領(lǐng)域最小可能得分)/(該領(lǐng)域最大可能得分-最小可能得分)〕×100%。領(lǐng)域標(biāo)準(zhǔn)化百分比得分越高,說明指南在該領(lǐng)域的方法學(xué)質(zhì)量越高。(3)根據(jù)指南各領(lǐng)域標(biāo)準(zhǔn)化百分比得分將指南的推薦級別分為3級。指南6個領(lǐng)域得分均≥60%為A級,可不更改直接推薦;得分≥30%的領(lǐng)域數(shù)≥3個但有<60%的領(lǐng)域為B級,需要不同程度修改完善后推薦;得分<30%的領(lǐng)域數(shù)≥3個為C級,由于指南制定方法較差或證據(jù)質(zhì)量差暫時不推薦[6]。(4)在完成了23個條目評價之后,參評員還要分別完成指南的2個總體評估條目,各領(lǐng)域得分情況用于從方法學(xué)上確定指南推薦級別,但總體質(zhì)量評分用于最終確定指南是否納入??傮w評估需要評價者考慮每個領(lǐng)域評估標(biāo)準(zhǔn),對指南的質(zhì)量做出一個準(zhǔn)確的綜合判斷,并要求回答“是否推薦使用該指南”??傮w質(zhì)量評分取兩位參評員的評分均值,以(±s)表示,總體質(zhì)量評分≥5分的指南為中高質(zhì)量指南,可以納入,4分≤總體質(zhì)量評分<5分的指南,需要重新評估以確定納入情況,總體質(zhì)量評分≤3分的為質(zhì)量低劣指南,排除[3-5]。通過Kappa檢驗評價者間一致性,Kappa>0.40代表一致性較好,表明評分結(jié)果達(dá)到較高的重測信度[7]。
1.4 數(shù)據(jù)提取及分析 兩名參評員獨立完成數(shù)據(jù)提取,提取信息包括基本信息(指南名稱、國家、制定機構(gòu)、制定年份及參考文獻(xiàn)數(shù)量)及根據(jù)AGREE Ⅱ 23個評估條目提取出來的相對應(yīng)的信息,然后根據(jù)提取結(jié)果的完整性和科學(xué)性對各條目進(jìn)行評分。
2.1 文獻(xiàn)檢索結(jié)果 通過對PubMed、Medline、萬方數(shù)據(jù)知識服務(wù)平臺等中、英文數(shù)據(jù)庫進(jìn)行檢索,共檢出930篇文獻(xiàn),以google.Scholar.com網(wǎng)站檢索到前30頁條目及各指南網(wǎng)站檢索到的343篇為檢索結(jié)果,經(jīng)過閱讀題目和摘要的初篩及按照納入和排除標(biāo)準(zhǔn)閱讀全文后的再次篩選,最終納入來自12個國家的共45篇指南[1,8-51]( 圖 1), 其 中 有 8 篇 指 南[8-9,11,14,17,21,35,41]內(nèi)容全部是關(guān)于癡呆社區(qū)管理的,其余37篇指南[1,10,12-13,15-16,18-20,22-34,36-40,42-51]中除了有部分內(nèi)容涉及癡呆社區(qū)管理,還有關(guān)于癡呆在??频脑\療內(nèi)容。
圖1 文獻(xiàn)篩選流程圖Figure 1 Flow chart of literature screening
2.2 納入指南的一般特征 本研究共納入了45篇癡呆管理相關(guān)指南,其中美國10篇、加拿大5篇、澳大利亞4篇、英國9篇、歐洲5篇、日本3篇、中國內(nèi)地3篇,荷蘭、韓國、新加坡、馬來西亞、印度、中國香港特別行政區(qū)各1篇。指南中介紹的癡呆社區(qū)管理內(nèi)容主要包括癡呆的識別、篩查、診斷、評估及藥物和非藥物干預(yù)措施。納入指南的名稱、制定機構(gòu)、制定年份及參考文獻(xiàn)數(shù)量等特征見表1。
表1 納入的癡呆管理相關(guān)指南的一般特征Table 1 General features of included guidelines about the management of people with dementia
(續(xù)表1)
2.3 各指南不同領(lǐng)域及總體質(zhì)量評分結(jié)果 45篇指南在指南范圍與目的、參與人員、嚴(yán)謹(jǐn)性、清晰性、應(yīng)用性、獨立性6個領(lǐng)域平均得分分別為(77.20±8.96)%、(46.30±21.16)%、(39.19±20.80)%、(71.70±17.30)%、(26.30±17.35)%、(40.60±33.73)%,其中A級指南1篇,B級指南27篇,C級指南17篇(表2)。經(jīng)過全面評價后,A級和B級指南中,15篇指南總體質(zhì)量評分≥5分,9篇指南總體質(zhì)量評分為4~<5分,經(jīng)重新評估后入選;4篇指南總體質(zhì)量評分<4分,剔除。最終評選出 24 篇[1,8,10-14,17-23,28,30,32-34,36,42,46-47,49]中、高質(zhì)量指南,指南范圍與目的、參與人員、嚴(yán)謹(jǐn)性、清晰性、應(yīng)用性、獨立性6個領(lǐng)域平均得分分別為(80.20%±7.90)%、(54.50±16.98)%、(48.90±16.03)%、(77.90±7.99)%、(33.20±17.34)%和(53.30±35.63)%。對兩位評分者所評的分?jǐn)?shù)進(jìn)行一致性檢驗,45篇指南的Kappa值評分均值為(0.73±0.16)分,篩選出的24篇中高質(zhì)量指南的Kappa值評分均值為(0.70±0.20)分,總體評分信度較好(P<0.001)。
表2 各癡呆管理指南在AGREE Ⅱ各領(lǐng)域標(biāo)準(zhǔn)化得分及評分一致性情況Table 2 Values of standardized percentage and inter-rater agreement for guidelines about the management of people with dementia based on AGREE Ⅱ
2.3.1 范圍和目的 本領(lǐng)域平均得分為(77.20±8.96)%,評選出的24篇中高質(zhì)量指南平均得分為(80.20±7.9)%,是得分最高的領(lǐng)域。45篇指南中24篇得分>80%,只有2篇指南[7-8]本領(lǐng)域得分低于60%。本領(lǐng)域涉及指南的總目的、所涵蓋的衛(wèi)生問題及指南所要應(yīng)用的人群3個條目,是指南必不可少的組成部分,所納入的指南均有較具體的描述。
2.3.2 參與人員 本領(lǐng)域平均得分為(46.30±21.16)%,評選出的24篇中高質(zhì)量指南平均得分(54.50±16.98)%,45 篇指南中僅有 7 篇[1,12,14,19,25,30,34]得分 >70%。本領(lǐng)域包括指南制定組所有相關(guān)專業(yè)的人員、考慮到目標(biāo)人群觀點及指南適用者3個條目,僅有13 篇 指 南[8,11-12,14,19-20,22,24,25,27-28,34,37]對這些條目有較為全面的闡述。35篇指南[1,8,10-15,18-25,27-30,32-35,37-38,40-42,45,47-51]提及指南制定組所有成員,10 篇指南[9,16-17,26,31,36,39,43-44,46]未能包括小組全部成員;關(guān)于收集目標(biāo)人群觀點這個條目,有 20 篇指南[8,10-12,14,17-20,22-28,34,37-38,48]有所提及,其中 4篇指南[10,23,25,28]表述較明確,其他 16篇指南[8,11-12,14,17-20,22,24,26-27,34,37-38,48]表 述 不 全面,沒有介紹具體的實施方法和結(jié)果;33篇指南[1,8-12,14-22,24-38,41-42,45]對指南適用者有明確說明。
2.3.3 嚴(yán)謹(jǐn)性 本領(lǐng)域平均得分為(39.19±20.8)%,評選出的24篇中高質(zhì)量指南平均得分為(48.90±16.03)%,為得分第二低的領(lǐng)域,嚴(yán)謹(jǐn)性為條目最多的領(lǐng)域,包括檢索證據(jù)、選擇證據(jù)的標(biāo)準(zhǔn)、描述證據(jù)群的方法、形成推薦意見的方法、形成推薦意見時考慮了對健康的受益和風(fēng)險、證據(jù)建議之間的聯(lián)系、發(fā)表前經(jīng)過外部評審及指南更新過程8個條目,該領(lǐng)域也是指南制定的核心環(huán)節(jié)。7 篇指南[8,16,20,27,29,32-33]各條目的表述較明確,方法學(xué)質(zhì)量較高,20篇指南[1,9,14-15,18-19,21-22,25,27-28,30,34,37,41-42,44-45,47-48]對各條目均有表述,但不全面,部分條目只是簡單介紹,缺乏具體內(nèi)容。本領(lǐng)域中得分最低的條目是外部評審方面,僅有 9 篇指南[11-13,17,19-20,27,40,48]進(jìn)行了外部評審,這一點上國外指南相對于中國更重視一些。
2.3.4 清晰性 本領(lǐng)域平均得分為(71.70±17.30)%,評選出的24篇中高質(zhì)量指南平均得分為(77.90±7.99)%,為得分第二高的領(lǐng)域。清晰性領(lǐng)域要求指南應(yīng)具體精確地描述推薦建議是在什么情況下、針對何種人群的,目標(biāo)為一種疾病管理的指南將考慮臨床篩查、預(yù)防、診斷或治療存在各種不同的選擇,在指南中應(yīng)該明確提到這些可能的選擇。包括推薦意見明確、針對不同問題提供相應(yīng)的選擇、主要推薦意見清晰易辨3個條目,45篇指南中18 篇[1,8,14-16,18-20,23,27-29,32-33,37,42,48,51]得分 >80%,均做到表述明確清晰,重要的推薦意見通過使用不同字體或顏色以突出顯示,使讀者易于辨識。7篇指南[10,13,15,24,31,35,49]本領(lǐng)域得分低于 60%,對各條目也都有表述,但在針對不同問題提供相應(yīng)的選擇方面有所欠缺。
2.3.5 應(yīng)用性 本領(lǐng)域平均得分為(26.30±17.35)%,評選出的24篇中高質(zhì)量指南平均得分為(33.20±17.34)%,為得分最低的領(lǐng)域。應(yīng)用性領(lǐng)域主要包括指南在應(yīng)用過程中的促進(jìn)和阻礙因素、提供應(yīng)用于實踐的建議和配套工具、資源投入、監(jiān)控和審計標(biāo)準(zhǔn)4個條目。納入的指南中,在應(yīng)用過程中的資源投入、促進(jìn)和阻礙因素和審計標(biāo)準(zhǔn)方面很少提及,提供配套使用工具方面,各指南均有提及。美國、英國、澳大利亞及加拿大、韓國的部分指南提供的使用工具比較完整,國內(nèi)指南雖有提及,但無具體表述。
2.3.6 獨立性 本領(lǐng) 域平均得分為(40.60±33.73)%,評選出的24篇中高質(zhì)量指南平均得分為(53.30±35.63)%,45篇指南中有8篇指南[9,14,21-22,28-29,36,45]的 得 分 >80%。 獨 立 性領(lǐng)域主要包括贊助單位的觀點是否影響指南內(nèi)容及小組成員之間是否存在利益沖突。17篇指南[1,8-10,12,15,18,22,24-25,36,38-39,40,43-44,49]未提及本領(lǐng)域內(nèi)容,其他指南均有提及,入選的24篇指南均明確了是否存在利益沖突,8 篇指南[1,8,10,12,18,22,33,36,49]對于是否使用外部贊助表述不完整。
2.3.7 指南綜合評價結(jié)果 全面評價包括指南總體質(zhì)量評分和評價者回答是否推薦使用該指南,45篇指南總體質(zhì)量評分平均為(4.90±1.01)分,評選出的24篇中、高質(zhì)量指南總體質(zhì)量評分平均為(4.90±0.64)分,推薦使用或修訂后使用,其中包括中 國 3 篇[1,30,32]、 美 國 5 篇[11,17,22,28,36]、 英國 4 篇[21,42,10,23]、 加 拿 大 2 篇[12,46]、 澳 大 利 亞3 篇[8,14,34]、歐洲 3 篇[13,47,49],新加坡、韓國、馬來西亞、日本各 1 篇[18-20,33]。
3.1 各指南制定方法學(xué)上有待進(jìn)一步加強 納入的45篇指南的質(zhì)量參差不齊,在范圍和目的、清晰性2個領(lǐng)域的平均得分>70%,但是參與人員、嚴(yán)謹(jǐn)性、應(yīng)用性和獨立性4個領(lǐng)域得分較差,仍需改進(jìn),指南的制定方法學(xué)有待進(jìn)一步完善。尤其是在應(yīng)用性領(lǐng)域,在癡呆的篩查及管理過程中,需要用到多個量表及其他配套工具,沒有這些使用工具,癡呆的社區(qū)篩查及定期評估工作很難進(jìn)行。在獨立性領(lǐng)域,部分指南制定小組對“披露小組成員的利益關(guān)系”和“聲明贊助單位的觀點不影響結(jié)果”沒有給予足夠的重視。評選出的24部中高質(zhì)量指南,各領(lǐng)域得分及總體質(zhì)量評分均較總體平均情況提高,在指南制定方法學(xué)上更為嚴(yán)謹(jǐn)。
3.2 我國亟須一部癡呆社區(qū)管理指南 2016年世界阿爾茨海默病報告指出:當(dāng)前癡呆診療的??漆t(yī)生模式(由老年病學(xué)專家、神經(jīng)病學(xué)家和精神病學(xué)家提供的癡呆診治服務(wù))不太可能擴大到能夠為越來越多的癡呆患者提供足夠的覆蓋[52]。癡呆的管理將從??漆t(yī)生模式向?qū)??基層共同管理模式轉(zhuǎn)變。
隨著全科醫(yī)生對癡呆認(rèn)識的提高,癡呆管理工作將逐漸在社區(qū)開展,癡呆的管理會像高血壓、糖尿病等慢性病一樣,有成熟的社區(qū)管理模式,才能保證癡呆得到持續(xù)、有效管理。臨床實踐指南的應(yīng)用已逐漸成為一些國家日常臨床質(zhì)量管理工作的重要組成部分。依靠高質(zhì)量的癡呆管理指南,特別是循證指南,指導(dǎo)、幫助基層醫(yī)務(wù)人員從事預(yù)防、篩查、診斷、治療和管理工作是國際上近年來規(guī)范服務(wù)、加強服務(wù)質(zhì)量管理、控制醫(yī)療費用的行之有效的做法。
我國尚未制訂基層醫(yī)療衛(wèi)生機構(gòu)癡呆管理指南,建議相關(guān)部門采用AGREE Ⅱ指南評價工具作為考量,結(jié)合我國基層醫(yī)療衛(wèi)生機構(gòu)衛(wèi)生資源,采用循證評價的方法,制訂出符合我國臨床實踐的高質(zhì)量癡呆社區(qū)管理指南,為我國基層醫(yī)療衛(wèi)生機構(gòu)癡呆管理提供最佳證據(jù)。
3.3 本研究的局限性 本研究納入的指南只包括中、英文指南,而不包括其他語種指南,可能會導(dǎo)致一些癡呆管理做得比較好的國家(如日本)的本土指南未能入選;另外,大部分指南發(fā)布在各國特定的網(wǎng)站上,在查找指南過程中,可能會因為未考慮到某些網(wǎng)站而遺漏部分癡呆管理指南,導(dǎo)致所納入指南不全面。
由于AGREE Ⅱ評價工具更側(cè)重于指南制定方法學(xué)的嚴(yán)謹(jǐn)性,僅在總體質(zhì)量評分時考慮了指南包含內(nèi)容,可能會導(dǎo)致指南內(nèi)容很實用但制定方法學(xué)較差而未能入選,但本研究篩選出的24篇中高質(zhì)量指南涉及美洲、歐洲、亞洲的多個國家,指南內(nèi)容有很多重疊,仍足夠為我國基層醫(yī)療衛(wèi)生機構(gòu)進(jìn)行癡呆管理提供參考。
志謝:感謝首都醫(yī)科大學(xué)圖書館程艾軍在文獻(xiàn)檢索策略方面予以指導(dǎo),感謝首都醫(yī)科大學(xué)在讀博士王美榮對英文摘要進(jìn)行修訂。
作者貢獻(xiàn):張海娜、杜娟負(fù)責(zé)文章整體構(gòu)思及可行性分析;張海娜、李婧應(yīng)用AGREE Ⅱ?qū)θ脒x指南或共識進(jìn)行評分;張海娜負(fù)責(zé)數(shù)據(jù)分析及撰寫論文;杜娟負(fù)責(zé)論文的修訂、質(zhì)量控制及審校。
本文無利益沖突。