徐桂興,李 涓,銀子涵,李雨谿,付亞男,周 俊,梁繁榮
(成都中醫(yī)藥大學(xué),成都 610075)
抑郁癥是由多種原因?qū)е碌木窦膊。R床表現(xiàn)為持續(xù)心情抑郁、思維遲鈍、興趣減退、意志活動(dòng)減少,并伴有焦慮不安、食欲減退、性功能減退、睡眠障礙等癥狀[1]。隨著社會(huì)競爭越來越激烈,抑郁癥的發(fā)病率逐年增高,在年滿20歲的成年人中,抑郁癥患者正以每年11.3%的速率增加[2], 抑郁癥已被認(rèn)為是導(dǎo)致全球疾病負(fù)擔(dān)的十大病種之一。世界衛(wèi)生組織(WHO)估計(jì),到2020年抑郁癥或?qū)⒊蔀槿虻诙蠹膊∝?fù)擔(dān)源[3]。目前抑郁癥的治療多采用西藥, 雖然這些藥物能夠緩解患者的抑郁情緒,但會(huì)帶來不同程度的不良反應(yīng),影響患者心血管、消化、內(nèi)分泌等系統(tǒng)的穩(wěn)態(tài)[4]。新近發(fā)布的1項(xiàng)Meta分析結(jié)果顯示[4-5],與安慰劑比較大部分抗抑郁藥物在改善患者精神狀態(tài)方面并沒有優(yōu)勢。
目前已發(fā)表的針刺治療原發(fā)性抑郁癥的系統(tǒng)評(píng)價(jià),研究結(jié)果存在較大差異[15,17,19-20]。外國學(xué)者E. Ernst等[6]在2011年采用OQAQ量表對針刺治療抑郁癥系統(tǒng)評(píng)價(jià)進(jìn)行了再評(píng)價(jià),但主要針對系統(tǒng)評(píng)價(jià)中容易產(chǎn)生偏倚的方面,未對方法學(xué)質(zhì)量和證據(jù)質(zhì)量進(jìn)行評(píng)價(jià)。因此,本研究采用AMSTAR工具、PRISMA工具和GRADE系統(tǒng)全面評(píng)價(jià)針刺治療原發(fā)性抑郁癥系統(tǒng)評(píng)價(jià)的方法學(xué)質(zhì)量、報(bào)告質(zhì)量以及證據(jù)質(zhì)量。
計(jì)算機(jī)檢索Web of science、Embase、Pubmed、Cochrane library、CNKI、CBM、萬方和維普數(shù)據(jù)庫,檢索日期截止2018年12月5日。中文檢索詞為針灸、針刺、電針、溫針、頭皮針、耳針、穴位、抑郁癥、郁證、抑郁、系統(tǒng)評(píng)價(jià)、系統(tǒng)綜述、Meta分析、薈萃分析,英文檢索詞為acupuncture, electropuncture, auricular acupuncture, warm acupuncture, scalp acupuncture、systematic evaluation, systematic assessment, systematic review, meta-analysis, tristimania, depression。
1.2.1 研究設(shè)計(jì) 針灸治療原發(fā)性抑郁癥的系統(tǒng)評(píng)價(jià)和Meta 分析,發(fā)表語言限制中文、英文。
1.2.2 研究對象 原發(fā)性抑郁癥患者,年齡、種族、性別等不限。
1.2.3 干預(yù)措施 試驗(yàn)組: 針刺、電針、耳針、溫針、頭皮針等或聯(lián)合使用; 對照組: 西藥、安慰劑、假針刺。
1.2.4 結(jié)局指標(biāo) 漢密爾頓量表(HAMD)、總有效率、抑郁自評(píng)量表(SDS)、不良反應(yīng)等。
重復(fù)發(fā)表的文獻(xiàn); 質(zhì)量評(píng)價(jià)或方法學(xué)研究文獻(xiàn); 系統(tǒng)評(píng)價(jià)計(jì)劃書。
首先按照檢索策略檢索相關(guān)文獻(xiàn)并導(dǎo)出題錄(標(biāo)題、摘要等),根據(jù)題錄篩除明顯不符合納入要求的文獻(xiàn),對可能符合的文獻(xiàn)進(jìn)行下載全文閱讀,以確定其是否符合。采用Excel2016建立表格,對符合要求的文獻(xiàn)按照作者、標(biāo)題、發(fā)表年份、文獻(xiàn)數(shù)量、病例數(shù)量、干預(yù)措施、結(jié)局指標(biāo)、AMSTAR工具條目、PRISMA工具和GRADE系統(tǒng)升降級(jí)因素等內(nèi)容進(jìn)行資料提取。文獻(xiàn)的檢索、篩選及資料提取均由2名研究員獨(dú)立進(jìn)行(徐桂興、銀子涵)交叉核對,意見不一致時(shí)咨詢專家(梁繁榮教授)。
1.5.1 AMSTAR工具使用方法 根據(jù)AMSTAR工具的11個(gè)條目對針刺治療原發(fā)性抑郁癥系統(tǒng)評(píng)價(jià)的方法學(xué)質(zhì)量進(jìn)行評(píng)價(jià),每個(gè)條目均用“是”“否”“部分”和“不充分”進(jìn)行描述,“是”得2分,“否”得0分, “部分”和“不充分”得1分,最后計(jì)算每個(gè)系統(tǒng)評(píng)價(jià)的AMSTAR總得分,17~22分為高質(zhì)量研究,9~16分為中等質(zhì)量研究,0~8分為低質(zhì)量研究。
1.5.2 PRISMA工具使用方法 采用PRISMA工具[7]評(píng)價(jià)納入研究的報(bào)告質(zhì)量,使用“是”“否”以及“不知道”進(jìn)行數(shù)據(jù)提取,然后采用統(tǒng)計(jì)學(xué)分析對納入系統(tǒng)評(píng)價(jià)的PRISMA數(shù)據(jù)進(jìn)行計(jì)量整合并制成圖表。
1.5.3 GRADE系統(tǒng)使用方法 應(yīng)用GRADE系統(tǒng)對上述所得結(jié)局指標(biāo)從研究的局限性、不一致性、不直接性、不精確性、發(fā)表偏倚5個(gè)方面進(jìn)行證據(jù)質(zhì)量評(píng)級(jí)。對于RCT研究,高級(jí)證據(jù)表明非常確信真實(shí)的效應(yīng)值接近效應(yīng)估計(jì)值;中級(jí)證據(jù)表明,對效應(yīng)值計(jì)有中等程度的信心,真實(shí)值有可能接近效應(yīng)值,但仍存在二者大不相同的可能;低級(jí)證據(jù)表明,對效應(yīng)值計(jì)算的確信程度有限,真實(shí)值有可能與估計(jì)值大不相同;極低級(jí)證據(jù)表明,對效應(yīng)值的計(jì)算幾乎沒有信心,真實(shí)值可能與估算值大不相同[8-10]。
圖1示,初檢文獻(xiàn)中文394篇,英文136 篇,排除重復(fù)文獻(xiàn)204篇,非原發(fā)性抑郁癥226篇,非系統(tǒng)評(píng)價(jià)58篇,系統(tǒng)評(píng)價(jià)再評(píng)價(jià)3篇,非針刺作為主要治療手段21篇。最后納入18篇針灸治療原發(fā)性抑郁癥系統(tǒng)評(píng)價(jià)論文,其中15篇期刊論文,2篇學(xué)位論文和1篇會(huì)議論文。
圖1 針灸治療原發(fā)性抑郁癥文獻(xiàn)檢索流程圖
表1示,所納入的18篇文獻(xiàn)中,12篇中文文獻(xiàn)[11-21],6篇英文文獻(xiàn)[4,22-26]。其中會(huì)議論文1篇,博士學(xué)位論文1篇,碩士學(xué)位論文1篇,期刊論文15篇,發(fā)表時(shí)間為2005年至2017年,其中以2017年最多4篇,治療組干預(yù)措施為針刺、電針、手針、耳針、激光針、頭針或其配合西藥,對照組多用西藥、安慰劑、假針刺、安慰針等。大部分研究認(rèn)為針刺與西藥療效相當(dāng),但存在較大異質(zhì)性影響結(jié)果的可信度。
表1 納入18篇針刺治療原發(fā)性抑郁癥系統(tǒng)評(píng)價(jià)的文獻(xiàn)基本特征
表2示,采用AMSTAR量表對納入的系統(tǒng)評(píng)價(jià)進(jìn)行方法學(xué)質(zhì)量評(píng)價(jià)。結(jié)果顯示, 68.4%的系統(tǒng)評(píng)價(jià)為中等質(zhì)量,21%的系統(tǒng)評(píng)價(jià)為高質(zhì)量,僅10.6%的系統(tǒng)評(píng)價(jià)為低質(zhì)量研究[16,20,27],高質(zhì)量研究中2個(gè)17分[19,23],2個(gè)18分[12,20],中等質(zhì)量研究得分在11~16分之間。
表2 納入 18篇針刺治療原發(fā)性抑郁癥系統(tǒng)評(píng)價(jià)的AMSTAR評(píng)分結(jié)果
PRISMA聲明評(píng)價(jià)對納入的18個(gè)系統(tǒng)評(píng)價(jià)按照PRISMA聲明中的27 條目進(jìn)行分析,結(jié)果顯示 所有研究均報(bào)道了研究題目、前期方案、理論基礎(chǔ)、目的、納入標(biāo)準(zhǔn)、信息來源、概括效應(yīng)結(jié)局指標(biāo)、結(jié)果綜合方法、單個(gè)研究結(jié)果、局限性以及研究的主要結(jié)論,但沒有一個(gè)研究報(bào)道其研究方案的注冊;2個(gè)研究報(bào)道了明確的檢索方法,16個(gè)研究只報(bào)道了檢索詞而沒有具體的檢索式,研究篩選的具體過程也只有10個(gè)研究有報(bào)道,僅有3篇研究報(bào)道了資料提取的條目,對于研究的偏倚也只有9篇文章進(jìn)行了描述,12篇文章未進(jìn)行其他分析(如敏感性分析等),大部分(17篇)研究都有明確的結(jié)論,設(shè)計(jì)研究內(nèi)部風(fēng)險(xiǎn)的研究有11篇,研究自身存在偏倚的僅有10篇,說明資金支持的有9篇。所有研究中,10個(gè)研究報(bào)道符合PRISMA聲明27條中的20條以上,其中1個(gè)研究未報(bào)道注冊號(hào),但其他都按照PRISMA聲明進(jìn)行了報(bào)告,屬于高質(zhì)量的文獻(xiàn)研究。各研究具體PRISMA報(bào)告質(zhì)量分析見圖2。
2.5.1 HAMD 13個(gè)系統(tǒng)評(píng)價(jià)關(guān)注了HAMD評(píng)分,其中2項(xiàng)研究為中等質(zhì)量證據(jù)。在張迪2017[17]的研究中認(rèn)為,針刺(MD=3.33,95%CI(-4.578,-2.0990),P<0.01)或針刺+藥物(MD=5.697,95%CI(-7.961,-3.433),P<0.01)均優(yōu)于單純使用藥物的療效,但針刺對比安慰劑(MD=1.379,95%CI(-0.646,3.403),P>0.01)或假針刺(MD=0.804, 95%CI(-0.605, 1.004),P>0.01)療效差異無統(tǒng)計(jì)學(xué)意義。在Zhang,Z 2010[14]的研究結(jié)果認(rèn)為,針刺對比抗抑郁藥或假針刺時(shí)差異無統(tǒng)計(jì)學(xué)意義(WMD=0.31,95%CI(-0.94,-1.56),P=0.63)。按對照組不同分亞組進(jìn)行分析發(fā)現(xiàn),針刺對比藥物差異有統(tǒng)計(jì)學(xué)意義(WMD=0.23, 95%CI(-1.40,-0.94),P=0.70),針刺對比假針刺差異無統(tǒng)計(jì)學(xué)意義(WMD=2.39, 95%CI(-2.78,7.56),P=0.36)。針刺作為附加療法時(shí),針刺+藥物對比藥物差異有統(tǒng)計(jì)學(xué)意義(WMD=2.38, 95%CI(0.62,4.12),P=0.007)。
2.5.2 總有效率 11個(gè)系統(tǒng)評(píng)價(jià)關(guān)注了有效率,其中3項(xiàng)研究的證據(jù)質(zhì)量為中級(jí)。在Zhang,Z 2010[14]的研究中認(rèn)為,單獨(dú)針刺治療時(shí)與對照組比較差異有統(tǒng)計(jì)學(xué)意義(RR=1.09, 95%CI(0.92,1.30),P=0.31)。根據(jù)對照組不同分亞組藥物(RR=1.06, 95%CI(0.97,1.17),P=0.20)、假針刺(RR=1.30,95%CI(0.26,6.37),P=0.70)、等待治療(RR=1.27, 95%CI(0.58,2.80),P=0.55)時(shí)也沒差異有統(tǒng)計(jì)學(xué)意義,但相關(guān)研究較少,異質(zhì)性很大,其中針刺對比等待治療僅1項(xiàng)研究,對比假針刺也只有2項(xiàng)研究且其異質(zhì)性為94%。在黎波2013[20]的研究中認(rèn)為,毫針或電針加藥物對比藥物在有效率上均差異有統(tǒng)計(jì)學(xué)意義(RR=0.61, 95%CI(0.42,0.90),P=0.01)。單獨(dú)毫針刺或電針對比藥物在有效率上差異無統(tǒng)計(jì)學(xué)意義(RR=0.80, 95%CI(0.57,1.12),P=0.19)。在熊俊2009[22]的研究中,1個(gè)研究認(rèn)為針刺比較黛力新差異無統(tǒng)計(jì)學(xué)意義(RR=1.01,95%CI(0.82,1.23));6個(gè)研究認(rèn)為針刺比較氯西汀差異有統(tǒng)計(jì)學(xué)意義(RR=1.06,95%CI(0.82,1.37))。
高質(zhì)量的證據(jù)一直是循證醫(yī)學(xué)得以實(shí)現(xiàn)的基礎(chǔ),系統(tǒng)評(píng)價(jià)作為對原始研究的證據(jù)整合,一直被認(rèn)為具有高質(zhì)量和可信度。但由于原始研究的質(zhì)量和系統(tǒng)評(píng)價(jià)者對循證的理解差異,導(dǎo)致目前系統(tǒng)評(píng)價(jià)質(zhì)量存在差異,極大地影響了臨床醫(yī)生的決策。系統(tǒng)評(píng)價(jià)再評(píng)價(jià)是根據(jù)一定的標(biāo)準(zhǔn)對已有某疾病治療、診斷等系統(tǒng)評(píng)價(jià)的又一次綜合評(píng)定方法[28]。因再評(píng)價(jià)納入的本就是已具有較高質(zhì)量的數(shù)據(jù)整合證據(jù),從而再評(píng)價(jià)得出的結(jié)論具有更好的臨床指導(dǎo)。
研究共納入18篇針刺治療原發(fā)性抑郁癥的系統(tǒng)評(píng)價(jià),發(fā)現(xiàn)近年來針刺治療抑郁癥的研究熱度不斷上升。采用AMSTAR工具對納入的系統(tǒng)評(píng)價(jià)進(jìn)行評(píng)價(jià),發(fā)現(xiàn)大部分系統(tǒng)評(píng)價(jià)方法學(xué)質(zhì)量為中高等,但均未提供前期注冊方案;所有研究都進(jìn)行了廣泛的檢索,但只有15.8%的系統(tǒng)評(píng)價(jià)考慮了灰色文獻(xiàn),可能引起研究結(jié)果的偏倚;15.8%的系統(tǒng)評(píng)價(jià)提供了納入排除所有文獻(xiàn)的清單,若讀者無法了解其研究納入排除文獻(xiàn)是否恰當(dāng),也會(huì)影響研究結(jié)果的適用性; 52.6%的研究未說明研究是否涉及利益沖突。未提供注冊信息的原因可能是未進(jìn)行研究前的注冊,使得研究者在進(jìn)行研究的過程中隨意更改主要目的或者方法,從而導(dǎo)致研究存在偏倚,希望今后進(jìn)行系統(tǒng)評(píng)價(jià)的研究者能夠提前對所要進(jìn)行的研究進(jìn)行注冊。未詳細(xì)報(bào)道研究進(jìn)行過程的系統(tǒng)評(píng)價(jià),其重復(fù)性差,可信度低,影響臨床推廣使用。因此在進(jìn)行研究結(jié)果報(bào)道時(shí),應(yīng)詳細(xì)記錄研究的進(jìn)行過程。文獻(xiàn)檢索是系統(tǒng)評(píng)價(jià)的基石,本研究發(fā)現(xiàn)部分系統(tǒng)評(píng)價(jià)在檢索方面存在一定問題,如檢索不全、檢索數(shù)據(jù)庫不夠、未考慮灰色文獻(xiàn)等。針對檢索問題,研究者需明確所檢索數(shù)據(jù)庫的異同,檢索前設(shè)計(jì)好檢索式并多方求證檢索是否存在缺陷,最大可能地減少誤差。排除文獻(xiàn)清單的羅列,對研究結(jié)果的影響不大,但其可能影響讀者對研究結(jié)果的信任程度,未羅列的原因可能是排除文獻(xiàn)較多,對此選擇性的羅列可能存在爭議的排除文獻(xiàn)是不錯(cuò)的選擇。最后就是部分研究在進(jìn)行Meta分析時(shí)未科學(xué)的處理異質(zhì)性,在異質(zhì)性很大的情況下仍使用固定效應(yīng)模型,導(dǎo)致研究結(jié)果的假陽性率增加,同時(shí)大部分研究未探索異質(zhì)性的來源,影響了研究結(jié)果的臨床使用。異質(zhì)性時(shí)系統(tǒng)評(píng)價(jià)是常見情況,對于異質(zhì)性的來源沒有很好的解釋,導(dǎo)致結(jié)果缺乏科學(xué)性和可行性。因此,在進(jìn)行系統(tǒng)評(píng)價(jià)時(shí)一旦出現(xiàn)異質(zhì)性,一定要盡可能地尋找異質(zhì)性的來源,才能對臨床和科研工作者有更多的指導(dǎo)意義。
表3 納入18篇針刺治療原發(fā)性抑郁癥系統(tǒng)評(píng)價(jià)的GRADE質(zhì)量分級(jí)比較
圖2 研究總數(shù)與PRISMA條目數(shù)關(guān)系圖
PRISMA聲明是國際比較認(rèn)可的規(guī)范系統(tǒng)評(píng)價(jià)寫作工具。研究結(jié)果表明,PRISMA聲明在系統(tǒng)評(píng)價(jià)報(bào)告中的使用率低,特別是在研究注冊,對于資料提取條目也只有3個(gè)研究有說明,其原因可能是研究者提取資料較多,認(rèn)為沒有提供的必要性。所有系統(tǒng)評(píng)價(jià)都進(jìn)行了Meta分析,但是對納入文獻(xiàn)的敏感性或者其他方面的分析只有7個(gè)系統(tǒng)評(píng)價(jià)。在偏倚方面,研究存在內(nèi)部風(fēng)險(xiǎn)的有11篇,存在偏倚的有10篇,偏倚的來源主要存在于文獻(xiàn)檢索、篩選、數(shù)據(jù)提取以及在解讀結(jié)果時(shí)僅強(qiáng)調(diào)有統(tǒng)計(jì)學(xué)意義的結(jié)果。在資金支持上,也只有9個(gè)研究有明確說明資金的來源或者研究的相關(guān)利益沖突。從圖2中可以看出,研究的報(bào)告質(zhì)量并沒有越來越高,從一定程度上反映系統(tǒng)評(píng)價(jià)制作在報(bào)告方面并不規(guī)范。
GRADE方法對系統(tǒng)評(píng)價(jià)的結(jié)局指標(biāo)進(jìn)行證據(jù)分級(jí)顯示,針刺治療原發(fā)性抑郁癥的療效是確切的,對于重度抑郁癥,針刺作為輔助療法可提高臨床療效。17.1%的結(jié)局指標(biāo)為中等可信度,其中有效率最多,其降級(jí)原因是存在一定的局限性。15.1%的結(jié)局指標(biāo)為低等,73.6%的結(jié)局指標(biāo)為極低,其降級(jí)原因主要集中在局限性、不一致性和不精確性,同時(shí)針刺治療抑郁癥療效評(píng)判標(biāo)準(zhǔn)不一,也影響了針刺療效更客觀的判斷。采用R軟件“cor”()函數(shù)檢測AMSTAR評(píng)分與GRADE評(píng)級(jí)(最高級(jí)賦值9,降一級(jí)減1)的相關(guān)性,發(fā)現(xiàn)其有一定相關(guān)性,可能的原因是均有評(píng)價(jià)局限性。導(dǎo)致GRADE評(píng)價(jià)降級(jí)的主要因素集中于局限性、不一致性、不精確性以及發(fā)表偏倚。對于局限性,其主要影響因素是系統(tǒng)評(píng)價(jià)納入原始研究質(zhì)量不高,不一致性則表現(xiàn)在研究間的異質(zhì)性較大。筆者在進(jìn)行該研究時(shí),發(fā)現(xiàn)很多研究得出的結(jié)論是完全相反的,也說明在針刺治療原發(fā)性抑郁癥的研究中就其療效存在爭議,其原因可能與針刺操作手法以及腧穴配伍有著很大程度的關(guān)系。因此筆者建議今后在進(jìn)行該類研究時(shí),詳細(xì)描述針刺干預(yù)的方法。不精確性主要體現(xiàn)在樣本量上,很多研究在95%可信區(qū)間未表現(xiàn)出不精確性,但樣本量達(dá)不到臨床試驗(yàn)估算的要求,對于這一問題的解決,筆者建議無論進(jìn)行什么樣的臨床研究,樣本量的估算都是必要過程。對于發(fā)表偏倚其原因較多,常見的原因有選擇性報(bào)告結(jié)局,在這個(gè)問題上,科研人員應(yīng)尊重實(shí)際科研結(jié)果,對于研究結(jié)果的報(bào)告應(yīng)當(dāng)完全遵循其前期的研究設(shè)計(jì)。
綜上,針對輕型抑郁癥單純針刺有效,針對較嚴(yán)重的抑郁癥需要與藥物配合使用。在研究質(zhì)量方面,近年的系統(tǒng)評(píng)價(jià)屬中高水平,但報(bào)告質(zhì)量仍存在不同程度的問題,且大部分系統(tǒng)評(píng)價(jià)未進(jìn)行證據(jù)質(zhì)量評(píng)級(jí)。因此,筆者建議在進(jìn)行系統(tǒng)評(píng)價(jià)前應(yīng)當(dāng)有一個(gè)很好的計(jì)劃,并在相關(guān)網(wǎng)站注冊;其次,對研究結(jié)果均應(yīng)進(jìn)行證據(jù)評(píng)級(jí),以增加臨床的適用性;在進(jìn)行研究結(jié)果的報(bào)道時(shí),應(yīng)盡可能遵循PRISMA工具;最后,科研工作者在不斷完善試驗(yàn)設(shè)計(jì)的同時(shí),應(yīng)將中醫(yī)臨床辨證、針灸診療的特色與現(xiàn)代臨床隨機(jī)對照試驗(yàn)相結(jié)合,以產(chǎn)生更多具有中醫(yī)特色的高質(zhì)量、科學(xué)、精確的臨床證據(jù)。