王錫山
1948年,在英國醫(yī)學(xué)研究委員會的領(lǐng)導(dǎo)下,英國統(tǒng)計(jì)學(xué)家Austin Bradford Hill為觀察鏈霉素對肺結(jié)核的治療效果,開展了第一項(xiàng)大規(guī)模的隨機(jī)對照臨床試驗(yàn)(randomized controlled trial,RCT)[1]。自此,隨機(jī)對照臨床研究逐漸被大家認(rèn)可,并被譽(yù)為臨床證據(jù)中的“金標(biāo)準(zhǔn)”,在循證醫(yī)學(xué)中心制定的證據(jù)等級金字塔中,RCT的證據(jù)等級最高。醫(yī)學(xué)研究者和統(tǒng)計(jì)學(xué)家擬用RCT來減少試驗(yàn)過程中產(chǎn)生的偏倚,從而提高試驗(yàn)結(jié)果的準(zhǔn)確性和可信度,國際上高水平的期刊也對RCT研究更為青睞。然而在RCT發(fā)展的這七十多年間,有不少學(xué)者也發(fā)現(xiàn)了這一“金標(biāo)準(zhǔn)”可能不適用于所有的臨床試驗(yàn),其存在很多局限性。對于RCT,我們要以辯證的角度看待,透過現(xiàn)象分析其本質(zhì),尤其是外科學(xué)領(lǐng)域,這種對患者長期的、高度個(gè)性化的干預(yù)措施,RCT是否完全適用?筆者以自己的思考來拋磚引玉,以期重新審視RCT在外科中的作用。
對照是觀察一項(xiàng)干預(yù)措施是否有效最簡單的方式。目前可追溯的最早的對照研究是1747年,英國的Lind醫(yī)生為探索治療壞血病的方法,將12名壞血病患者平均分為6組,每組患者給予不同的膳食,發(fā)現(xiàn)橙汁和檸檬汁可能會促進(jìn)患者的康復(fù)[2]。這種觀察方法,或稱作試驗(yàn)方法在當(dāng)時(shí)十分先進(jìn),因?yàn)長ind醫(yī)生意識到需要對患者進(jìn)行組間比較,但分組方式現(xiàn)在看來缺少隨機(jī)性,每組的患者人數(shù)也很少,導(dǎo)致疾病的轉(zhuǎn)歸可能與干預(yù)措施之間的關(guān)聯(lián)較小。
早在17世紀(jì),放血療法是一種十分普遍的治療手段,Van Helmont醫(yī)生對這種療法提出質(zhì)疑,并提出一個(gè)大膽的設(shè)想,他建議找?guī)装賯€(gè)發(fā)熱或胸膜炎的患者,用抽簽的方式將患者分為兩組,一組用放血治療,另一組用非放血的治療方法,以觀察放血療法是否有效[3]。雖然最后這項(xiàng)試驗(yàn)沒有最終付諸實(shí)踐,但他提出的以抽簽的方式進(jìn)行分組,可能是最早的“隨機(jī)”思想,而抽簽方式本身,也解決了臨床試驗(yàn)中的“公平”的問題。幾乎沒有患者會去選擇安慰劑,因?yàn)槟鞘且阎牟粫鸬饺魏巫饔玫摹八幬铩?,但若僅由研究者對受試者進(jìn)行分組,那對于研究者來說,對使用安慰劑的患者的關(guān)注可能更少,對于患者來說,他們也會感覺這種方式對自己不公平,從而退出研究,或者特意隱瞞、夸大癥狀。而采用抽簽的方式,在當(dāng)時(shí)看來,患者雖然知道不公平,但往往會認(rèn)為是“命中注定”而接受這種分組?,F(xiàn)在看來,抽簽的方式做到了將各種影響疾病轉(zhuǎn)歸的因素從組間消除。直到20世紀(jì),“抽簽分組可以實(shí)現(xiàn)組間可比性”才被從理論上證明,從而奠定了RCT的核心理論基礎(chǔ)[4]。
1948年,Austin Bradford Hill為觀察鏈霉素對肺結(jié)核的療效納入了107例急性進(jìn)展性雙側(cè)肺結(jié)核新發(fā)病例,根據(jù)隨機(jī)數(shù)表產(chǎn)生隨機(jī)分組序列,并使用密閉的信封,醫(yī)生和患者均無法預(yù)先知道將會被分到哪組[5]。符合入組條件的患者入院后,隨機(jī)分組中心隨機(jī)給患者一個(gè)信封,打開信封后,患者只知道被分到哪組,但并不知道接受的治療是特殊治療還是常規(guī)治療。對照組患者只臥床休息,而觀察組患者在此基礎(chǔ)上,接受鏈霉素治療,這兩組患者不住在同一病房。該項(xiàng)研究無因副作用退出治療的病例。半年后,51%的觀察組患者病情明顯改善,而對照組只有8%,同時(shí),觀察組有7%的患者死亡,而對照組有27%。這項(xiàng)研究使全世界相信鏈霉素對于肺結(jié)核的治療效果。此后,Hill也建立了很多隨機(jī)對照的研究方法。但在當(dāng)時(shí),對于RCT的評價(jià)褒貶不一,反對者認(rèn)為,不給對照組施加新的治療措施,或者使用安慰劑,這種做法是不道德的,支持者則認(rèn)為,RCT可以確定新的治療措施是否優(yōu)于目前的標(biāo)準(zhǔn)治療。
但是當(dāng)時(shí),除了學(xué)術(shù)界和政府,極少有藥企愿意花費(fèi)金錢和時(shí)間來進(jìn)行RCT試驗(yàn)來評價(jià)新藥的療效。他們更愿意依靠臨床醫(yī)生的推薦和病例報(bào)道來推廣藥品,這不但會夸大藥品的療效,也會掩蓋藥品的毒副作用,以至于釀造了沙利度胺的“海豹兒”悲劇[6]。此后,美國國會在1962年頒布了針對食品、藥品及化妝品法案的Kefauver-Harris修正案,強(qiáng)制要求新藥在上市前,需在“充足嚴(yán)格的對照研究”下被證明是有效的[7]。到1970年,美國食品藥品監(jiān)督管理局(FDA)以要求新藥批準(zhǔn)必須經(jīng)過隨機(jī)對照試驗(yàn)來實(shí)現(xiàn)修正案的實(shí)施。二戰(zhàn)后,隨著美國醫(yī)藥行業(yè)的迅速發(fā)展,使得美國成為RCT試驗(yàn)的領(lǐng)導(dǎo)者。歐洲、日本等發(fā)達(dá)國家也陸續(xù)推行了類似的法律法規(guī)。隨著各國間國際合作日益密切,RCT逐步系統(tǒng)化,而醫(yī)藥行業(yè)反而成了推動RCT試驗(yàn)的主要贊助商。至20世紀(jì)80年代,RCT逐漸被奉為對醫(yī)療衛(wèi)生服務(wù)中的某種療法或藥物的效果進(jìn)行評價(jià)的“金標(biāo)準(zhǔn)”。1991年,加拿大McMaster大學(xué)的Gorden教授首次在JAMA上提出“循證醫(yī)學(xué)”一詞,循證醫(yī)學(xué)迅速興起,方法學(xué)等級體系出現(xiàn),RCT被認(rèn)為是“最高級別”證據(jù)[8]。2002年,美國臨床試驗(yàn)數(shù)據(jù)庫(Clinical Trails.gov)正式投入使用,用于全世界藥物試驗(yàn)/新技術(shù)的臨床研究的注冊。
RCT研究在設(shè)計(jì)上十分嚴(yán)謹(jǐn),力求最大程度地避免因?yàn)樵O(shè)計(jì)或試驗(yàn)實(shí)施過程中產(chǎn)生的各種選擇偏倚,從而提高統(tǒng)計(jì)學(xué)檢驗(yàn)的有效性。研究對象的隨機(jī)分配,使得組間的基線可以保持相對的一致,完美地解決了病例對照研究和隊(duì)列研究中的混雜問題,同時(shí)也增加了組間的可比性,所以RCT研究也具有很好的內(nèi)部真實(shí)性。RCT研究可以說是最嚴(yán)謹(jǐn)?shù)囊环N流行病學(xué)研究類型,也是評價(jià)一種干預(yù)效果優(yōu)劣的最嚴(yán)謹(jǐn)?shù)难芯款愋汀?/p>
但RCT不是所有醫(yī)學(xué)領(lǐng)域的“金標(biāo)準(zhǔn)”?;仡橰CT的歷史,幾乎是被藥物貫穿始終,因?yàn)橥环N藥物在上市后,無論是其分子式、劑型、純度、使用方法與劑量等,各批次藥物都具有高度的“一致性”,在這個(gè)背景下,RCT研究的優(yōu)點(diǎn)才得以最大程度的展現(xiàn):包括隨機(jī)(減少干擾因素)、設(shè)置對照(可以觀察新藥療效的優(yōu)劣)和盲法(消除人為因素對結(jié)果的干擾)。但這并不意味著RCT的優(yōu)勢可以“移植”到其他醫(yī)學(xué)領(lǐng)域。例如在精神病學(xué)領(lǐng)域,雖然也開展了大量的精神類藥品的RCT研究,但精神類疾病的治療是一種長期的、高度個(gè)性化的過程,涉及到心理療法和治療藥物的配合使用,而這又與醫(yī)生對疾病進(jìn)展的主觀判斷和醫(yī)生的經(jīng)驗(yàn)密切相關(guān)[9]。但隨著RCT的興起,大量關(guān)于精神類藥品的RCT研究迅速增長,可能導(dǎo)致對于心理療法重視的降低,并且由于患者的高度個(gè)性化,導(dǎo)致結(jié)果可信度不高。
20世紀(jì)70年代,為了對重癥心肺功能衰竭的患者提供長時(shí)間的心肺支持,發(fā)明了體外膜肺氧合(extracorporeal membrane oxygenation,ECMO),從而為患者的康復(fù)爭取了時(shí)間。1971年,ECMO成功救治了一位因多發(fā)性創(chuàng)傷導(dǎo)致呼吸衰竭進(jìn)行性加重的男性;1975年,Bartlett醫(yī)生首次用ECMO救治了一例持續(xù)性肺動脈高壓的新生兒[10]。在ECMO的運(yùn)行和治療機(jī)制已經(jīng)很明確的情況下,就不必再進(jìn)行RCT研究。
而在外科領(lǐng)域,RCT也難以稱為“金標(biāo)準(zhǔn)”。與單純用藥治療不同,外科施加的干預(yù)措施,有一部分是立竿見影、顯而易見的。比如對于頸部外傷伴有咽喉或氣管損傷,立即出現(xiàn)呼吸困難的患者,若不立即行氣管切開術(shù),患者會因窒息而死亡。雖然沒有RCT證據(jù)支持,但這已經(jīng)成為業(yè)內(nèi)共識。
外科一些經(jīng)典術(shù)式的推廣過程,也并非需要RCT證據(jù)支持。以筆者所在領(lǐng)域的全直腸系膜切除術(shù)(totalmesorectalexcision,TME)為例,1982年,Heald教授首次提出了TME手術(shù),并報(bào)道了50例TME手術(shù)病例,隨訪兩年,無一例復(fù)發(fā)。1986年,Heald教授在《Lancet》又報(bào)道了115例行TME手術(shù)的直腸癌患者的5年生存情況[11]。1993年,Heald教授發(fā)表了152例行TME手術(shù)患者的隨訪結(jié)果,局部復(fù)發(fā)率僅為2.6%,遠(yuǎn)低于Miles術(shù)[12]。1995年在挪威奧斯陸舉行的“直腸癌外科——國際標(biāo)準(zhǔn)化”討論會上,與會者一致認(rèn)為TME可產(chǎn)生優(yōu)良的結(jié)果,四個(gè)國家五個(gè)中心外科醫(yī)師運(yùn)用TME原則分別證實(shí)這種“治愈性手術(shù)”后的局部復(fù)發(fā)率為5%左右,總治愈率接近80%[13]。至此,TME受到業(yè)內(nèi)廣泛認(rèn)同,并逐漸成為推行的標(biāo)準(zhǔn)術(shù)式,而這個(gè)過程并未推行大規(guī)模的RCT研究。
自19世紀(jì)至今,隨著人類對人體器官解剖認(rèn)知的不斷深入,以及麻醉、無菌術(shù)和輸血等技術(shù)和理念的提出與完善,使得頭、胸、腹不再是手術(shù)禁區(qū),外科學(xué)也開啟了新的時(shí)代,成為推動醫(yī)學(xué)進(jìn)步的中堅(jiān)力量。
1879年,法國醫(yī)生Jules Emile Pean為一位胃癌患者切除了胃,但患者在5天后不幸死亡;1880年,Ludwig R.von Rydydie教授在總結(jié)了Jules的經(jīng)驗(yàn)教訓(xùn)后,也進(jìn)行了手術(shù)治療胃癌的嘗試,但患者在手術(shù)當(dāng)天便不幸死亡;1881年,被譽(yù)為“腹部外科學(xué)之父”的Theodor Billroth在對狗進(jìn)行了大量的動物實(shí)驗(yàn)后,完成了第一例用胃切除加胃十二指腸吻合術(shù)治療幽門部胃癌,即現(xiàn)在的Billroth I式手術(shù),并獲得了成功[14]。
二戰(zhàn)結(jié)束后,肥胖癥人口劇增,減重手術(shù)逐漸興起,1954年,J.H.Linner和A.J.Kremen醫(yī)生完成了第一例曠置大部分小腸的減重手術(shù),同時(shí)期的Henriksson醫(yī)生也進(jìn)行了空回腸短路手術(shù),并切除了曠置部分的小腸,雖然減重效果較好,但是術(shù)后并發(fā)癥嚴(yán)重;1963年,Payne和DeWind醫(yī)生嘗試將十二指腸與大腸連接,但患者術(shù)后出現(xiàn)了頑固的腹瀉;1966年,“減重手術(shù)之父”——Mason和Ito發(fā)現(xiàn)消化性潰瘍患者在行胃大部切除術(shù)后,可以長期維持低體重狀態(tài),于是發(fā)明了胃旁路術(shù),隨后,在1976年,Griffen在此基礎(chǔ)上對術(shù)式進(jìn)行改良,將胃與小腸直接吻合,有效的減輕了術(shù)后膽汁反流及反流性食管炎的癥狀[15]。
1807年,德國醫(yī)生Bozzini發(fā)明出世界上首個(gè)直腸鏡,1901年,Jacobacus醫(yī)生首次用腹腔鏡對患者進(jìn)行腹腔內(nèi)檢查,但限于當(dāng)時(shí)光源和成像技術(shù),腔鏡只能用于進(jìn)行觀察診斷。1954年,光導(dǎo)纖維技術(shù)誕生,1957年,Hirschowitz首次展示了光導(dǎo)纖維內(nèi)鏡,解決了內(nèi)鏡照明問題。隨著電子顯像技術(shù)的發(fā)展,1983年,Welch Allyn公司在內(nèi)鏡前端裝置了高敏感度微型攝像機(jī),通過光電信號轉(zhuǎn)換,成功地將內(nèi)鏡下觀察到的圖像轉(zhuǎn)變成電視信號。1987年,法國醫(yī)生Mouret完成了首例腹腔鏡下膽囊切除術(shù),1991年2月,荀祖武醫(yī)生完成我國首例腹腔鏡下膽囊切除術(shù)。此后的30多年間,依托于腹腔鏡平臺,微創(chuàng)外科取得了飛速發(fā)展[16]。
縱觀近現(xiàn)代外科手術(shù)發(fā)展的歷史,無論是對于腫瘤的治療的挑戰(zhàn),還是對于肥胖的厭惡,抑或是腹腔鏡技術(shù)對外科的改變,每一種新的外科術(shù)式的產(chǎn)生,都離不開外科醫(yī)生自身對于求知的欲望、人民百姓對于生活質(zhì)量的要求的不斷提升,以及科技的發(fā)展所帶來的行業(yè)概念的革命,這可能是指引外科技術(shù)發(fā)展的三個(gè)根本原因,也是外科新技術(shù)產(chǎn)生的意義。雖然隨機(jī)對照試驗(yàn)可以評價(jià)一項(xiàng)技術(shù)的安全性和有效性,但不應(yīng)該是評價(jià)這項(xiàng)技術(shù)的全部,而且,RCT在外科臨床研究中,仍存在許多爭議。
RCT的核心思想是盡可能的保證觀察組和對照組的一致性,為了達(dá)到這個(gè)目的,研究者花費(fèi)大量心思制定一系列嚴(yán)格的納入和排除標(biāo)準(zhǔn),并應(yīng)用隨機(jī)數(shù)表法等隨機(jī)方法去將患者分組,以期最大程度的影響試驗(yàn)結(jié)果的組間差異。但與藥物RCT研究不同的是,對于外科新技術(shù)的RCT研究,影響最大的因素可能不是患者,而是術(shù)者。實(shí)施該手術(shù)的外科醫(yī)生對于新術(shù)式的掌握程度、學(xué)習(xí)速度如何,這也是外科新技術(shù)在推廣時(shí)常會遇到的問題。另一個(gè)需要關(guān)注的問題是風(fēng)險(xiǎn)。藥物RCT研究,其風(fēng)險(xiǎn)是均一的,而對于進(jìn)行外科新技術(shù)的醫(yī)生來說,新技術(shù)可能會增加手術(shù)風(fēng)險(xiǎn),這可能會導(dǎo)致手術(shù)時(shí)間的延長、對于并發(fā)癥處理不得當(dāng)、術(shù)后過于關(guān)注該患者等,都會影響研究的結(jié)果。
對于外科新技術(shù)而言,術(shù)者往往需要一個(gè)學(xué)習(xí)曲線,處于不同學(xué)習(xí)階段的術(shù)者的能力不同,可能對結(jié)果的影響更大。荷蘭的一項(xiàng)研究,對4個(gè)taTME手術(shù)量超過45例的中心,通過階段分隔的方法粗略估算各階段的局部復(fù)發(fā)率,結(jié)果發(fā)現(xiàn),前10例taTME手術(shù)患者的局部復(fù)發(fā)率為15%(6/40),第11至40例taTME手術(shù)患者的局部復(fù)發(fā)率為4.2%(5/120),第41例之后,這一數(shù)據(jù)降為3.8%(4/106)。研究者得出結(jié)論:實(shí)施taTME手術(shù)后的局部復(fù)發(fā)率,可能隨著手術(shù)經(jīng)驗(yàn)的增多、渡過學(xué)習(xí)曲線而降低,經(jīng)過結(jié)構(gòu)化培訓(xùn)taTME手術(shù),腫瘤學(xué)安全性得到明顯改善[17]。由此可見,術(shù)者的技術(shù)會對腫瘤學(xué)結(jié)局產(chǎn)生影響。
RCT在外科新技術(shù)中的另一個(gè)困境是RCT與外科技術(shù)快速發(fā)展之間的矛盾。在腫瘤外科中,任何情況下,腫瘤手術(shù)的近期和遠(yuǎn)期安全性和有效性必須置于首位,患者生命永遠(yuǎn)第一,所以復(fù)發(fā)率和生存率是一定要統(tǒng)計(jì)的,也需要進(jìn)行RCT研究,但這個(gè)過程可能會耗時(shí)數(shù)年,甚至十幾年。當(dāng)我們用足夠的時(shí)間,積累了足夠的數(shù)據(jù),試圖去評價(jià)新技術(shù)時(shí),發(fā)現(xiàn)技術(shù)或治療方法已經(jīng)發(fā)生了改變,在新技術(shù)還未來得及惠及患者時(shí),已經(jīng)過時(shí)了,這也再次證明,評價(jià)一項(xiàng)外科新技術(shù)時(shí),RCT不應(yīng)該成為其評價(jià)的主體,甚至是全部。
當(dāng)然,外科領(lǐng)域并不是要完全排斥RCT,更不是要否定循證醫(yī)學(xué),只是不宜盲目的為了證據(jù)“高級”而進(jìn)行RCT。在利用RCT對外科新技術(shù)進(jìn)行評價(jià)之前,需要構(gòu)建完善的培訓(xùn)體系,將欲進(jìn)行RCT研究的術(shù)者的技術(shù)同質(zhì)化。關(guān)于結(jié)構(gòu)化培訓(xùn)的重要性,Heald教授認(rèn)為,手術(shù)醫(yī)師必須具備足夠的手術(shù)經(jīng)驗(yàn),且必須經(jīng)過相關(guān)專家的指導(dǎo)培訓(xùn)。Wexner教授也認(rèn)為,過快的在未受過培訓(xùn)的、低手術(shù)量的醫(yī)師中開展外科新技術(shù)的研究,其所帶來的手術(shù)并發(fā)癥和不良的腫瘤學(xué)結(jié)局,可能會掩蓋該術(shù)式的優(yōu)點(diǎn),影響該技術(shù)的推廣與發(fā)展。
筆者認(rèn)為,一個(gè)完善的培訓(xùn)體系的建立,應(yīng)該從以下幾方面著手:(1)在國家層面,以國家衛(wèi)生健康委員會和中國醫(yī)師協(xié)會為主體,建立健全的外科新技術(shù)培訓(xùn)體系,協(xié)會制定技術(shù)規(guī)范與考核標(biāo)準(zhǔn),并設(shè)置區(qū)域培訓(xùn)定點(diǎn)單位,以點(diǎn)帶面,推動新技術(shù)在該區(qū)域的發(fā)展;(2)各專委會系統(tǒng)性優(yōu)化培訓(xùn)體系,以各領(lǐng)域?qū)<覟橹黧w,借助各種培訓(xùn)平臺,充分利用前沿科技,針對不同水平等級的醫(yī)生開展針對性的培訓(xùn)與指導(dǎo),重點(diǎn)針對新技術(shù)關(guān)鍵操作步驟設(shè)置個(gè)性化培訓(xùn)課程和考核項(xiàng)目;(3)對擬開展新技術(shù)的醫(yī)院,提供仿真操作模型、進(jìn)行動物實(shí)驗(yàn)等,并做好擬開展新技術(shù)的科室和醫(yī)生的備案;(4)對擬開展新技術(shù)的科室,以科室學(xué)科帶頭人為主體,對開展新技術(shù)的醫(yī)生的手術(shù)進(jìn)行指導(dǎo)和質(zhì)量控制;(5)與此同時(shí),醫(yī)生還要加強(qiáng)自身學(xué)習(xí),熟悉手術(shù)部位的解剖知識,加強(qiáng)基本操作的練習(xí),特別要注意技術(shù)細(xì)節(jié),并敢于提出自己的想法與見解,共同完善新技術(shù)。
經(jīng)過系統(tǒng)化培訓(xùn)的醫(yī)生,可以縮短學(xué)習(xí)曲線,但在開展新技術(shù)相關(guān)RCT研究前,還應(yīng)對手術(shù)資質(zhì)進(jìn)行評價(jià),筆者認(rèn)為,可以從以下三個(gè)方面進(jìn)行考察:(1)研究者對新技術(shù)涉及的器官、部位的解剖知識的掌握;(2)手術(shù)應(yīng)進(jìn)行全程錄像,并由相關(guān)領(lǐng)域?qū)<覍πg(shù)中操作、和標(biāo)本質(zhì)量進(jìn)行評價(jià);(3)應(yīng)開展一定數(shù)量的手術(shù),渡過學(xué)習(xí)曲線的上升期。至此,在外科技術(shù)相關(guān)的RCT研究中,方可將最大的“變量”同質(zhì)化,開展的RCT研究結(jié)果也更為可靠。
RCT推動了醫(yī)學(xué)的發(fā)展,為規(guī)范藥品準(zhǔn)入做出了巨大的貢獻(xiàn),但也不宜將其奉為圭臬,對于其他醫(yī)學(xué)領(lǐng)域,RCT是否還是“金標(biāo)準(zhǔn)”,RCT是否存在局限性,外科新技術(shù)是否需要RCT來證明,以及如何證明,也同樣值得我們思考。