孫榮國,賈曉蓉
(1.四川大學華西臨床醫(yī)學院/華西醫(yī)院,四川 成都 610041;2.成都市食品藥品檢驗研究院,四川 成都 610045)
醫(yī)學循證的思想自古有之。縱觀整個人類醫(yī)學發(fā)展史,就是一部不斷發(fā)現問題、分析問題和解決問題,并不斷積累與運用科學證據進行醫(yī)學實踐的歷史。原始醫(yī)學研究或文獻綜合研究各具有特點,也均存在著偏倚,直接影響到各自醫(yī)學研究的證據力。本文擬從認識論、方法論和實踐論的角度,較深入地討論醫(yī)學研究證據認識的誤區(qū),并提出相應的觀點與建議,以便更好地認識與正確地選用醫(yī)學研究證據。
醫(yī)學研究證據是能夠充分、客觀、正確地反映研究對象的特征、本質、內在與外在關系及其影響因素的事實根據,包括數據、文字、圖像和音像等。
任何決策或抉擇均離不開證據或依據,醫(yī)學決策或抉擇也不例外,而醫(yī)學決策或抉擇往往不僅需要單一研究的證據,也需要長期積累起來的研究與實踐“大數據”的支撐,故高質量的重復研究與實踐是必要的,也是證據累計與驗證的過程。一項高質量研究的結果及其結論應在不同時空得到檢驗,以便確定其結果及其結論的可靠性、準確性和適用性。任何研究證據均不能代替臨床診療抉擇或臨床管理決策,而是作為相應抉擇和決策的依據。
從醫(yī)學研究上,可分為原始研究與文獻綜合研究兩大類。原始研究,是直接面向研究對象(如受試者)的第一手研究數據并形成的原始研究報告等,成為原始研究文獻(原始文獻)。原始研究可以分為前瞻性研究和回顧性研究,也可以歸納為干預性研究和非干預性研究,具體類型包括隨機對照研究、社區(qū)干預研究、病例對照研究、隊列研究、橫斷面研究和專家征詢意見等。與原始研究不同,文獻綜合研究是運用一定的研究方法,對原始研究文獻進行綜合,并形成相應的文獻綜合研究報告,包括定量文獻綜合研究與定性文獻綜合研究兩大類,其主要目的在于通過綜合諸多獨立原始研究文獻,增加樣本量及其檢驗效能等,力圖獲得一個可靠、準確的綜合性結論,以便與原始研究文獻一道為深入研究或/和臨床實踐提供證據。
無論是原始研究證據或是文獻綜合研究證據均是醫(yī)學證據學的重要組成部分,且原始研究證據是后續(xù)文獻綜合研究證據的“源頭活水”,其可靠性與準確性直接影響文獻綜合研究的質量。因此,在納入設計良好、實施到位和分析方法應用妥當的原始研究文獻并進行科學的研究的基礎上,才能在很大程度上保證文獻綜合研究結論的可靠性與準確性。
隨機分配則旨在平衡不同比較組間的研究對象例數,盡量避免選擇和混雜偏倚[1],從而使各組間具有可比性。隨機分配的組間均衡性包括組間總例數的均衡性和組間相關研究影響因素分布的均衡性。在醫(yī)學研究中,隨機化是控制或避免混雜偏倚和選擇偏倚的重要方法,是獲得高質量研究結果的重要保障[1,2]。隨機化分配的有效性不但取決于隨機分配的均衡性、分配方案的隱匿性,以及組間例數和研究影響因素的分布差異等,而受試者和研究者對處理的正確預測會造成選擇偏倚和信息偏倚[3]。另外,研究存在的失訪、沾染與干擾等因素也可能影響兩組的均衡性。
與醫(yī)學動物實驗相比較,臨床研究受試者的個體差異較大,能夠影響受試者及其研究效應的因素較多。研究影響因素越多,則需要的樣本量越大。當樣本量較小時,難以通過簡單化隨機分配來平衡組間的研究影響因素。Blair等[4]指出,在研究例數較少且對研究結果有影響的因素較為復雜時,完全隨機幾乎不能獲得均衡的試驗組。甚至有作者指出[5],當樣本量大于1000時,簡單隨機化才能達到較好的平衡。關于分層隨機分組,當因子水平組合數量接近樣本量的一半時,將失去平衡組間研究影響因素的效用[6]。與簡單隨機化和分組隨機化相比,雖然動態(tài)隨機化,如最小化法具有一定的平衡優(yōu)勢,但是也存在不足,如非真正隨機化過程及其選擇偏差、組織復雜性增加可能帶來招募影響與成本升高,以及與統(tǒng)計推斷檢驗是基于隨機分配受試者進入試驗組和對照組的假設不符合[6,7]。Rovers等[8]指出,在最小化法中,每個子類別的預期患者人數應始終大于5人,以防止出現空單元格。嚴格來說,動態(tài)隨機化已違背了隨機化的原理,并不是真正的隨機化過程,其統(tǒng)計分析方法比建立在以隨機事件分布為基礎的傳統(tǒng)統(tǒng)計檢驗要復雜得多,這也成為限制動態(tài)隨機分組方法廣泛應用的一個重要因素[9]。
任何隨機化方法有賴于正確實施,如果不正確地執(zhí)行,隨機化可能會導致分組產生偏差,導致實驗無效和低效[10]。臨床研究的限制性隨機化設計與其他實驗領域不同,由于患者(受試者)是順序到達與納入,故不能保證平衡設計[11];當多個因素基線不可比時,有理由對隨機化的過程提出質疑,尤其是當作者沒有明確報告是否采用了真正隨機的方法和/或分配隱藏的方法的時候,組間基線可比性是衡量隨機化是否真正實現的一個替代指標[12]。因此,當存在諸多研究影響因素時,進行組間均衡性評價具有一定必要性,即不能輕易認為,只要采用了隨機分配方法,就一定能夠使組間的研究影響因素具有較好的均衡性,從而完全地放棄多因素分析方法。
應該明確指出的是,隨機對照研究雖然可以平衡組間研究影響因素,但是卻失去了對診療效果具有作用的諸多影響因素的研究機會。
統(tǒng)計分析方法無“高低”和“貴賤”之分,均存在一定的不足和局限性。對于方法學的應用只有妥當不妥當、適宜不適宜,其標準是能否最大限度地分析并真實地反映研究對象及其數據背后的規(guī)律、特征和內在的聯系等。任何統(tǒng)計分析方法均是建立在一定適用、假設、前提的條件和適宜場域的基礎之上,舍此,任何方法的分析結果及其結論都將可能發(fā)生偏差或錯誤。無論是原始臨床研究或是文獻綜合研究均存在諸多“統(tǒng)計結論效度”影響因素,尤其是后者的影響因素可能會更多。有作者[13]認為,薈萃分析(Meta分析)的設計和實施都可能增加發(fā)表偏倚的概率,將嚴重扭曲估計值和可能向陽性結果的方向偏倚,現有各種試圖評估和糾正偏倚的方法均存在局限性,并提醒人們注意:薈萃分析總是給人一種準確的假象,而這種準確性可能并不總能得到保證。
設計良好、實施到位和分析妥當的原始研究結果及其結論可以獨立作為醫(yī)學證據而存在,而文獻綜合研究證據是建立在可靠和準確的原始研究結果及其結論的基礎之上的,其本身方法學也存在諸多不足或缺陷。當原始研究或文獻綜合研究存在方案設計缺陷和研究實施質量控制較差及其系統(tǒng)誤差的問題時,不應奢望依靠任何統(tǒng)計學分析加以彌補或矯正。特別當原始文獻分析結果及其結論出現較大偏差或謬誤時,將更遑論文獻綜合研究結果及其結論的可靠性和準確性了。
研究質量控制應貫穿于研究方案設計及其實施的全過程,不是依靠統(tǒng)計分析方法就可以解決的問題。其中,研究者的因素尤為重要,表現為研究方案的科學性、專業(yè)性(臨床與統(tǒng)計)和倫理性設計,以及嚴格按照確定的研究方案進行全面、有效的實施,且后者是非常難以采用統(tǒng)計學評估的關鍵質量影響因素之一。任何統(tǒng)計學分析方法無法控制或難以消除試驗設計的不科學、不專業(yè)、不倫理,或實施不到位所帶來的諸多影響或偏差。
文獻綜合研究不應簡單地強調合并原始研究效應值、增加樣本量,而忽略了每一項納入文獻綜合研究的原始文獻的獨立納排標準差異性、樣本量及其檢驗效能等諸多影響因素。文獻綜合研究若脫離了原始、真實的研究數據及其分析結果的可靠性與準確性,任何文獻綜合分析方法都將無法獲得真實、可靠的分析結果及其結論,也就難以具備文獻綜合應具有的臨床參考價值與指導意義。眾所周知,原始文獻的完整評價是一件十分困難的事情,需要更加充分、詳實的原始研究記錄及其報告,僅僅依靠原始文獻研究中有“隨機分配”等字樣和文獻綜合研究采用“隨機效應模型”或“薈萃分析”等方法,尚不足以認定其證據力就一定就高。
任何醫(yī)學研究,包括原始研究和文獻綜合研究均存在兩類(初步)分析結論,一是統(tǒng)計學結論,即按照檢驗統(tǒng)計量及其檢驗水準得出的概率性結論。例如,P值小于檢驗水準,則統(tǒng)計學結論為差異具有統(tǒng)計學意義;二是臨床專業(yè)性結論,即按照臨床專業(yè)的理論與實踐,判斷實際(差)值是否具有專業(yè)性意義或專業(yè)性價值。因此,在醫(yī)學研究中,有的“陽性結果”可能僅僅是具有統(tǒng)計學意義但并沒有相應的臨床意義的結果。研究的臨床意義與價值是每一項臨床醫(yī)學研究的出發(fā)點與歸宿,故應該重視臨床專業(yè)分析結論的意義與價值。
近些年,雖然人們大力提倡并遂行報告可信區(qū)間,使讀者了解到更多的信息,如總體參數的95%或99%可信區(qū)間(估計范圍與精度)等,并借助于已知的、具有臨床意義(差)值,協助判斷具有統(tǒng)計學意義的分析結果是否也同時具有臨床價值,而具有臨床意義(差)值歸根結底是由臨床專家慎重決定??傊?,不能滿足于任何統(tǒng)計學分析結論,包括文獻綜合研究中常常采用的固定效應模型或隨機效應模型的分析結論,簡單地用統(tǒng)計學結論代替臨床專業(yè)下結論。
統(tǒng)計學效應值具有統(tǒng)計學意義的判斷容易受到樣本含量大小的影響:在大樣本的條件下,小差值的統(tǒng)計學效應值也可能具有統(tǒng)計學意義。反之,在小樣本的情況下,較大的差值的統(tǒng)計學效應值也可能不具有統(tǒng)計學意義。對于研究的樣本量來講,不管是大樣本或是小樣本,關鍵是具有符合統(tǒng)計學要求的樣本,以確保較高的檢驗效能。另外,研究影響因素的有效控制也可能是處理因素效應值大小及其統(tǒng)計學分析結論的重要影響因素。
在文獻綜合研究中,原始研究間可能存在三類既獨立又關聯的異質性,包括臨床異質性,如實驗對象(納排除標準、對照組設置)、處理因素(干預措施)以及實驗效應(暴露與結局的定義、測量指標及工具等);方法學異質性,如研究設計、隨機、盲法、分配隱藏和隨訪時長等;統(tǒng)計學異質性,包括原始研究效應值等,如OR效應值。原始研究間效應值的異質性可能會受到諸多因素的影響,如不同研究團隊素質與能力、納排標準、對照組、檢測指標與方法、處理因素標準化、質量管控和混雜因素控制、實施力度等,故僅靠發(fā)表或交流文獻中所報告內容,難以全面進行原始研究效應值真實性與可靠性的評估。另外,借助于隨機效應模型對若干原始研究進行文獻綜合研究,不完全相同于隨機效應模型在多中心研究(同一研究方案,受試者來自同一總體)中的應用,而是可能存在較大的臨床異質性。文獻綜合雖然可以增加研究樣本量,但是并不一定能夠獲得可靠、準確的研究結果,因為被綜合的每一項原始研究除隨機誤差外,尚可能存在系統(tǒng)誤差、過失誤差等,而這些誤差的判斷必須有賴于相應的研究證據(記錄),才能進行有效的評估。關于異質性的臨床意義與價值的判斷,需要臨床專業(yè)的共識與指南,需要訓練有素的研究團隊,包括相應研究的臨床專業(yè)、統(tǒng)計學專業(yè)人員等參與資料的原始文獻質量細致評估,其可能會較大地影響原始研究效應值的大小等。對統(tǒng)計學方法的選擇,應考慮研究目的、設計類型、樣本含量、變量類型、變量數量和數據質量(如準確性等),以及對諸多影響研究因素的控制等。因此,對統(tǒng)計學分析本身的質量控制和質量保證也是獲取可靠性與準確性研究結果及其結論的重要環(huán)節(jié)之一。
無論采用何種文獻研究方法,如薈萃分析等都屬于觀察性研究。例如,包括薈萃分析在內的文獻綜合研究結果均受到若干偏倚的影響,包括發(fā)表偏倚、納入標準偏倚、篩選者偏倚、研究質量評分偏倚和報告偏倚等,尤其是發(fā)表(刊出)偏倚[14-16]。同時,在檢索到的文獻中,由于有不少文獻存在變量定義不一致或統(tǒng)計分析失誤,造成部分研究結果無法利用而不得不舍棄,可能會對研究結果產生一定的影響[17]。發(fā)表對有負面或非結論性結果的研究存在偏見,其中臨床試驗結果顯示出顯著性差異被接受的可能性是非顯著性差異結果的三倍,而且很有可能比那些沒有顯著發(fā)現的論文發(fā)表得更快[18]。文獻綜合研究若無明確的原始文獻納排標準,很容易導致納入標準偏倚;若有明確的原始文獻納排標準,在篩選文獻時往往會受到篩選者主觀意愿的影響,特別是當文獻納人標準的可操作性和特異性不強時,很容易產生篩選者偏倚[17]。另外,如所選文獻的研究對象不同,將不同的年齡、性別、疾病的嚴重程度,或不同的治療劑量和療程的原始研究直接合并,就會造成誤解[14]。有作者認為[19,20],從根本上說,薈萃分析的結論取決于單個獨立研究的質量和數量;從論證強度來說,文獻綜合研究的論證強度不如多中心大樣本的隨機對照試驗,因為找到所有的研究十分困難,異質性和發(fā)表偏倚等均無法避免。因此,文獻綜合研究需要設計良好、實施充分、到位的獨立或多中心、大樣本研究加以印證。應該慎重看待文獻綜合研究結果及其結論,不可盲目或輕易地將其視為所謂“最高等級的證據”。
盡管文獻綜合研究已具有相應規(guī)范,如應用CONSORT可提高RCT報告質量[21]。但是,CONSORT也存在與時俱進、不斷完善的空間,如其如何更好地對原始研究質量及其異質性進行全面、準確的評估等,特別是原始研究的方案實施過程是難以事后準確評估及控制。加之,研究者對于文獻綜合研究規(guī)范的掌握與應用程度參差不齊,導致文獻綜合研究質量良莠不齊,尚有較大的完善空間[22-25]。文獻綜合分析永遠無法替代原始研究,僅能作為同類原始研究的一個補充,應該更加客觀地評價文獻研究應有的地位與作用。
證據的局限性或相對性源于研究對象的復雜性與變異性、研究設計及研究方法與手段的有限性或局限性,以及人們認識人、事、物的過程性與不斷深化性等,需要時間與實踐的檢驗。
無論是原始研究,或是文獻綜合研究,均屬于醫(yī)學研究及其醫(yī)學證據的組成部分,都應該遵循相應的研究設計原則與基本要求并落實到位,盡量避免或控制諸多誤差,以便獲得可靠與準確的數據及分析結論。不恰當、不充分、不可靠與不準確的“研究之研究”并不能提升研究結論的可靠性與準確性,甚至還會產生不正確的結論和誤導讀者。原始研究數據的真實性與可比性是文獻綜合研究可靠性與準確性的基本保證。
研究設計類型與方法的多樣性,反映了醫(yī)學研究對象的紛繁復雜性,不同的研究目的,客觀上要求采取不同研究設計方法,從研究對象的不同側面和不同研究階段進行深入分析與廣泛研究。任何研究設計方法都有一定的局限,均具有一定適用的條件或場域;任何研究設計方法均不可能獨力支撐醫(yī)學證據的大廈,泛泛而談或任意夸大任何研究設計的效用及其證據力,只會毀掉這種研究設計。因此,我們認為,無論是動物實驗、人體研究,或是動物實驗或/和人體研究的文獻綜合研究,只要能充分、真實反映研究對象的特征、本質、規(guī)律、內外在聯系及其影響因素等,就具備了良好的證據力,不應簡單按照研究設計類型與方法,判斷其證據力的高低。證據等級的高低是相對的,在有限研究和諸多關鍵影響因素難以分析或控制等情況下,特別是文獻綜合研究結果及其結論影響因素,可能與所綜合的原始文獻的偏倚相互疊加,從而帶來較大的不確定和/或偏差。隨著醫(yī)學研究深入和研究數據資料的累計,所謂“陽性”或“陰性”的研究資料可能會發(fā)生此消彼長的情況,人們對研究對象的認識也不斷深化,現有的醫(yī)學證據的認知有可能被修正、充實或顛覆。關鍵是,不但要重視證據的可靠性,更要重視證據的準確性,因為不正確或不恰當的研究設計及其實施,可以導致錯誤的結果及其結論一而再再而三的重復出現,這種所謂的“可靠性”是我們應該努力避免的。脫離了準確性的可靠性,只會為臨床醫(yī)療抉擇或決策提供錯誤的依據,而脫離了可靠性的準確性,會使人們難以判斷研究結果可信性。只有可靠性與準確性并舉,方能為臨床醫(yī)療抉擇或決策提供真實、可信、有效的證據,為患者帶來更加精準的診療方案,最大限度地減少不良反應,增加有效性,并獲得更好的臨床轉歸。
研究質量控制應貫穿于研究方案設計及其實施的全過程。其中,研究者的因素尤為重要,表現為研究方案的科學性、專業(yè)性(臨床與統(tǒng)計)倫理的設計和嚴格按照確定的研究方案進行全面、有效的實施,后者是非常難于評估的關鍵質量影響因素之一。
根據不同目的的研究,選擇適宜的研究設計,關鍵是具體的研究設計能否達到研究目的,并且為相應的臨床診療抉擇或決策提供可靠與準確的參考證據,而不是簡單地依據研究設計類型,或“隨機”“盲法”和“薈萃分析”等,統(tǒng)一進行研究證據等級劃分,更何況原始研究與文獻綜合研究是兩類不同性質的研究,后者研究完全是建立在前者研究的基礎之上的。不同研究設計的內、外部效度各異,僅僅追求內部效度,不足以為臨床推廣應用提供全面和完整的證據,也會降低其作為臨床實踐指導的相對性證據力。有人認為,隨機臨床試驗的療效研究結論并不能真正反映臨床療效。另外,僅從外部效度考慮,非隨機對照研究結果及其結論對于臨床實踐可能具有更大的指導意義,因為其可以提供診療影響因素及其程度的信息,以便臨床實踐者實施個體化、精準化的臨床診療技術與服務。我們提倡圍繞臨床實踐,選擇不同的研究設計,取長補短,從不同角度,全面、完整地提供臨床實踐所需的有力證據,而不是簡單以證據“金子塔”的形式,較為片面、截然分出證據高下,而完全忽略臨床實踐問題的復雜性、證據的多樣性及其證據力的差異性??梢姡淮嬖谒^最佳的證據,只有更好的證據和更恰當的證據(滿足研究目的),即使有所謂“最佳的證據”也只是暫時的,因為隨著臨床研究的全面與深入,人們對研究對象的認識會不斷加深,更加接近研究事物的本質,這是一個不斷遞進、螺旋上升的長期過程。任何一項原始研究均不是臨床實踐的唯一證據,不同研究證據應該是相互補充與印證,共同為臨床實踐服務。
將不同研究目的、不同設計類型、不同分析方法,甚至不同類別文獻簡單、統(tǒng)一地進行所謂醫(yī)學證據等級劃分,如所謂證據“金字塔”的做法值得進一步深入的反思。醫(yī)學研究包括了臨床前研究(如動物實驗)與臨床研究(人體研究),而前者是后者的基礎。所謂從醫(yī)學動物實驗到人體觀察研究、干預性研究的“醫(yī)學證據金字塔”[26],反映的是醫(yī)學研究的基本路徑或不同研究階段,不同研究目的、研究設計等不同,均可以為相應的研究階段及其研究目的提供真實、可靠的研究數據及其研究證據,并無所謂“高低”之分。因此,與其采用混合、固化式的“金字塔”醫(yī)學證據等級概念,對不同類原始研究及其文獻綜合研究統(tǒng)一劃分等級,不如按照研究目的、研究設計等,引入醫(yī)學研究證據力的概念,分別進行研究證據力的評判,不必再糾纏于“金字塔”醫(yī)學證據等級劃分,應更好地認識觀察性研究和專家意見的證據力。例如,為了掌握我國人口相關數據,每隔若干年的全國人口普查的數據,其證據力強是源于其數據的真實性,可以為制定我國人口、教育和就業(yè)等政策提供強有力的依據和前提;為了掌握某疾病的“三間”(人間、時間和空間)分布,設計科學(專業(yè)、統(tǒng)計)和倫理并且實施到位的隨機抽樣調查研究,其證據力強也是源于其數據的真實性,而就其研究的目的而言,其證據力也是很高的;始于1948年的美國弗雷明漢心臟研究(FHS)隊列,先后有三代參與者加入隊列研究,從人口學、體檢、血液、心電圖、影像學的研究,到超聲心動圖、頸動脈斑塊測量、運動試驗等的研究證據力深受肯定,對包括心血管疾病領域在內的許多疾病領域都產生了深遠而重要的影響;疾病自然史研究所需要的科學的前瞻性觀察研究方案及其有效實施的分析結論的證據力也是較高的;高素質、高水平專家及其團隊既有堅實的多學科理論基礎、又具有十分豐富的臨床實踐經驗,并充分掌握諸多學科研究數據、信息和證據,其針對某一醫(yī)學臨床與管理問題的意見,對于臨床與管理的指導意義與實踐價值(證據力)未必就位居末位。
由于研究目的不同和研究條件限制,包括科學、專業(yè)和倫理的原因,不一定均能夠或有必要采用隨機或/和盲法對照設計進行研究。因此,在某種意義上,“真實世界研究”是對多年來過度強調“隨機對照試驗”證據的某種矯正。其特別強調從臨床診療實踐的角度,評價診療措施的效果,雖然面臨許多困難與不足,但是臨床診療的研究/實踐者仍然努力前行。這充分表明:臨床診療實踐者已經不滿足于傳統(tǒng)隨機對照研究證據,努力推動更加貼近臨床診療實踐的研究。不同的研究可以從不同的角度為臨床診療實踐提供證據,它們相互印證與補充,為臨床診療實踐提供更加全面且貼近臨床診療實踐的良好證據。
綜上所述,研究誤差的存在是絕對的,研究的證據力是相對的,而真實、可靠的數據是任何研究分析的基石。任何符合科學、專業(yè)、倫理的研究方案,均離不開合格研究人員的有效、準確的實施,而實施過程有效性與準確性的評估遠比研究方案本身的評估更難。一項高質量的研究勝過“一打”低質量研究,關鍵在于研究數據真實性、分析結果及結論的可靠性與準確性,而不是片面強調樣本量或研究項目數量。在臨床醫(yī)療實踐中,無論研究證據力如何,也僅僅是臨床診治與護理抉擇或決策的依據,而不是抉擇或決策本身,必須經受時間與實踐的考驗,仍然需要臨床醫(yī)護人員根據診治與護理患者的具體情況,例如年齡、性別、病情、病程、并發(fā)癥和合并癥及其診治過程(包括合并用藥、明確或未明確診斷和治療反應等)及其安全性與有效性等,不應拘泥于原始研究或文獻綜合研究的證據,應該參考不同來源、不同研究,緊密結合臨床診療與護理實踐,制定出符合患者實際情況,即具有針對性、個性化、精準性、療效好、毒副作用小、性價比高的診治與護理方案的抉擇或決策,并且隨著患者諸多情況的變化加以調整。因為任何研究證據均是特定時空、特定研究條件下的“產物”,任何脫離了疾病患者的復雜性、變異性、波動性和不確定性,甚至不考慮相關診治與護理措施的“適應癥”“適用條件”、毒副作用和配伍禁忌等限制,來單獨或片面地討論醫(yī)學研究的臨床療效證據力的做法都是不可取得。
在數千年醫(yī)學發(fā)展歷史中,人類一直秉持“循證”發(fā)展的科學理念,無論是中醫(yī)(藥)或是西醫(yī)(藥)的各臨床學科均重視醫(yī)學的實踐性和證據性。換言之,“遵從證據”的準則早已深入各臨床醫(yī)學學科實踐與發(fā)展的骨髓之中。在兼收并蓄的基礎上,任何學科均應該創(chuàng)立和發(fā)展本學科獨特理論與方法學體系,以發(fā)揮不可替代的效用。否則,該學科將難以持久存在與發(fā)展。例如,統(tǒng)計學具有從單因素到多因素、從線性關系到非線性關系分析的理論與方法;又如流行病學具有健康與疾病的“三間”分布的規(guī)律與特征分析的理論與方法;再如臨床流行病學具有“設計、衡量、評價”的理論與方法等。在數千年反復實踐與不斷驗證的基礎上,我國中醫(yī)與中藥學逐漸形成獨特的醫(yī)學理論體系,如基于先進的“宇宙觀”和“整體觀”的辯證施治和科學的“君臣佐使”的“個體化”藥物調配,均積累了大量豐富、真實、可靠的實踐經驗,確保了數千年中華民族的生息健康與文明進步。這從本次其在我國抗擊“新型冠狀病毒”中所發(fā)揮的預防、治療和康復一體作用,可窺見一斑。
我們應該建立和健全獨立的“醫(yī)學證據學”學科的理論與方法,既凸顯該學科的特征與發(fā)展方向,又更加全面地反映該學科與其他醫(yī)學學科的內在關聯性;應該跨學科、跨專業(yè)聯合發(fā)力,始終立足于不同類型、原始研究的專業(yè)性、統(tǒng)計性與倫理性設計與實施,并輔以文獻綜合研究,切勿本末倒置。證據力的判斷應以研究結果及其結論的可靠性與準確性為依據,而不是簡單地依據研究方案是否采用了大樣本、隨機化、盲法和薈萃分析等研究設計與方法。我們不但要重視數據的收集與整理,也要重視數據的綜合分析及其方法的正確運用;不但要重視研究方案的規(guī)范設計,更要重視研究方案的正確、有效實施。與其花大力氣進行研究質量的事后評價,不如進一步強化每項研究的設計,包括臨床專業(yè)設計、統(tǒng)計學設計和倫理設計等,切實防范于未然,同時進一步提倡大型臨床醫(yī)學研究的設計和/或實施應有統(tǒng)計學和倫理學人員的參與。
在臨床診療實踐中,患者情況各異且復雜,差異是客觀存在,而精準化診療要求臨床診療實踐者必須依據患者具體情況,制定個體化的診療方案,以期獲得較好的效果。面對紛繁復雜的醫(yī)療實踐,一方面,臨床醫(yī)務人員應進一步牢固樹立“實踐出真知”的醫(yī)學研究證據觀,充分認識各研究的目的性、局限性、階段性和差異性,保持客觀和理性態(tài)度,緊密結合臨床醫(yī)療實踐,審慎地評價、選擇和使用醫(yī)學臨床研究證據;另一方面,原始或/和文獻綜合研究者應該切實地按照臨床專業(yè)、統(tǒng)計和倫理等的原則和規(guī)范,一絲不茍地進行科學的研究設計,準確收集、科學整理研究結果,恰當、合理和有效進行分析,并全面地報告研究方法、質量控制和研究的局限與不足等,供讀者或/和應用者參考與甄別。當然,也有賴于期刊或/和會議交流的審稿專家或/和和編輯等的不懈努力,認真把好審查及發(fā)表關。
最后,應強調指出的是,整個醫(yī)學科學的發(fā)展不是、也不可能是依賴那一門學科的“單打獨斗”,更不可能依靠某種或某幾種分析方法就“打遍天下無敵手”,而是需要不同學科相互借鑒、相互融合、各自發(fā)揮優(yōu)勢,共同推動醫(yī)學事業(yè)的持續(xù)、健康和穩(wěn)步發(fā)展。任何夸大或貶低某門醫(yī)學學科或醫(yī)學研究方法在醫(yī)學發(fā)展中地位及作用,甚至將某門醫(yī)學學科或某種醫(yī)學研究方法凌駕于其他醫(yī)學學科或醫(yī)學研究方法之上的做法都是欠考慮的。只有大家共同努力,才能更好地為醫(yī)學事業(yè)的快速、健康的發(fā)展,提供高品質的醫(yī)學證據。