陳心廣
(西安交通大學(xué)全球健康研究院,西安 710020)
對事物間因果關(guān)系的興趣和好奇,是人類的天性。幾乎所有的學(xué)科領(lǐng)域,都關(guān)注因果關(guān)系方面的研究。與其他學(xué)科一樣,因果關(guān)系研究在醫(yī)學(xué)領(lǐng)域占有非常重要的地位,包括基礎(chǔ)醫(yī)學(xué)、藥理學(xué)、臨床醫(yī)學(xué)和預(yù)防醫(yī)學(xué)。醫(yī)學(xué)領(lǐng)域所關(guān)注的是影響健康和疾病的因素,包括健康危險因素、健康保護(hù)因素和健康促進(jìn)因素。例如:為什么生活在環(huán)境污染嚴(yán)重的大城市居民的期望壽命,比生活在農(nóng)村的人還長?在相同的條件下,為什么一些人感染新冠病毒,而另外一些人卻不感染?為什么不是每個超重或肥胖的人都患有高血壓、糖尿病和心臟病?為什么同一種病用相同的治療方法,有些病人效果好而有些卻不好?
筆者將從一個的新的角度,闡述因果聯(lián)系研究的本質(zhì)、研究設(shè)計和分析方法。
大多數(shù)醫(yī)療衛(wèi)生工作人員的研究工作都是基于疾病和健康的因果關(guān)系研究。然而,很少有人發(fā)問:因果關(guān)系究竟指的是什么?比如,當(dāng)研究體重與糖尿病之間的關(guān)系時,我們研究的究竟是什么?為什么得到的結(jié)論不像新冠肺炎與新冠病毒感染之間的關(guān)系那樣具有確定性?
根據(jù)發(fā)表的文獻(xiàn)和個人的實際經(jīng)驗,最近出版的《Quantitative Epidemiology》[1]一書的作者提出,我們進(jìn)行任何一項關(guān)于因果關(guān)系的研究,事實上都是從復(fù)雜的、相互依存的關(guān)系網(wǎng)絡(luò)里提取出來的,是我們認(rèn)為可能存在的一種關(guān)系。如圖1 所示,宇宙間萬事萬物相互依存、互相關(guān)聯(lián),形成錯綜復(fù)雜的關(guān)系網(wǎng)絡(luò)體系。而醫(yī)學(xué)研究人員則是根據(jù)實際需要、客觀條件、個人背景、興趣和能力等,從網(wǎng)絡(luò)體系中挑選出與健康或者疾病相關(guān)的一小部分進(jìn)行研究。
圖1 對未知事物間因果聯(lián)系的探究,常常集中在廣袤宇宙多元多層次的網(wǎng)狀結(jié)構(gòu)里某個小小的,我們比較熟悉的部分
例如,在真實情況下,疾病d 與3 個因素a、b、c之間存在如圖1所示的關(guān)系。某研究人員根據(jù)文獻(xiàn)資料和個人經(jīng)驗,認(rèn)為d 與a 有關(guān)。為證明這一假設(shè),他設(shè)計一個科研項目來證明兩者之間的關(guān)系。然而,這個研究忽略了未知因素b 和c。由于因素c處在a 和d 之間,a 與d 之間的關(guān)系要通過c 才能實現(xiàn)。我們稱c 為中介因素,即位于刺激與反應(yīng)變量之間還存在著沒有或者就不能觀察到的變量[2]。在不知道a-c 和c-d 關(guān)系的條件下,不能確定a-d 的關(guān)系。因素c 有可能阻斷a-d 關(guān)系,也有可能促進(jìn)a-d關(guān)系。如果c是阻斷作用,所得到的結(jié)果可能是d與a無關(guān);如果c是促進(jìn)作用,其結(jié)果可能會放大d與a之間的關(guān)系。由此可見,僅僅忽略一個中介因素,對研究結(jié)果的干擾就如此嚴(yán)重。不難想象,當(dāng)有多個因素介于我們研究的因素X和疾病Y之間,問題會有多嚴(yán)重。
第二,除了中介因素,還有影響因素b,也可稱為協(xié)變量或者混雜因素,即與因變量有相關(guān)關(guān)系,并且在探討自變量與因變量關(guān)系時需要加以控制的變量[2]。除了對d的影響,b還可以改變d與c和c與a 的關(guān)系。協(xié)變量的作用可能要比中介變量小,但是忽略了重要的協(xié)變量,也會嚴(yán)重影響因果推斷的結(jié)果,導(dǎo)致偏差,增加因果關(guān)系結(jié)論的不確定性。
最后,有些情況下很難事先確定d與a之間作用的方向,即無法事先知道是a 影響d 還是d 影響a。比如在研究慢性病與體力活動之間的關(guān)系時,往往無法事先確定是因為缺乏體力活動導(dǎo)致慢性?。窟€是因為患有慢性病而妨礙個人參加體力活動?由于一項研究一般只分析兩個變量的某個方向的關(guān)系,通常人為地指定X(自變量)和Y(應(yīng)變量)。如果指定對了,即能夠得到預(yù)期的結(jié)果;反之,則不能。
理解在因果關(guān)系研究中上述的本質(zhì)特點,有利于我們思考、設(shè)計、實施和評價科學(xué)研究項目,有助于準(zhǔn)確地解釋自己觀察到的研究結(jié)果,和正確理解他人的研究結(jié)果。
醫(yī)學(xué)科學(xué)研究另外一個重大問題是慢性病與傳染病的病因?qū)W模式?,F(xiàn)代醫(yī)學(xué)科學(xué)的建立,在很大程度上是基于對傳染病病因的生物學(xué)研究,而基于病因?qū)W建立的有效預(yù)防和治療方法則是通過傳染病的研究和實踐,自然而然地形成了疾病的因果聯(lián)系模式,最典型的是科赫法則[3]。
以細(xì)菌性肺炎為例(圖2 的上面部分),要診斷病人患有細(xì)菌性肺炎,首先尋找的證據(jù)是肺炎雙球菌。如果通過細(xì)菌培養(yǎng)找到了,按照病因?qū)W推理模式,肺炎雙球菌很可能就是病因了。除了細(xì)菌培養(yǎng)之外,尋找病因的辦法還有抗生素治療,如果通過抗生素治愈,從病因?qū)W的角度可以進(jìn)一步判斷肺炎雙球菌就是病因。
圖2 慢性?。ㄒ郧傲邢侔槔┎荒芴子脗魅静。ㄒ约?xì)菌性肺炎為例)的病因?qū)W推理模式
推斷傳染病因果聯(lián)系的模式深入人心,使得廣大的醫(yī)務(wù)工作者和絕大多數(shù)科研人員在醫(yī)學(xué)科學(xué)研究和實踐中,很自然地以此模式作為指導(dǎo)。圖2的下半部分是關(guān)于前列腺癌因果關(guān)系推斷的例子。這一個例子證明,用傳染病模式來研究慢性病的病因會得到錯誤的結(jié)論。
目前,治療前列腺癌的第一線方法就是抗雄激素睪丸酮治療,不僅療效好,而且穩(wěn)定。這種療法是基于上世紀(jì)70 年代獲得諾貝爾獎的動物實驗研究結(jié)果發(fā)展而來[4]。公認(rèn)的病因?qū)W研究和幾十年成功的臨床實踐,這讓我們自然地形成了高雄激素是前列腺癌病因這一因果推斷。與前面介紹的推斷細(xì)菌性肺炎的因果聯(lián)系模式如出一轍,抗菌素治好了由細(xì)菌引起肺炎,因此推理可知,細(xì)菌就是肺炎的病因;抗雄激素治好了前列腺癌,同理,雄激素就是前列腺癌的病因。
可是,雄激素的水平在青年時期最高,而前列腺癌的發(fā)病高峰是在老年期即65~70 歲之間,在這個年齡階段,體內(nèi)雄激素處在低水平已經(jīng)很長時間了。因此,根據(jù)抗雄激素治療前列腺癌的結(jié)果,來判斷雄激素過高是前列腺癌病因是經(jīng)不起事實檢驗的[5]。這個問題也許可以用另外一個理論來分析:前列腺癌的發(fā)病和進(jìn)展是兩個不同的過程。前列腺癌發(fā)生的原因不是雄激素太高,而是性激素隨年齡下降太快。因此,不能僅僅依據(jù)抗雄激素治療效果明顯,來確定慢性病發(fā)病的原因就是雄激素過高,這個新理論已經(jīng)得到不同研究的證實[6-8]。
除了因果關(guān)系研究的本質(zhì)特征和傳染病——慢性病因果聯(lián)系的模式的差異,病因?qū)W或者說因果關(guān)系研究還有一個被忽略的問題,就是研究特征與分析時所用的變量之間的關(guān)系。在《Quantitative Epidemiology》一書中,作者認(rèn)為在提出一個關(guān)于病因?qū)W研究的課題時,我們關(guān)注的往往是某個特征,比如,研究疾病時我們考慮的是“病”,如高血壓、心臟病、糖尿病、肺癌、腸癌等等。研究影響因素時,我們考慮的是“因素”,如個人衛(wèi)生、飲食習(xí)慣、體育鍛煉、吸煙、飲酒等等。
但是在開展具體研究時,我們測量的是“變量”。所謂變量,指的是相對單一的、可以客觀測量的指標(biāo)。因此,一個特征可以用多種變量來測量(如圖3 左邊部分所示)。比如,在研究吸煙與肺癌的關(guān)系時,“吸煙”是我們關(guān)注的特征??墒窃诰唧w研究時,有很多變量可以用來反映(度量)吸煙這一特征。典型的例子如血清里或者唾液里尼古丁的代謝產(chǎn)物、體內(nèi)呼出的氣體中二氧化碳的濃度等。除了實驗室指標(biāo),還有大量的調(diào)查指標(biāo),如開始吸煙的年齡、累計吸煙的年數(shù)、每個月吸煙的天數(shù),每天吸煙的支數(shù)、累計吸煙的支數(shù)等等。選擇不同是指標(biāo),得到的研究結(jié)果一定是不同的。
圖3 研究考察的特征與因果聯(lián)系分析時用的變量之間的關(guān)系
除了影響因素,研究疾病也不例外。比如,研究糖尿病時,可以用是否死于糖尿?。ㄋ劳龅怯洠?、是否患有糖尿?。ㄅR床診斷)、血糖水平、尿糖水平、AIC比例等等。這些變量從不同的側(cè)面反映了糖尿病這個“特征”。然而,采用不同的變量來分析因果關(guān)系,得到的結(jié)果可能會各不相同。以糖尿病死亡作為指標(biāo)最可靠,因為死亡能夠準(zhǔn)確地測量,但是影響死亡的因素卻是最不敏感的指標(biāo)。而且影響死亡的因素,不一定是影響發(fā)病的因素。相對而言,以是否患有糖尿病作為變量比死亡敏感多了。但是,臨床診斷會出現(xiàn)誤差,進(jìn)行病因?qū)W研究時也要考慮。實驗室指標(biāo)在病因?qū)W研究中最常用,可是實驗室檢測的誤差有時候比簡單測量和調(diào)查數(shù)據(jù)的誤差還要大。
與一個特征對應(yīng)多個變量關(guān)系相反的情況是,一個變量往往可以反映多個特征(如圖3 右邊所示)。例如,在上個世紀(jì)90 年代有一個非常有名的因果聯(lián)系研究,該研究發(fā)現(xiàn)擁有電腦與個人收入密切相關(guān),而且控制了很多混雜因素后關(guān)系依然存在[9]。通過分析發(fā)現(xiàn),擁有電腦這個變量可以反映很多特征,包括教育水平、職業(yè)和工作特點。遵循這一思路,后來有人研究證明,是否喜歡坐著、喜歡玩鉛筆、喜歡打電話也與個人收入密切相關(guān)。這是因為經(jīng)常坐著、常常打電話、和喜歡玩鉛筆的人常常也用電腦,而且大都屬于高薪人群[10]。
在進(jìn)行因果關(guān)系研究時,一定要認(rèn)真選擇指標(biāo)來測量結(jié)果變量Y。這一點對研究健康或者疾病問題尤其重要。因為對同一個疾病選擇不同的變量來進(jìn)行測量,就會得到不同的研究結(jié)果。圖4 用反映身體、心理和行為問題的4 種疾病來演示結(jié)果變量的選擇。如果選擇發(fā)病作為結(jié)果變量,研究會聚焦在發(fā)病的原因。雖然發(fā)病原因非常重要,可是在實際工作中,確定發(fā)病是最難的,尤其是慢性病。
圖4 因果關(guān)系研究,包括身體心理疾病和行為問題,可以根據(jù)不同發(fā)展階段來選擇不同的結(jié)果變
其次,就是診斷,包括臨床和實驗室診斷,或者二者的結(jié)合。以診斷結(jié)果作為結(jié)果變量,也能夠很好地反映發(fā)病的原因。與發(fā)病相比,干擾診斷的僅僅只有那些延誤診斷的因素。相對于發(fā)病與診斷,疾病的進(jìn)展和預(yù)后反映的內(nèi)容包括兩個方面,而且傳染病和慢性病有所不同。如果是傳染病,影響疾病的進(jìn)展和預(yù)后的除了醫(yī)療保健的差異,還有導(dǎo)致發(fā)病的原因,即致病菌。如果是慢性病,情況就更復(fù)雜,因為慢性病的發(fā)病、進(jìn)展和轉(zhuǎn)歸,可以是由完全不同的因素導(dǎo)致的。這方面需要更多的研究。
開展因果關(guān)系研究和推論非常具有挑戰(zhàn)性。除了借用扎實的理論基礎(chǔ)之外,還需要有支持證據(jù)。我們必須通過大量的探索性統(tǒng)計學(xué)分析,來判斷所選擇的X和Y是否符合事實。簡單線性回歸模型可以進(jìn)行探索性分析:
模型(1)中,Yi表示因變量,Y有i 個指標(biāo),分別從1到i=I;Xj表示自變量,X有j個指標(biāo),分別從1到j(luò)=J;βij表示X的第j個指標(biāo)與Y的第i個指標(biāo)之間的關(guān)系;e表示模型的殘差。
根據(jù)模型(1)可知,完成一輪探索性分析一共要用I乘以J個回歸模型。假設(shè)X有20個指標(biāo),那么J=20;Y有10個指標(biāo),那么I=10;那么,完成一輪探索性分析一共要運(yùn)行10×20=200個回歸模型。
用模型(1)完成探索性分析之后,記錄下估計的βij和相應(yīng)的統(tǒng)計學(xué)檢驗得到的P值。如果所有的自變量X都是標(biāo)準(zhǔn)化的,就可以選擇P值最小的一個或幾個度量X的指標(biāo)作進(jìn)一步分析。這是因為,在同等的條件下P值最小的那些測量X的指標(biāo),是最有可能與相應(yīng)的測量Y的指標(biāo)有內(nèi)在關(guān)系的。
完成探索性分析之后,就要通過多元回歸模型來確認(rèn)結(jié)果。具體做法是,從探索性模型分析的多對測量X和Y的指標(biāo)中選擇一兩對或者兩三對關(guān)系比較肯定的指標(biāo)。然后,逐一地進(jìn)行多元回歸模型分析。用多元回歸的目的,是控制一些在研究設(shè)計時無法控制的因素,比如人口學(xué)變量,以及與X和Y相關(guān)的協(xié)變量。這一步通常用下面的回歸模型來完成:
模型(2)中,X和Y是通過探索性分析選出來的變量;β是反映X與Y的關(guān)系的回歸系數(shù);Deml表示一個人口學(xué)變量;Covk表示k個其他方面的協(xié)變量。
如果通過模型(2)的分析發(fā)現(xiàn),在控制了人口學(xué)變量和協(xié)變量之后估計的回歸系數(shù)β仍然具有統(tǒng)計學(xué)顯著性(P<0.05),表明從統(tǒng)計學(xué)的角度X與Y之間有彼此有聯(lián)系,可以用來推斷二者之間是否有依存關(guān)系。如果控制人口學(xué)和其他協(xié)變量之后估計的回歸系數(shù)β不顯著,就有理由相信X與Y之間沒有真正的聯(lián)系,不能證實探索性分析得到的結(jié)果。
從前面介紹的所有內(nèi)容來看,分析因果聯(lián)系時每一次最好只納入一個自變量X。因為加入更多的自變量,問題就會變得很復(fù)雜。不但要考慮每個X的影響,還有考慮這些X之間的相互作用后對因變量Y的影響。按照圖1所示的因果聯(lián)系網(wǎng)的理論框架,即便選擇合適的變量,也很難確保根據(jù)所選變量建立的模式符合客觀事實。
目前通過大量的理論分析和科學(xué)研究嘗試,建立了一些同時分析兩個自變量X的方法。最引人注目的兩種方法就是中介變量分析(mediator analysis)和交互作用分析[11-12]。這里先介紹中介效應(yīng)分析。
如圖1,通過文獻(xiàn)資料及理論分析發(fā)現(xiàn),變量c可能是介于因變量d和自變量a之間的一個因素。在這種情況下,就可以用中介效應(yīng)模型來進(jìn)行分析驗證。令Y=d,X=a,M=c(這里M表示中介變量),那么中介效應(yīng)模型(mediation effect model)可以表述為:
通過模型(3)和(4)估計出回歸系數(shù)a,b,c之后,就可以用下面的方法計算中介效應(yīng):
通過模型(3)估計的回歸系數(shù)c就是自變量X對因變量Y的直接效應(yīng)。數(shù)學(xué)上可以證明,估計的直接效應(yīng)加上中介效應(yīng),就是X對Y的總效應(yīng)。
交互效應(yīng)(interaction effect)也是經(jīng)常用來研究兩個自變量與一個因變量之間的關(guān)系。假設(shè)第一個自變量仍然為X;為了與中介效應(yīng)模型的中介變量M區(qū)別,令第二個自變量為W;分析交互效應(yīng)的回歸模型可以表示為:
模型(6)中,X×W表示交互效應(yīng),而回歸系數(shù)表示交互效應(yīng)的大小和方向;與模型(3)相同,e是殘差。
如果通過模型(6)估計的回歸系數(shù)β3具有統(tǒng)計學(xué)意義,就表示X與W具有交互效應(yīng)。為了進(jìn)一步證實交互效應(yīng),模型(6)可以仿照模型(3)進(jìn)一步擴(kuò)展,加入人口學(xué)變量和其他協(xié)變量。
探索因果關(guān)系,是醫(yī)學(xué)科學(xué)研究中一個非常重要的命題。尤其當(dāng)絕大多數(shù)基礎(chǔ)性研究不可能直接在人體上進(jìn)行實驗,只能在盡可能接近實際的情況下展開,這時無法排除多種干擾因素。因為真實的事物關(guān)系處于一個龐大的關(guān)系網(wǎng)絡(luò),我們只能選擇一對因素(X與Y)來進(jìn)行評價分析其關(guān)系,所選擇的只是紛繁復(fù)雜的因果關(guān)系網(wǎng)絡(luò)里的一小部分。要想科學(xué)地證明所選擇的兩個變量X與Y之間的關(guān)系是否真實,這是極具挑戰(zhàn)性的工作。除了需要具備扎實的理論功底和豐富的實踐經(jīng)驗之外,還需掌握牢固的流行病學(xué)基礎(chǔ)和嚴(yán)謹(jǐn)?shù)慕y(tǒng)計學(xué)方法。
探索因果聯(lián)系的方法很多,新的方法和技術(shù)也在不斷涌現(xiàn)。本文希望能夠起到拋磚引玉的作用,引導(dǎo)更多從事醫(yī)療衛(wèi)生工作的研究人員思考疾病與健康之間的因果關(guān)系,這樣既能提高我們發(fā)現(xiàn)問題、解決問題的能力,也能助推醫(yī)學(xué)科學(xué)不斷發(fā)展進(jìn)步。