劉 近, 周躍進
(安徽理工大學數(shù)學與大數(shù)據(jù)學院,安徽 淮南 232001)
因果中介分析是揭示變量間因果機制的一個有效的分析工具,其廣泛用于心理學、行為學、流行病學、生物醫(yī)學的研究。2001年,Pearl基于反事實框架提出了直接效應和間接效應的定義?;诜词聦嵖蚣艿膬?yōu)點在于直接效應和間接效應的定義不需要基于模型的假定。在Pearl(2001)的方法中,因果中介效應具有可加性,自然直接效應和間接效應之和等于總效應。在一定的假設下,這些因果效應能被識別,從而獲得估計,并在Pearl(2009)中進行全面的闡述。本文研究當中介變量具有測量誤差時考慮無交互作用和有交互作用兩種情形下,分別通過建立邏輯回歸和線性回歸模型,估計出直接效應和間接效應。
因果中介分析研究自變量是否通過中介變量影響結果變量的因果機制,其一般關系如圖1所示,其中A表示自變量,M表示中介變量,C表示混雜變量,Y表示結果變量。
圖1 因果中介分析路徑圖
當C=c時,自變量從a到a*時,總效應被定義為:
類似地,可以定義基于優(yōu)勢比的直接效應和間接效應。自然直接效應定義為:
中介變量固定在M a*時,自變量從水平a變化到水平a*的效應。自然間接效應定義為:
總效應可分解為自然間接效應和自然直接效應的乘積,即
考慮中介變量具有測量誤差的因果效應估計問題。觀察值與真實值之間的關系為:
M*=M+μ,則路徑圖為圖2:
圖2 具有測量誤差的因果中介分析路徑圖
其中假設條件為:
建立logistic回歸和線性回歸模型,即如下所示。
然而,在考慮中介變量具有誤差的情形下,logistic回歸和線性回歸結構方程表示為:
自然直接效應OR NDEa,a*|c(a*)表示為:
在假設結果變量稀疏性假定下,自然直接效應和間接效應近似解析表達式為:
對模型中參數(shù)可由極大似然估計方法獲得其估計,從而估計自然直接效應和間接效應。
模型為:
在稀疏結果的假定下,則自然直接效應和間接效應的解析表達式分別為:
可由極大似然估計方法獲得模型參數(shù)估計,從而估計自然直接效應和間接效應。
在無交互作用情形下,為了進行模擬研究,模型參數(shù)分別設置為:03;對模型誤差分布考慮三種情形,分別服從N(0,1),N(1,1)和N(1,4),對每一種模擬情形,重復500次。獲得自然直接效應和間接效應的偏差,標準差和置信區(qū)間。模擬結果如表1所示。
表1 無交互作用時效應估計
當自變量服從各種模擬情形時,估計的偏差、標準差和置信區(qū)間都較小,表明提出的方法表現(xiàn)良好。
考慮在有交互作用的情形時,模擬結果如表2所示。
表2 有交互作用時效應估計
從表2中可得,對于模型誤差服從三種不同分布,真實值與估計值的差別很小,這表明我們提出的方法表現(xiàn)良好。
本文研究了當中介變量具有測量誤差時,考慮利用優(yōu)勢比定義了中介效應,通過建立邏輯回歸和線性回歸模型的結構方程,估計出直接效應和間接效應。在有限樣本下用R語言進行模擬分析,結果表明提出的方法具有良好表現(xiàn)。本文在推導過程中都假定結果變量是稀疏的,從而獲得效應估計的近似解析表達式。在未來的工作中,將進一步地考慮結果變量非稀疏性假定時,中介因果效應估計的精確解析表達式。