四川大學華西公共衛(wèi)生學院/華西第四醫(yī)院流行病與衛(wèi)生統(tǒng)計學系(610041)胡逸凡 肖 雄 唐 丹 楊 帆 趙 星
測量誤差是指測量值與真實值之間的差異。營養(yǎng)流行病學是受測量誤差影響最嚴重、對測量誤差關(guān)注度最高的流行病學研究領(lǐng)域[1]。其可能的原因在于,第一,膳食攝入很難直接測量,因而主要依靠“自報”式調(diào)查,如食物頻率表、24小時膳食回顧調(diào)查等[2]。調(diào)查對象準確回憶膳食攝入量的難度較大,這種“自報”的調(diào)查方式通常會帶來較大的測量誤差[3]。第二,慢性病的發(fā)生被認為與長期膳食攝入而非短期食物攝入有關(guān),因此通常需要關(guān)注長期膳食攝入量。然而,個體的膳食攝入情況本身存在波動,因此用某個時點收集的膳食數(shù)據(jù)來估計長期膳食攝入也會受隨機誤差的影響。
膳食研究可以分為膳食描述性研究和膳食與疾病間關(guān)聯(lián)性研究。對于描述性研究,測量誤差可能會使得觀測到的膳食分布變異性更大,還可能使得膳食分布均值有偏[4]。對于關(guān)聯(lián)性研究,測量誤差不但會降低統(tǒng)計檢驗效能,使得研究所需樣本量大大增加;通常還會導致單誤差變量關(guān)聯(lián)性分析的關(guān)聯(lián)系數(shù)被低估(稀釋偏倚),從而使膳食與疾病之間的真實關(guān)聯(lián)無法被檢出;多誤差變量關(guān)聯(lián)性分析的關(guān)聯(lián)系數(shù)可偏向任何方向,從而使得關(guān)聯(lián)性分析結(jié)果不可信[5-7]。
鑒于測量誤差在膳食數(shù)據(jù)中普遍存在,且對膳食研究造成嚴重影響,自20世紀70年代起,膳食領(lǐng)域涌現(xiàn)出許多關(guān)于測量誤差校正的研究[3]。本文將對測量誤差對膳食研究的影響和校正方法進行綜述。
測量誤差可以分為隨機誤差(random error)和系統(tǒng)偏倚(systematic error)兩大類[8]。隨機誤差在膳食領(lǐng)域通常指一個個體在不同時間點多次測量的膳食攝入與其長期膳食攝入之間的差異。僅含有隨機誤差的測量值是無偏的,因此可以通過重復測量的方式來減少誤差。系統(tǒng)偏倚是指測量值始終朝一個方向偏離真實值。系統(tǒng)偏倚將造成測量值有偏,因此無法通過重復測量減少誤差,只能用金標準測量值來校正誤差。
1.經(jīng)典測量誤差模型
經(jīng)典誤差模型是最基本的測量誤差模型,它假設(shè)測量值W為真實值加上均值為0,方差為Var(ε)的隨機誤差ε,且誤差與真實值X獨立,見公式(1)[9]。經(jīng)典誤差模型僅考慮了隨機誤差,沒有考慮系統(tǒng)偏倚,即假設(shè)測量值相對于真實值是無偏的。然而“自報”式膳食調(diào)查工具獲得的攝入量通常都是有偏的[3],因此經(jīng)典誤差模型在膳食調(diào)查中通常無法滿足。
W=X+ε
(1)
2.線性測量誤差模型
線性誤差模型(linear measurement error model)無需假設(shè)測量值無偏,因而被廣泛用于描述膳食調(diào)查數(shù)據(jù)的測量誤差,其模型假設(shè)見公式(2)[1]。其中位置偏倚(location bias)α0是與真實值X無關(guān)的偏倚;比例偏倚(scale bias)α是與真實值X成比例變化的偏倚。通常位置偏倚的取值大于0,比例偏倚的取值小于1,代表一種“坡度變緩現(xiàn)象”(flattened slope phenomenon)[10],即真實攝入量較高者傾向于低報其攝入量,真實攝入量較低者傾向于高報其攝入量;隨機誤差ε均值為0,方差為Var(ε),且與真實值X獨立。當α0為0,α為1時,即為經(jīng)典測量誤差模型。
W=α0+αX+ε
(2)
3.異方差模型
在經(jīng)典誤差模型和線性誤差模型中,都假設(shè)誤差項ε的方差恒定,當該假設(shè)不能滿足時,如散點圖發(fā)現(xiàn)測量值的變異隨著真實值增大而增大,可假設(shè)異方差模型(heteroscedastic error model)。假設(shè)公式(1)、(2)中ε的方差取決于真實值X的大小,且通常隨著X增大而增大,表述為公式(3)[11]。在異方差模型的情況下,可嘗試變量變換,如對數(shù)轉(zhuǎn)換或一般的Box-Cox轉(zhuǎn)換,使得方差齊,再使用上述同方差模型的誤差校正方法[11]。
(3)
此外,根據(jù)誤差是否與疾病結(jié)局相關(guān),還可以將測量誤差分為差分誤差(differential error)和非差分誤差(non-differential error)。非差分誤差是指在給定真實值X和測量準確的協(xié)變量Z時,測量值W與疾病結(jié)局Y獨立,可用公式表述為P(Y|W,X,Z)=P(Y|X,Z)[1]。通常認為在隊列研究中,基線測量值的誤差滿足非差分誤差模型,而在病例對照研究時,受回憶偏倚的影響,測量值的誤差為差分誤差[5]。上述經(jīng)典測量誤差、線性誤差、異方差模型都屬于非差分誤差。差分誤差對膳食研究的影響以及校正方法更加復雜。
膳食研究可以分為膳食描述性研究和膳食與疾病關(guān)聯(lián)性研究兩大類。膳食描述性研究是指通過膳食調(diào)查了解人群膳食攝入分布情況,中國居民營養(yǎng)與健康狀況調(diào)查[12]及美國國家健康與營養(yǎng)調(diào)查(National Health and Nutrition Examination Survey,NHANES)[13]都屬于這類研究。膳食與疾病關(guān)聯(lián)性研究則更加常見,且探討測量誤差對其影響的研究也更多,本文探討的重點在關(guān)聯(lián)性研究。
1.膳食描述性研究
(1)經(jīng)典誤差模型
當調(diào)查的膳食變量存在經(jīng)典測量誤差時,由公式(1)可知E(W)=E(X),Var(W)=Var(X)+Var(ε),即調(diào)查的膳食分布均值無偏,但其膳食調(diào)查值的變異較真實的膳食攝入值變異更大。
(2)線性誤差模型
當調(diào)查的膳食變量存在線性測量誤差時,由公式(2)可知E(W)=αE(X),Var(W)=α2Var(X)+Var(ε),即調(diào)查的膳食分布均值有偏,由于α取值通常為0~1,故膳食調(diào)查值的變異較真實變異大小無法判斷。
2.膳食與疾病關(guān)聯(lián)性研究
測量誤差對膳食與疾病關(guān)聯(lián)性研究的影響取決于假定的測量誤差模型以及疾病模型。本文僅探討誤差存在于連續(xù)性暴露變量的情況,對于錯分類(misclassification)和結(jié)局變量存在測量誤差的問題不作討論。疾病模型中僅有一個含測量誤差的變量稱為單誤差變量疾病模型,疾病模型中有多個含測量誤差的變量稱為多誤差變量疾病模型。
(1)單誤差變量疾病模型
①經(jīng)典誤差模型
E(Y|X,Z)=β0+βXX+βZZ
(4)
(5)
(6)
(7)
②線性誤差模型
(8)
(2)多誤差變量疾病模型
(9)
(10)
β=(ΛT)-1β*
(11)
(3)非線性疾病模型
以上結(jié)論都是從線性疾病模型推導而來,對于常見的非線性模型,如logistic回歸模型,Cox比例風險模型,仍可近似得到以上結(jié)論。對于logistic回歸,只要測量誤差較小,或者真實的關(guān)聯(lián)系數(shù)βX為低、中等大小,近似效果都較好[9]。對于Cox比例風險模型,若結(jié)局事件發(fā)生率極低,且失訪對象為隨機缺失,即保證隨訪過程中處于風險集中的個體協(xié)變量分布保持穩(wěn)定,則測量誤差的影響近似于線性疾病模型中的結(jié)論[14]。在不同情形下測量誤差對膳食研究的影響總結(jié)于表1[1]。
表1 測量誤差對膳食研究的影響
一項關(guān)于膳食領(lǐng)域測量誤差校正的綜述顯示,由于使用簡單、適用性廣等優(yōu)點,目前90%以上的研究使用了回歸校正法進行測量誤差校正[15]。因此本文將回歸校正法作為主要的誤差校正方法進行闡述。對于一些營養(yǎng)素,如能量、蛋白質(zhì)、鈉、鉀,可以使用恢復生物標志物(recovery biomarker)來準確測量其真實攝入量。雖然這種測量方式成本較高,但可以測量小樣本的真實值來校正全人群含誤差的測量值。然而目前可用的生物標志物非常有限[16],對于許多食物和營養(yǎng)素無法測得真實值。我們從真實值已知和真實值未知兩個方面來歸納回歸校正法的使用。
1.真實值已知
(1)單誤差變量疾病模型系數(shù)的校正
E(X|W,Z)=λ0+λW+λZZ
(12)
(13)
(2)多誤差變量疾病模型系數(shù)的校正
多誤差變量疾病模型系數(shù)的校正也可以用兩種方法。第一種是按多誤差變量疾病模型計算稀釋沾染矩陣Λ,再按照公式(11)校正有誤差的關(guān)聯(lián)系數(shù)。第二種方式是先按公式(14)獲得真實值的預測值E(X|W,Z),其中Xi代表第i個含測量誤差變量的真實值,共有n個變量含有測量誤差。將預測值再帶入疾病模型(9)中擬合的關(guān)聯(lián)系數(shù)βX即為校正關(guān)聯(lián)系數(shù)[11]。此時用Delta法計算多變量校正關(guān)聯(lián)系數(shù)的方差較為復雜[18],用bootstrap法計算校正方差更簡便。
i=1…n
(14)
2.真實值未知
(1)測量值僅存在隨機誤差:經(jīng)典測量誤差模型
E(W2|W1,Z)=λ0+λW1+λZZ
(15)
(16)
(17)
(2)測量值存在系統(tǒng)偏倚:線性測量誤差模型
(18)
(19)
1.模擬外推法
模擬外推法最早由Cook和Stefanski提出[21],經(jīng)Carroll發(fā)展完善[9]。模擬外推法的基本思想是在有測量誤差的觀測值上逐級增加測量誤差,觀察對關(guān)聯(lián)系數(shù)的影響,然后外推到誤差為0時的關(guān)聯(lián)系數(shù),即為真實的關(guān)聯(lián)系數(shù)。與回歸校正法相比,模擬外推法對于復雜的疾病模型更具有普適性,且無需知道部分樣本的真值,但它只適用于經(jīng)典測量誤差模型。然而膳食數(shù)據(jù)通常無法滿足經(jīng)典測量誤差假設(shè),這可能是其目前在膳食領(lǐng)域應(yīng)用有限的原因。
2.矩法重建法(moment reconstruction)
矩法重建法由Freedman[22]提出,它與回歸校正法的相似之處在于都是尋找一個校正值來替代觀測值。在回歸校正法中是用給定測量值時真實值的期望作為校正值,而在矩法重建法中是用給定結(jié)局變量時與真實值的第一階矩和二階矩相等的值XMR作為校正值,即:E(XMR|Y)=E(X|Y),Var(XMR|Y)=Var(X|Y)。矩法重建法在線性疾病模型中校正值與回歸校正法校正值一致,而在logistic回歸模型中,模擬研究顯示其校正系數(shù)比回歸校正法得出的校正系數(shù)更接近真實系數(shù)[22]。相對于回歸校正法,矩法重建法考慮了結(jié)局變量信息,因此可以用于差分誤差模型,而回歸校正法只能用于非差分誤差模型。
3.多重填補法(multiple imputation)
多重填補法本是由Rubin[23]提出用于缺失值填補的方法,Cola[24]提出將含有誤差的連續(xù)性變量視作缺失數(shù)據(jù),用多重填補法進行填補。多重填補通常會插補出多個數(shù)據(jù)集,將多個數(shù)據(jù)集數(shù)據(jù)分別與疾病進行關(guān)聯(lián)后的關(guān)聯(lián)系數(shù)用Rubin法則[23]進行合并。由于多重填補用到了結(jié)局變量的信息,因此與回歸校正法相比,多重填補也可以用于差分誤差模型的情況。
4.似然法(likelihood method)與貝葉斯法(Bayesian method)
Carroll[9]按是否對真實值假設(shè)分布,將測量誤差校正方法分為兩類:函數(shù)模型(functional models)和結(jié)構(gòu)模型(structural model),前者將膳食攝入量的真實值視為固定值,前述的所有方法都屬于這一類;后者將膳食攝入量的真實值視為隨機變量,服從一定的分布,這類方法包括似然法、貝葉斯法。結(jié)構(gòu)模型依賴模型分布假設(shè),而函數(shù)模型則不依賴模型分布假設(shè)。但在模型假設(shè)穩(wěn)健性較好的情況下,結(jié)構(gòu)模型在高度非線性等復雜的研究情境下結(jié)果更可靠。似然法的基本步驟如下:首先假設(shè)真實值X已經(jīng)被觀測到,從疾病模型出發(fā),建立給定真實值X時疾病Y的分布;確定誤差模型;基于前兩步構(gòu)建似然函數(shù)并最大化似然。貝葉斯法也需要構(gòu)建似然函數(shù),故與似然法有一些關(guān)聯(lián),但貝葉斯法將參數(shù)視為隨機變量,最終得到待估計參數(shù)的后驗分布。相對于似然法,貝葉斯法更受歡迎,這可能與WinBuGs等自動軟件的使用大大降低了計算難度有關(guān)。
近年來,營養(yǎng)流行病學研究的可靠性倍受爭議,膳食數(shù)據(jù)測量誤差嚴重是原因之一[3,25]。本文綜述了目前測量誤差對膳食研究的影響和校正方法,希望能提高營養(yǎng)流行病學研究者對測量誤差的重視程度,并方便研究者們選擇合適的誤差校正方法使膳食研究結(jié)果的可信度更高。
測量誤差會使得膳食因素與疾病之間的關(guān)聯(lián)估計不準確。由于膳食數(shù)據(jù)通常含有系統(tǒng)偏倚,因此需要“金標準”校正。然而,大部分膳食數(shù)據(jù)沒有“金標準”測量方法。24小時膳食調(diào)查(24HDR)數(shù)據(jù)以隨機誤差為主,系統(tǒng)偏倚較小[26],因此目前多次24HDR數(shù)據(jù)通常被作為膳食研究校正的參考測量方法[16]。為了達到金標準校正效果,參考測量方法至少需要滿足兩個假設(shè),即參考測量方法的誤差與主調(diào)查工具的誤差不相關(guān),且與真實值不相關(guān),然而這兩個假設(shè)24HDR均不滿足[27]。有研究對蛋白質(zhì)、鉀、碘等有“金標準”測量的營養(yǎng)素,用24HDR這種“偽金標準”校正的后果進行了探究,結(jié)果顯示24HDR會高估稀釋因子的大小,從而低估這些膳食因素與疾病之間的關(guān)聯(lián)[16,27-28]。因此,研究者們也在不斷開發(fā)衡量膳食攝入的客觀指標,如濃度生物標志物(concentration biomarkers)[29]、基于代謝組學的膳食標志物(metabolomics-based dietary biomarkers)[30]等。
測量誤差通常會降低統(tǒng)計檢驗效能,且此問題無法通過誤差校正解決,其最直接的影響是使研究所需樣本量大大增加。因此,膳食研究通常需要很大的樣本量[5]。如美國癌癥中心開展的NIH-AARP隊列納入了188 736名絕經(jīng)后女性,探究從脂肪中攝入能量占總能量比例與乳腺癌發(fā)病的關(guān)聯(lián),結(jié)果顯示風險比的95%置信區(qū)間僅為1.00~1.24[31]。若非大樣本研究,則很可能無法發(fā)現(xiàn)一些膳食因素與疾病之間的關(guān)聯(lián),目前仍可能有許多膳食因素與疾病的關(guān)聯(lián)被測量誤差掩蓋。
由于使用簡單和適用性廣,回歸校正法是目前最受歡迎的測量誤差校正方法。該方法通過建立真實值與測量值及協(xié)變量的線性回歸來估計校正值,然而該線性假設(shè)不一定能滿足。在非線性等復雜疾病模型情況下回歸校正法的校正效果可能較差[9]。今后在使用回歸校正法時應(yīng)該充分考慮回歸校正法的適用條件,如當參考測量方式并非金標準時開展敏感性分析。此外,應(yīng)該多嘗試回歸校正法之外的其他誤差校正方法,并進一步發(fā)展新的測量誤差校正方法。