薛寒冰昆侖健康保險股份有限公司,北京 100000
核保醫(yī)學(xué)研究中常見統(tǒng)計偏倚與混雜的控制
薛寒冰
昆侖健康保險股份有限公司,北京100000
統(tǒng)計偏倚和混雜是核保醫(yī)學(xué)研究中非常重要的影響條件,如果將各類風(fēng)險因素不加選擇地羅列其中,就會不可避免地引入偏倚,特別是混雜偏倚的引入會影響研究因素與結(jié)局之間真正的聯(lián)系,但這些問題并不能利用統(tǒng)計方法解決,需要在研究設(shè)計階段進(jìn)行充分考量。
核保醫(yī)學(xué);混雜;偏倚
[Abstract]The statistical bias and confounding are the most important influence conditions in the underwriting medical research,the bias can be inevitably introduced if various risk factors are indiscriminately listed in it,especially the introduction of confounding and bias can affect the real correlation between research factors and outcomes,but the statistical method fails to solve these problems,and they need to be fully considered in the research and design stage.
[Key words]Underwriting medicine;Confounding;Bias
核保醫(yī)學(xué)研究主要分析各種風(fēng)險因素對結(jié)局的影響,通過對與結(jié)局相關(guān)的因素進(jìn)行統(tǒng)計分析來完成風(fēng)險評估,以往探索和驗證某一暴露因素與結(jié)局之間的因果關(guān)系時多采用橫斷面研究或隨訪研究,掌握可靠的預(yù)后因素則可以較為準(zhǔn)確地預(yù)測結(jié)局,這對核保風(fēng)險分析有著重要的意義,如評估冠心病作為獨立風(fēng)險因素對重大疾病發(fā)生率的影響。但是因不同風(fēng)險因素在其流行特征和暴露特性方面具有相互交叉的特點,并且相互影響,這樣就出現(xiàn)了影響研究結(jié)果真實性的混雜因素。但如果將各類因素進(jìn)行簡單的剝離勢必導(dǎo)致一些交叉因素被忽視[1]。相反將所有這些因素不加選擇地羅列于危險因素的研究中,同樣會導(dǎo)致問題產(chǎn)生,例如某些弱相關(guān)性因素會被弱化,特別是由于外來混雜因素的混入,一些低危險性因素的危險性會出現(xiàn)錯估,這會不可避免的導(dǎo)致偏倚的產(chǎn)生[2]。
按照偏倚產(chǎn)生的原因可分為選擇偏倚、信息偏倚和混雜偏倚,選擇偏倚是由于樣本入選不當(dāng)導(dǎo)致出現(xiàn)系統(tǒng)誤差,包括入院率偏倚、失訪偏倚、檢出偏倚等。信息偏倚是對納入的各組間所采用的觀察或測量方法不一致導(dǎo)致出現(xiàn)的系統(tǒng)誤差,包括診斷偏倚、依從性偏倚、回憶偏倚、調(diào)查偏倚、測量偏倚等[3]。在核保醫(yī)學(xué)研究領(lǐng)域,常見的偏倚包括以下幾類。
1.1檢出偏倚
是核保醫(yī)學(xué)研究領(lǐng)域比較常見的問題,早期核保人員多認(rèn)為良性乳腺疾病患者會傾向于乳癌發(fā)生。但近年的研究表明這一推論實際上與檢出偏倚有關(guān),即患良性乳腺疾病的人會比一般人接受檢查的頻率更高,也就更容易診斷出乳癌來。Sliber和Horwitz的研究結(jié)果證明,早期乳腺疾病與乳腺癌的粗OR值在統(tǒng)計上有顯著差異,但如果考慮研究人群接受檢查的不均衡性,這種關(guān)聯(lián)就消失了[4]。
1.2診斷偏倚
指疾病報告系統(tǒng)對暴露者和非暴露者采用不同的診斷標(biāo)準(zhǔn)時造成的診斷上的偏倚,例如對糖尿病和糖調(diào)節(jié)受損(IFG和IGT)人群進(jìn)行長期預(yù)后研究和風(fēng)險分類,1980年世界衛(wèi)生組織(WHO)糖尿病診斷標(biāo)準(zhǔn),在1999年發(fā)布的新標(biāo)準(zhǔn)中發(fā)生左移,并且IFG下限診斷切點降低,結(jié)果導(dǎo)致糖尿病檢出率上升,漏診率下降,但如果研究設(shè)計不做規(guī)則限定,同一研究人群在不同時期的診斷標(biāo)準(zhǔn)變化會導(dǎo)致研究結(jié)論出現(xiàn)不一致。
1.3失訪偏倚
研究對象在承保后的隨訪過程中發(fā)生影響風(fēng)險評價的失訪時,如合同中止、遷出、退保等,則可發(fā)生失訪偏倚。失訪偏倚對研究結(jié)果的影響取決于失訪程度、失訪者在所比較組的分布和失訪原因與所研究結(jié)果的關(guān)聯(lián)程度等。
1.4無應(yīng)答偏倚
主要發(fā)生于現(xiàn)況調(diào)查,表現(xiàn)為調(diào)查對象不合作或不參與。這些無應(yīng)答對象通常不能代表所研究人群,且無法判斷其風(fēng)險因素或疾病狀況,因此當(dāng)無應(yīng)答率較高時,從應(yīng)答人群中得出的有關(guān)研究因素與疾病的聯(lián)系不能反映兩者間的真實聯(lián)系。
1.5報告偏倚
因為研究對象有意夸大或隱瞞某些信息導(dǎo)致了對疾病或風(fēng)險因素暴露程度的錯誤分類。例如研究對象以故意隱瞞或者避重就輕的方式回應(yīng)病史詢問,導(dǎo)致核保研究人員獲得的報告不能反映研究對象的真實健康狀況。
1.6易感性偏倚
觀察結(jié)局除與暴露因素有關(guān)外,還與觀察對象的易感性有關(guān)。如:暴露于不良生活方式(飲酒行為)的學(xué)生的發(fā)病率比一般人群更低,是因為不良生活方式的學(xué)生,其初始的健康水平要比一般人群高,其易感性更低。
1.7混雜偏倚
包括正混雜性偏倚和負(fù)混雜性偏倚,正混雜性偏倚指由于混雜因素的作用使暴露因素與疾病之間的關(guān)聯(lián)被人為地夸大。負(fù)混雜性偏倚指由于混雜因素的作用使暴露因素與疾病的關(guān)聯(lián)被人為地減弱。主要是由于研究的設(shè)計階段未做條件一致性控制而影響分析結(jié)果的真實性。例如,對高齡人群進(jìn)行甲狀腺乳頭狀癌的預(yù)后研究,會出現(xiàn)重大偏倚,這種不是因抽樣誤差造成的偏倚并不會隨樣本量增加而克服[5]。
在理論上可以將混雜理解為在研究過程中所遇到的邏輯現(xiàn)象,假設(shè)在靜止條件下的某一觀察性研究結(jié)局事件是發(fā)生或者沒有發(fā)生,那么在這兩種情況下除了某一種或幾種現(xiàn)象以外,其他現(xiàn)象都相同,那么這就是事件發(fā)生的影響因素,而對其中的某一因素進(jìn)行控制就會減小混雜偏倚[6]。在研究某因素與某疾病之間的關(guān)系的實施過程時,混雜偏倚會影響研究因素與結(jié)局之間真正的聯(lián)系,這種偏倚以多種形式進(jìn)入到研究中,干擾研究結(jié)果的真實性[7-8]。識別判斷混雜是核保理論研究中的重要環(huán)節(jié),忽視混雜會導(dǎo)致測量值與總體值的差異推斷出現(xiàn)因果推斷的偏倚。通常對暴露總體和非暴露總體的結(jié)果分布可以評價暴露總體中暴露對結(jié)果的因果作用,當(dāng)暴露總體和非暴露總體不可比時,需要采用某些背景變量對總體分層,使暴露子總體與非暴露子總體是可比的。
混雜的判定原則大致分為“可壓縮原則”和“可比較原則”??蓧嚎s原則指某外部因素在各分層上的關(guān)聯(lián)測度一致,如出現(xiàn)不一致則該外部因素可認(rèn)為混雜因素??杀容^原則指某獨立危險因素在暴露總體與在非暴露總體中的分布不同,并且該因素不是病因鏈中的一環(huán)[4,9]。例如,肝硬化發(fā)病人群的年齡分布比肝硬化未發(fā)病人群的年齡分布偏大一些,那么即使肝硬化人群當(dāng)初未發(fā)病,因年齡原因,他們的肝癌發(fā)病率也會更高。但是,在相同的年齡區(qū)間,肝硬化人群與肝硬化未發(fā)病人群也許是可比較的,那么可以認(rèn)為年齡屬于混雜因素,通過調(diào)整年齡可以消除由于年齡分布不同造成的混雜偏倚[10]。
核保醫(yī)學(xué)研究中常見的混雜因素可以通過配對、隨機分組等方式平衡和消除其影響,根據(jù)具體要求將因素條件相同或相近的研究對象配對,可以使各處理組中的實驗對象條件均衡,使其具有良好的可比性,由于控制了非處理因素的影響,使處理因素的效應(yīng)能得到比較符合實際的客觀反映。隊列研究也可以很好地控制混雜,通過觀測疾病的發(fā)生、發(fā)展至結(jié)局的全過程,可直接計算研究人群出現(xiàn)某種預(yù)后結(jié)局的發(fā)生率,在疾病預(yù)后的探索方面是最佳設(shè)計,但存在周期長和失訪問題,其局限性會影響結(jié)論外推;在病例對照研究中應(yīng)用匹配方法容易引入系統(tǒng)性偏倚,因此分層分析是目前相對容易控制的方法。
而隨著流行病學(xué)研究更多的采用大樣本量的隊列研究,長期、廣泛地收集數(shù)據(jù),使得核保醫(yī)學(xué)也得以將更多的流行病學(xué)研究成果加以應(yīng)用,而研究所涉及的因素越多,越是不可避免的會引入混雜,對識別出的混雜進(jìn)行處理時,很多人直接采取分層調(diào)整或多因素分析,實際上這會給分析造成更多的困難,而合理的方式應(yīng)是首先考慮粗測量,其次是分層分析,然后才是多因素分析[11-12],因為在多因素分析中,暴露因素的獨立性、共線性等問題會帶來更多的不確定性,可能導(dǎo)致假相關(guān)性的結(jié)果,這種假相關(guān)性應(yīng)是偶然性的,但是潛在相關(guān)性越多,就越有可能導(dǎo)致這種偶然相關(guān)結(jié)果的出現(xiàn)[13]。
在統(tǒng)計分析階段消除偏倚是非常困難的,即便采用可比較原則和可壓縮原則也同樣會產(chǎn)生局限性,可比較原則只能判斷哪些變量不是混雜因素,而無法確定哪些變量一定是混雜因素,可壓縮性準(zhǔn)則須依賴于使用相關(guān)測度和背景因素的狀況[14]。通過對統(tǒng)計模型調(diào)整可以減少偏倚,但需要設(shè)定更多假設(shè),這會給統(tǒng)計分析帶來更多的不確定性,實際上這些偏倚只是它們在統(tǒng)計分析時被發(fā)現(xiàn)而已,僅通過統(tǒng)計模型或在研究完成后再校正這些偏倚是不合理的,應(yīng)在研究設(shè)計階段就要將這些可能會導(dǎo)致偏倚的因素考慮進(jìn)去,特別是對生物學(xué)資料不支持的結(jié)果,應(yīng)敢于提出質(zhì)疑,這樣有利于研究結(jié)論的外推[15]。
[1]李立明,余燦清,呂筠.現(xiàn)代流行病學(xué)的發(fā)展與展望[J].中華疾病控制雜志,2010,14(1):1-4.
[2]Genevieve Matanoski.低危險因素的流行病學(xué)研究[J].中華流行病學(xué)雜志,1997,18(6):353-355.
[3]董衛(wèi).臨床研究中常見的偏倚及其控制[J].中國實用內(nèi)科雜志,2007,27(24):1985-1986.
[4]任濤,詹思延,沈霞,等.流行病學(xué)研究中的偏倚與混雜[J].中華流行病學(xué)雜志,2004,25(9):811-813.
[5]付浩.預(yù)后因素研究中常見的統(tǒng)計錯誤—偏倚[J].中國肺癌雜志,2014,17(2):137-141.
[6]薛寒冰,核保醫(yī)學(xué)研究中關(guān)于混雜因素的探討[J].中國衛(wèi)生產(chǎn)業(yè),2015,2(5):153-154.
[7]左群,何蓓,胡高潮,等.新型城市醫(yī)療衛(wèi)生服務(wù)體系下流行病學(xué)研究中的偏倚控制[J].現(xiàn)代預(yù)防醫(yī)學(xué),2011,38(23):4884-4885.
[8]錢維,葉小飛,王超,等.藥品不良反應(yīng)信號檢測中混雜因素的控制方法[J].中國藥物警戒,2010,7(3):142-144.
[9]宋永霞,洪靜芳,謝倫芳,等,臨床癌癥患者研究中存在的偏倚及控制[J].中華護(hù)理雜志,2015,50(6):750-753.
[10]Miettinen OS,Cook EF.Confounding:essence and detection[J]. Am Journal Epidemiology,1981,114(4):593-603.
[11]呂慧,賴戰(zhàn)峰,李海煒,等.血尿素氮、肌酐及尿酸在兩種生化分析系統(tǒng)的比對和偏倚評估[J].中華檢驗醫(yī)學(xué)雜志,2012,35(6):550-553.
[12]林增文,蘇健,鄒偉民,等.廣東省臨床化學(xué)檢驗項目質(zhì)量評價與數(shù)據(jù)分析[J].實用醫(yī)學(xué)雜志,2009,25(15):2574-2576.
[13]張路,王薇,王治國,等.允許總誤差在西格瑪度量用于評價臨床化學(xué)檢測項目分析質(zhì)量上的應(yīng)用研究[J].檢驗醫(yī)學(xué),2015(9):953-957.
[14]胡永華,耿直.關(guān)于混雜概念的討論[J].中華流行病學(xué)雜志,2001,22(6):459-461.
[15]Maarit A.Laaksonen,Paul Knekt,Harri Rissanen.The relative importance of modifiable potential risk factors of type 2 diabetes:a meta-analysis of two cohorts[J].European Journal of Epidemiology,2010,25(2):115-124.
Control of Commom Statistical Bias and Confounding in Underwriting Medial Research
XUE Han-bing
Kunlun Health Insurance Co.,Ltd,Beijing,100000 China
R81
A
1672-5654(2016)05(a)-0032-03
薛寒冰(1975.5-),男,天津人,醫(yī)學(xué)碩士,研究方向:核保醫(yī)學(xué)。
2016-02-15)