唐健元 楊志敏 楊進波 黃 欽 吳春芳 馮 毅
臨床研究中缺失值的類型和處理方法研究
唐健元1楊志敏1楊進波1黃 欽1吳春芳2馮 毅3
1.國家食品藥品監(jiān)督管理局藥品審評中心(100038)
2.第二軍醫(yī)大學衛(wèi)生統(tǒng)計學教研室(200433)
△通訊作者:馮毅,E-mail:fengy@cde.org.cn
臨床研究過程中的一些缺失值,可能導致新藥評價過程中的偏倚和降低評估的精確性和損耗隨機化的效果,以至于做出偏倚性結(jié)論。由于脫落數(shù)據(jù)很可能是一些極端值(如因治療無效而未再回訪),缺失的這部分研究數(shù)據(jù)會導致低估結(jié)果的變異性,從而得到一個“人為狹窄”的治療效應〔1〕。
目前,國內(nèi)新藥研發(fā)在缺失值結(jié)轉(zhuǎn)方面普遍采用的是末次訪視結(jié)轉(zhuǎn)(last observation carried forward,LOCF)方法,并未根據(jù)缺失類型采用有針對性的缺失值處理方法,更有甚者還將很多本不該剔除的缺失病例直接剔除出統(tǒng)計分析集。由于在缺失值問題上的簡單化處理或錯誤處理,研究者無法借助于敏感性分析去充分評估研究結(jié)果的穩(wěn)健性和研究質(zhì)量的好壞。基于對缺失現(xiàn)象背后的真實數(shù)據(jù)的考慮,強調(diào)對缺失值的分析則顯得更有意義。本文擬探討不同缺失機制下,幾種常見的缺失類型及相應的缺失填補方法,以促進臨床研究的發(fā)展。
Little 和 Rubin〔2,3〕提出了缺失數(shù)據(jù)的分類方法,根據(jù)其理論,缺失機制可分為以下三類情況:
完全隨機缺失指的是觀察對象的數(shù)據(jù)缺失完全是由隨機因素造成的,獨立于已完成的和將來要進行評價的結(jié)果,既不取決于已觀察到的數(shù)據(jù)也不取決于未被觀察到的數(shù)據(jù)。假設Y是一個沒有缺失值的n×k的矩形數(shù)據(jù)集,其中Yobs為觀測數(shù)據(jù),Ymis為缺失數(shù)據(jù);而M代表矩陣中有無缺失值,當Yij缺失時則記為Mij=1,反之,記為Mij=0;φ是與數(shù)據(jù)集中任何變量均無關的參數(shù),那么可得出MCAR:f(M|Y,φ)=f(M|φ)。例如因為受試者搬遷而脫落、研究者未能評估或一些設計因素而出現(xiàn)缺失。
只有當缺失現(xiàn)象屬于MCAR時,隨機選取具有完整數(shù)據(jù)的個體所組成的樣本便可認為是從研究總體中得到的隨機樣本。因此,對MCAR的數(shù)據(jù)進行刪除是不會產(chǎn)生偏倚的。
盡管MCAR要求缺失現(xiàn)象與研究變量無關,但是,研究變量同未被觀察數(shù)據(jù)間的間接關聯(lián)仍是有可能的。由于這種假設難以被證實,因此進行MCAR的假設有時會存在一定問題。理論上說,如果一旦認為缺失機制是MCAR時,通??梢圆捎煤鲆曔@些非完整數(shù)據(jù)進行處理。只要分析得當,這些缺失值是不會導致試驗偏倚的出現(xiàn),僅對檢驗效能有一定降低。需特別指出的是,在MCAR機制下缺失概率雖然與觀察結(jié)果無關,但有可能與某些協(xié)變量有關,尤其當協(xié)變量矩陣中包含處理因素作時,缺失概率可能會隨著不同的處理產(chǎn)生變化。
MAR是最常見的缺失機制。觀察對象缺失的概率取決于已有的觀察結(jié)果,不取決于未觀察到的結(jié)果,MAR:f(M|Y,φ)=f(M|Yobs,φ)。例如在對一個降壓藥的臨床研究中,根據(jù)方案,當受試者發(fā)現(xiàn)血壓控制并不理想(舒張壓太高)時決定退出研究,那么此時出現(xiàn)的缺失值就屬于MAR。
在MAR情況下,僅使用具有完整數(shù)據(jù)的個體進行分析會導致選擇性偏倚,因為這些個體所組成的樣本不是從研究總體中得到的隨機樣本。MAR一般可以從已觀察到的某些結(jié)果中分析出丟失原因并估算出缺失數(shù)據(jù)。這類缺失值往往要求采用多重填補(multiple imputation,MI)的方法進行敏感性分析(sensitivity analysis),以評估缺失值對結(jié)論的影響。
觀察對象的缺失概率與當前尚未觀察到的結(jié)果有關。在極大似然法(maximum likelihood estimation,MLE)和貝葉斯(Bayesian)理論框架內(nèi),MNAR又被稱為“不可忽略性”(non-ignorable)。因為這種缺失大都不是偶然因素造成的,比如疾病進展太快或化療副作用太強,病人沒有能力繼續(xù)接受隨訪。MNAR現(xiàn)象主要取決于缺失值本身,這類情況往往需要通過建立復雜模型來合并缺失機制,MNAR:f(M|Y,φ)=f(M|Yobs,Ymis,φ)。例如乳房假體植入術,當患者滿意療效時便不再回訪;另外,在腫瘤臨床研究中,如果患者出現(xiàn)治療失敗也會脫落。
Andrea B〔4〕認為如果關于上述缺失原因的信息被納入缺失數(shù)據(jù)模型,那么缺失機制可能由MNAR向MAR甚至向MCAR轉(zhuǎn)變,因此要注意收集這類信息。在模型中適當?shù)卦黾舆@類與缺失原因有關的變量可使MAR假設更可靠。
由于實際操作中,既不能肯定缺失值和未被觀測的結(jié)局變量之間的相關性,也不能判斷缺失數(shù)據(jù)是否能從已測值中得到很好地預測,因此不能確定是否應將其視為MCAR還是MAR。另外,目前要想明確區(qū)分MAR和MNAR也很難實現(xiàn)。研究者只能對同一份有缺失數(shù)據(jù)的資料分別進行MNAR和MAR的假設,并在各自的假設下作數(shù)據(jù)分析,然后進行敏感性分析,以比較所得結(jié)論是否與假設相應,敏感性越高則提示結(jié)論更穩(wěn)健〔5〕。
在臨床試驗的設計和執(zhí)行過程中,首先應盡量避免缺失值的出現(xiàn)。當出現(xiàn)缺失值時,一般有三種分析方法可加以處理:(1)忽視含有缺失值的觀察資料;(2)忽視那些出現(xiàn)頻繁缺失的變量;(3)用一些恰當值去替代缺失數(shù)據(jù)〔6〕。
當缺失值屬于MCAR時才可以忽視這些缺失值,否則會得到一個偏性結(jié)論。因為完成臨床研究的受試者并不能代表某些亞組人群,同時對不完整信息的丟棄會導致檢驗效能的降低。例如 Karin M Vermeulen〔7〕在其肺移植生存質(zhì)量的研究中僅有19位患者的資料是完整的,缺失數(shù)據(jù)的產(chǎn)生和生存質(zhì)量的下降是相關的,其缺失機制可能是MAR或MNAR,而非MCAR,僅使用完整數(shù)據(jù)的個體會產(chǎn)生選擇性偏倚。
忽視缺失值僅采用完整病例進行分析,違背了ITT原則并可產(chǎn)生偏倚性結(jié)論,不推薦將其作為確證性試驗的主要結(jié)果的缺失數(shù)據(jù)處理方法??煽紤]在以下情況下使用〔1,8〕:(1)在探索性研究中,尤其是在藥物研發(fā)的初期階段;(2)在確證性試驗中,作為次要結(jié)果的處理方法,用以支持性分析來說明結(jié)論的穩(wěn)健性。
為減少試驗數(shù)據(jù)的缺失對試驗評價的不良影響,除采取一些積極的預防性措施如研究中強調(diào)對主要變量的信息收集、增加樣本量以保證檢驗效能外,還應對缺失值進行填補,從某種程度上去彌補非完整數(shù)據(jù)的不足。通常在以下情況中應該將數(shù)據(jù)填補作為處理缺失數(shù)據(jù)的策略:①相對小的缺失率(例如10% ~15%);②在臨床上或在生物學上,含有缺失值的變量對于所要研究的問題都具有非常重要的意義;③有合理的假設和結(jié)轉(zhuǎn)技術策略,一般宜遵循保守的原則;④不同填補方式產(chǎn)生的結(jié)論需進行敏感性分析〔6〕。
(1)簡單/單一填補(simple/single imputation)
簡單填補法是指就缺失值僅按某個填補方法結(jié)轉(zhuǎn)一次,但不足之處在于該方法通常會低估數(shù)據(jù)的變異性。使用最廣泛的簡單填補法有末次訪視結(jié)轉(zhuǎn)和基線訪視結(jié)轉(zhuǎn),其他一些方法使用包括脫落前對同一研究對象收集的數(shù)據(jù)、源自其他具有類似基線特征的研究對象的數(shù)據(jù)、一個經(jīng)驗研發(fā)模型的預計值或歷史數(shù)據(jù)等用于結(jié)轉(zhuǎn)缺失值,如最差病例分析或最好病例分析,以及非條件均數(shù)/中位數(shù)、條件均數(shù)、隨機回歸和熱層法等經(jīng)驗研發(fā)模型。其常用的方法如表1所示。
(2)多重填補(multiple imputation,MI)
MI是指通過隨機生成值去替代缺失值得到多個原始數(shù)據(jù)集拷貝,然后再對這些衍生數(shù)據(jù)集進行分析。缺失數(shù)據(jù)多重填補過程涉及到貝葉斯理論、馬爾可夫鏈蒙特卡羅(MCMC)方法和數(shù)據(jù)增廣法(data augmentation,DA),其中DA是期望值最大化法則(expectation maximization,EM)算法的擴展算法。
MI假設的基礎在于數(shù)據(jù)缺失機制為非MNAR(主要為MAR),且數(shù)據(jù)滿足多元正態(tài)分布〔5〕。按照MAR假設,在以Yobs為條件的基礎上,Ymis的缺失是隨機的,這樣,就可以從條件分布f(Yobs|Ymis)中產(chǎn)生填補值Y(1),Y(2),…,Y(k)。數(shù)據(jù)填補是MI統(tǒng)計分析中的關鍵一步,填補時一方面要考慮到填補的不確定性,同時還要考慮到所觀察的完整變量與缺失變量之間的相關性。對于每一個缺失數(shù)據(jù)填補k次,這k個數(shù)據(jù)按照某種要求進行排列,這樣第一次用于填補缺失值的數(shù)據(jù)集就會產(chǎn)生第一個完整數(shù)據(jù)集,以此類推,最終k次填補將會產(chǎn)生k個完整數(shù)據(jù)集。每一個經(jīng)填補后得到的完整數(shù)據(jù)集都將采用標準的完整數(shù)據(jù)分析過程進行分析。通常,這些分析過程會忽略原數(shù)據(jù)集中觀測到與未觀測到的數(shù)據(jù)間的差別。在對每一個填補數(shù)據(jù)集分析得到的結(jié)果基礎上再進行綜合,即產(chǎn)生最終的統(tǒng)計推論。
在MI法過程中需注意:①MI在合并結(jié)論時需遵循一定的原則,即要求大樣本的漸近性(asymptotic)以及要求填補方式和分析模型應一致;②參數(shù)貝葉斯模擬技術(parametric Bayesian simulationmethods)主要取決于參數(shù)模型的正確形式;③應基于事先確定好的方法進行說明;④即使分析模型是建立在似是而非的假設條件下,在這個錯誤模型下所建立的MI法也不會對最終推論帶來災難性的影響;⑤填補模型應包括:a)分析中的關鍵變量,如結(jié)局和治療;b)對分析中的關鍵變量具有高度預測性的變量;c)對于缺失信息具有高度預測性的變量;d)反映研究設計特征的變量;⑥非MAR的情況須根據(jù)P(Ymis|Yobs,M)進行填補,模擬完整數(shù)據(jù)和缺失信息的聯(lián)合分布:a)選擇性模型:P(Y,M|X,θ,φ)=P(Y|X,θ)P(M|Y,X,φ);b)混合模式模型 (pattern-mixturemodel):P(Y,M|X,θ,φ)=P(M|X,φ)P(Y|M,X,θ);c)脆弱模型(frailty model):f(Y,M|X)=∫f(Y|X;β)f(M|X;β)dF(β|X)。
表1 常用簡單數(shù)據(jù)填補方法
①多重熱層填補法(multiple hot deck imputation)
多重熱層填補法基于單一熱層填補法原則,用一組“近鄰”對缺失值進行逐一替代。與冷層填補法類似,要求資料必須有分類、有完整數(shù)據(jù)以及預測變量。多重熱層填補法也使得所得的標準誤較單一填補法更大,更能反映數(shù)據(jù)的變異性。另外,在多重填補方法中,該方法的實現(xiàn)過程是相對簡單的。
②趨勢得分法(propensity scoremethod,PSM)
趨勢得分法是一種用于處理單調(diào)缺失(monotone m issing)的連續(xù)性變量數(shù)據(jù)的填補方法,通常被定義為對所給定的觀察到的協(xié)變量的一個向量進行特殊處理后得到的條件概率。PSM方法最初是被用于對反應變量進行重復測量的隨機試驗中,目的是為填補變量中的缺失值。但該方法只用到了與被填補變量值是否缺失相關的協(xié)變量信息,而未考慮變量間的相關。
③多重回歸填補法(multiple regression imputation)
此法根據(jù)回歸方程“Y=β0+β1TRT+β2Site+ε”對缺失數(shù)據(jù)進行多重填補。理想狀態(tài)下,每個缺失值Ymis應在(Ymis|Yobs,θ)的預測分布中。恰當?shù)腗 I應該是:(a)在可被忽視的情況下,可從后驗分布(posterior predictive distribution)中構(gòu)建 M I數(shù)據(jù)集,即根據(jù)Bayesian理論,可獲得給定觀測數(shù)據(jù)條件下缺失數(shù)據(jù)的后驗概率。
(b)M I往往需要迭代(iterative)以下兩個步驟:一是從P(θ|Yobs)中得到 θ(t);二是從P(Ymis|Yobs,θ(t))中得到Y(jié)mis(t)。(c)由于P(θ|Yobs)通常很難處理,一般需通過馬爾可夫鏈蒙特卡羅方法。
④ 數(shù)據(jù)擴增法(data augmentation,DA)
DA是期望值最大化(expectation maximization,EM)方法的一種衍生算法。事實上DA是從穩(wěn)定的后驗分布中隨機抽取缺失值來創(chuàng)建M I數(shù)據(jù)集,DA與EM過程最大的區(qū)別在于:EM是直接從觀測數(shù)據(jù)中得到缺失值并估計最大參數(shù),這種方法計算的結(jié)果較精確而且唯一;而DA則反映了缺失數(shù)據(jù)的不確定性,它是在得到要估計或抽取數(shù)據(jù)的穩(wěn)定分布后,從中抽取所需估算數(shù)據(jù)的隨機樣本進行模擬推斷;EM收斂是參數(shù)的收斂,而DA收斂是參數(shù)分布的收斂,其分布不再隨一次迭代到另一次迭代而改變,但隨機參數(shù)值本身在不斷的改變〔8〕。
DA首先要基于一些初始猜測θ(0)。填補步:用t次循環(huán)得到的參數(shù)θ(t),可以從條件分布P(Ymis|Yobs,θ(t))中得到Y(jié)mis(t+1)。后驗步:可從P(θ|Yobs,Ymis(t+1))中抽取θ(t+1)。然后重復“填補步”和“后驗步”100 000 次便得到 θ(t) ~P(θ|Yobs,Ymis)和Ymis(t)~P(Ymis|Yobs,θ),由于產(chǎn)生了足夠長的 Markov 鏈,若該鏈會聚于P(Ymis|Yobs,θ)分布時,則可以認為近似獨立地從該分布中抽取數(shù)值填補缺失值。
以上四種缺失數(shù)據(jù)多重填補方法的替代步驟和特點如表2所示。
表2 常用缺失數(shù)據(jù)多重填補方法
敏感性分析(sensitivity analysis)是通過一系列分析來顯示采取不同方法處理缺失值對試驗結(jié)果的影響,這將有助于證實所選特定方法的正確性,作為新藥評價過程中主要分析的附加支持。敏感性分析的實施方法應在臨床方案和統(tǒng)計分析計劃中予以設計和說明,任何調(diào)整必須在研究報告中加以說明并證明其合理性。以下一些簡單的方法可用于敏感性分析〔10〕:①比較全分析集和具有完整數(shù)據(jù)病例的分析結(jié)果。②比較不同模型條件下對結(jié)果的影響。③如果還未進行主要分析,則應充分利用取回的脫落數(shù)據(jù)。例如,如果一個患者退出研究后接受了其他治療,那么試驗結(jié)束時主要終點出現(xiàn)的陽性結(jié)果至少部分是由于這名患者的治療轉(zhuǎn)換所致。因此更保守地評估這個陽性結(jié)果可以更客觀地看待新藥。④在應答分析(responder analysis)中,分析應采用將所有缺失值視為無效或因某種原因視為無效,如因不良事件脫落。⑤最差病例分析,為比較兩種分析結(jié)果,將對照組的缺失值用可能最好的結(jié)局進行結(jié)轉(zhuǎn),而試驗組用最差的結(jié)局進行結(jié)轉(zhuǎn)。如果這種極端分析依然顯示研究結(jié)果未發(fā)生改變,那么就可以非??隙ǖ卣J為所推論的這個結(jié)果在處理缺失值方面是穩(wěn)健的。
如果敏感性分析的結(jié)果是恒定的,且能得到近似的治療效應評價,就能保證缺失信息對整個研究結(jié)論幾乎沒有或根本沒有任何影響,證實了結(jié)論的穩(wěn)健性。相反,如果敏感性分析的結(jié)果不一致,那么對試驗結(jié)果的影響就必須進行討論。在某些情況下,當敏感性分析的結(jié)果表明缺失值可能影響試驗結(jié)果時,試驗的有效性可能就會打一定折扣。
數(shù)據(jù)缺失在臨床研究的實施過程中是難以避免的,通過各種方式進行數(shù)據(jù)填補可以在一定程度上盡量模擬其數(shù)據(jù)真實情況,但結(jié)果的好壞與數(shù)據(jù)本身有著很直接的關系,如果數(shù)據(jù)本身缺乏可信性,即使最完美的填補方法也無濟于事。
如果缺失現(xiàn)象頻繁發(fā)生,即使這些缺失值不與結(jié)局終點相關,但這個試驗的外部有效性也會受到質(zhì)疑。有研究認為〔11〕,在數(shù)據(jù)缺失率為10%以下時,可選用簡單填補法進行填補。但也有研究認為,當數(shù)據(jù)缺失率<1%的時候,缺失數(shù)據(jù)的影響通常被認為是微不足道的,可以直接刪除。當數(shù)據(jù)缺失率在1% ~5%之間的時候,可以用樣本的均數(shù)(資料滿足正態(tài)分布)取代,或者用中位數(shù)(資料為偏態(tài)分布)取代,抑或用眾數(shù)(資料為二分類數(shù)據(jù))取代。此時,當研究目的為多個總體比較的時候,通常是用各個總體的樣本統(tǒng)計量分別取代其缺失數(shù)據(jù)。而當數(shù)據(jù)的缺失率達到或者超過了5%的時候,如果用同一個值去取代所有的缺失值,就會使得數(shù)據(jù)的方差變小,從而人為地夸大了統(tǒng)計分析結(jié)果的統(tǒng)計學意義。因此,當數(shù)據(jù)缺失率在5%~15%之間的時候就需要用一些復雜精密的方法去處理。當數(shù)據(jù)缺失率在15%~60%之間的時候,也可以使用不同的方法去處理,但缺失過多則反映了研究質(zhì)量的問題;而當數(shù)據(jù)缺失率>60%的時候,任何一種填補方法也愛莫能助〔11〕。在采用生存期、疾病復發(fā)或疾病進展時間作為主要結(jié)局的臨床研究中,有經(jīng)驗的研究者一般會將缺失數(shù)據(jù)控制在5%以內(nèi)。
在進行數(shù)據(jù)填補時,應首先判斷缺失的類型,根據(jù)不同的缺失原因采用不同的方法,必要時采取多種填補方法,并進行敏感性分析以證實其可靠性。事實上,即使數(shù)據(jù)缺失在一個能處理的范圍內(nèi)時,如果處理方式不恰當,也會造成分析結(jié)果的偏性或不能充分利用數(shù)據(jù)信息從而降低統(tǒng)計效率。
簡單填補法的優(yōu)點是簡單、易操作,適合于缺失量很小的數(shù)據(jù)。缺點是導致標準誤的降低和P值的減小,使得犯Ⅰ類錯誤的概率升高,還有容易引起系統(tǒng)偏倚〔12〕。因此,用簡單填補法計算出的治療效應置信區(qū)間會失去它本來的真實性,從而得到一個狹窄的看似精確的置信區(qū)間。
而MI目前已在國外許多領域得到廣泛應用,其優(yōu)點主要在于〔13〕:①沿襲了一些簡單填補法的優(yōu)點,摒棄了其主要缺陷,使填補的缺失數(shù)據(jù)能夠接近“真實”。②對于同一資料,更換一個新的分析過程不需要重新填補缺失值。③因其考慮了缺失數(shù)據(jù)的不確定性,對標準誤的估計以及統(tǒng)計推論通常比較準確。④填補效率較高。但是,與簡單填補法相比,MI相對比較復雜,運行程序所需空間較大,要求數(shù)據(jù)呈MAR,MCMC模型還要求數(shù)據(jù)呈多元正態(tài)分布,盡管這一假設并不十分嚴格,但在一定程度上會使其應用受限。此外,當樣本量足夠大時,直接采用極大似然法(maximum likelihood estimation,MLE)可得到與MI幾乎相同的結(jié)果,而MLE不需依賴模型的反復模擬過程,因此在某種程度上顯得比MI略有優(yōu)勢,但這類方法往往需要專門軟件,而且只能解決某些特殊的問題。相比之下,MI能夠解決有缺失數(shù)據(jù)資料中相對普遍的問題,尤其當數(shù)據(jù)呈任意缺失模式時,可以運用MCMC模型來處理復雜的數(shù)據(jù)缺失問題,提高統(tǒng)計效率。
綜上,臨床研究過程中應高度關注出現(xiàn)的缺失現(xiàn)象及其產(chǎn)生原因,研究方案和統(tǒng)計分析計劃應該事先確定好分析集人群和缺失值的處理方法等,保證臨床試驗結(jié)果的可靠、可信。
志謝:本文工作期間得到美國前國家食品藥品監(jiān)督管理局藥品評價與研究中心(CDER,F(xiàn)DA)生物統(tǒng)計學會主席、生物統(tǒng)計審評組負責人李寧博士(現(xiàn)賽諾菲-安萬特中國公司藥政及醫(yī)學政策高級總監(jiān))和第二軍醫(yī)大學衛(wèi)生統(tǒng)計學教研室賀佳教授的指導,在此深表感謝。
1.EMEA.Points To Consider On Missing Data.Available online at:http://www.emea.europa.eu/pdfs/human/ewp/177699EN.pdf
2.Little Roderick JA,Rubin Jeffrey.Statistical Analysis with M issing Data.New York:John W iley & Sons,1987.
3.Little Roderick JA,Rubin Jeffrey.Statistical analysis withm is sing data.2nd ed.Hoboken,NJ:Jonn Wiley&Sons,2002.
4.Troxel AB,F(xiàn)airclough D,Curran D,et al.Statistical analysis of quality of life with m issing data in cancer clinical trials.Statistics in Medicine,1998,17:653-666.
5.胡運淘,曹袁媛,章詩琪,等.生存質(zhì)量資料中缺失值的內(nèi)在機制及處理措施.中國衛(wèi)生統(tǒng)計,2008,25(6):661-664.
6.Steven Piantadosi.Clinical Trials-A Methodologic Perspective(2nd edition).Hoboken,NJ:John Wiley & Sons,2005:398-400.
7.Vermeulen KM,Post WJ,Span M M,et al.lncomplete quality of life data in lung transplant research:comparing cross sectional,repeated measures ANOVA,and multilevel analysis.Res piratorv Research,2005,6(1):101-111.
8.EMEA.Guideline on M issing data inconfirmatory clinical trials.Available online at:http://www.emea.europa.eu/pdfs/human/ewp/177699endraft.pdf.
9.岳勇,田考聰.數(shù)據(jù)缺失及其填補方法綜述.預防醫(yī)學情報雜志,2005,21(6):683-685.
10.馮志蘭,劉桂芳,劉力生,等.缺失數(shù)據(jù)的多重估算.中國衛(wèi)生統(tǒng)計,2005,22(5):274-277.
11.Barzi Federica,Woodward,Mark.Imputation ofmissing values in practice:results from imputations of serum cholesterol in 28 cohort studies.American Journal of Epidemiology,2004,160(1):34-35.
12.武建虎,賀佳,賀憲民,等.多變量缺失數(shù)據(jù)的不同處理方法及分析結(jié)果.第二軍醫(yī)大學學報,2004,25(9):1013-1016.
13.茅群霞,李曉松.多重填補法Markov Chain Monte Carlo模型在有缺失值的婦幼衛(wèi)生縱向數(shù)據(jù)中的應用.四川大學學報(醫(yī)學版),2005,36(3):422-425.
·綜述·