沙婷婷顏 艷△高 曉向仕婷何 瓊曾廣宇劉世平李洪艷譚 珊晏 強(qiáng)林 玲鄧學(xué)峰李迪民易 娟
三種統(tǒng)計(jì)分析方法在嬰兒生長(zhǎng)發(fā)育隨訪資料中的比較研究*
沙婷婷1顏 艷1△高 曉1向仕婷1何 瓊1曾廣宇1劉世平1李洪艷1譚 珊1晏 強(qiáng)2林 玲3鄧學(xué)峰3李迪民4易 娟5
目的運(yùn)用重復(fù)測(cè)量方差分析、混合線性模型、廣義估計(jì)方程分別擬合生長(zhǎng)發(fā)育隨訪資料,對(duì)三種統(tǒng)計(jì)方法分析的結(jié)果進(jìn)行比較,探討嬰兒體重增長(zhǎng)的影響因素。方法采用回顧性出生隊(duì)列資料,運(yùn)用SAS9.2等統(tǒng)計(jì)軟件進(jìn)行分析。結(jié)果重復(fù)測(cè)量方差分析得到嬰兒體重的增長(zhǎng)與出生體重、月齡、是否就醫(yī)有關(guān),且后兩者存在交互作用;混合線性模型得到出生體重、月齡、母親文化水平、喂養(yǎng)方式、睡眠時(shí)長(zhǎng),以及月齡與喂養(yǎng)方式的交互作用有統(tǒng)計(jì)學(xué)意義;廣義估計(jì)方程分析得到出生體重、月齡、喂養(yǎng)方式、睡眠時(shí)長(zhǎng)、以及月齡與喂養(yǎng)方式的交互作用具有統(tǒng)計(jì)學(xué)意義。結(jié)論三種統(tǒng)計(jì)方法均可應(yīng)用于生長(zhǎng)發(fā)育隨訪資料分析,各有優(yōu)缺點(diǎn),但分析結(jié)果存在一定差異,應(yīng)根據(jù)具體的適用情況,判斷何種方法分析的結(jié)果更為可靠。
生長(zhǎng)發(fā)育資料 混合線性模型 廣義估計(jì)方程 重復(fù)測(cè)量方差分析
嬰兒生長(zhǎng)對(duì)成人日后的健康有重要的影響。研究嬰兒生長(zhǎng)發(fā)育規(guī)律及其影響因素,可以在早期對(duì)嬰兒的生長(zhǎng)發(fā)育給出正確的評(píng)價(jià)和指導(dǎo)意見(jiàn),從而促進(jìn)嬰兒的體格生長(zhǎng)。目前,對(duì)新生兒的生長(zhǎng)發(fā)育指標(biāo)多進(jìn)行動(dòng)態(tài)監(jiān)測(cè)。這種針對(duì)同一個(gè)觀察對(duì)象的某項(xiàng)指標(biāo)在不同時(shí)間點(diǎn)進(jìn)行多次測(cè)量所獲得的數(shù)據(jù)叫做重復(fù)測(cè)量數(shù)據(jù)。生長(zhǎng)發(fā)育資料具備重復(fù)測(cè)量的特點(diǎn),各個(gè)時(shí)間點(diǎn)的測(cè)量指標(biāo)彼此不獨(dú)立。因此,分析生長(zhǎng)發(fā)育資料時(shí)必須考慮反應(yīng)變量間的相關(guān)性,以便得到更加準(zhǔn)確的結(jié)論。目前,處理這類生長(zhǎng)發(fā)育資料的分析方法主要有重復(fù)測(cè)量方差分析、混合線性模型、廣義估計(jì)方程、面板數(shù)據(jù)模型等。本文主要是采用前三種常見(jiàn)的統(tǒng)計(jì)方法對(duì)嬰兒生長(zhǎng)發(fā)育資料進(jìn)行分析,探討嬰兒體重增長(zhǎng)的影響因素,并比較三種方法的適用情況及優(yōu)缺點(diǎn)。
1.研究對(duì)象
采用簡(jiǎn)單隨機(jī)抽樣,從湖南省長(zhǎng)沙市開(kāi)福區(qū)隨機(jī)選取3個(gè)街道社區(qū)衛(wèi)生服務(wù)中心,篩選出2013年內(nèi)出生,在社區(qū)建立完善的衛(wèi)生檔案的具有本市戶口的嬰兒及父母作為研究對(duì)象,在取得父母的知情同意后將嬰兒納入回顧性出生隊(duì)列。由經(jīng)過(guò)嚴(yán)格培訓(xùn)的專業(yè)醫(yī)生對(duì)嬰兒進(jìn)行健康體檢并建立健康檔案,從健康檔案中追蹤得到嬰兒出生后1月、3月、6月、8月、12月齡的體重等生長(zhǎng)發(fā)育的指標(biāo)。調(diào)查員通過(guò)摘抄孕婦保健手冊(cè)及問(wèn)卷調(diào)查的方式收集孕婦家庭的一般情況、孕期保健情況、嬰兒喂養(yǎng)方式、輔食添加等信息。
采用Epidata 3.0進(jìn)行數(shù)據(jù)雙份錄入,并進(jìn)行一致性檢驗(yàn),采用統(tǒng)計(jì)學(xué)軟件IBM SPSS 21.0、SAS 9.2進(jìn)行分析。
(1)重復(fù)測(cè)量方差分析
重復(fù)測(cè)量方差分析模型是在方差分析的基礎(chǔ)上,對(duì)總體方差進(jìn)行分解。分為研究對(duì)象內(nèi)和研究對(duì)象間的變異,以及上述兩者的交互作用和隨機(jī)誤差變異。重復(fù)測(cè)量方差分析中研究對(duì)象內(nèi)的變異可以理解為各測(cè)量時(shí)間點(diǎn)的變異,研究對(duì)象間的變異即處理因素的作用。
(2)混合線性模型
混合線性模型是為解決非獨(dú)立性數(shù)據(jù)基于傳統(tǒng)的線性模型而發(fā)展起來(lái)的一類統(tǒng)計(jì)模型。其一般表達(dá)式如下:
其中Y、Xβ與傳統(tǒng)的線性模型解釋相同,Y表示反應(yīng)變量值的向量,X、β分別表示固定效應(yīng)的設(shè)計(jì)矩陣和參數(shù)向量,Z、γ分別表示隨機(jī)效應(yīng)的設(shè)計(jì)矩陣和參數(shù)向量,ε表示隨機(jī)誤差向量,不要求其滿足獨(dú)立、等方差的假定。
(3)廣義估計(jì)方程模型
廣義估計(jì)方程(GEE)是在廣義線性模型基礎(chǔ)上,進(jìn)一步發(fā)展擬似然函數(shù)所得,重點(diǎn)在于估計(jì)組內(nèi)相關(guān)系數(shù)[1]。假設(shè)Ymn是第m個(gè)個(gè)體的n次測(cè)量的應(yīng)變量,mn是對(duì)應(yīng)Ymn的q×1維解釋變量向量。E(Ymn)=μmn是Ymn的邊際期望值;Var(Ymn)=V(μmn)·φ是Yij的邊際方差,V(·)為已知函數(shù),φ為分散參數(shù),又叫尺度參數(shù),表示Ymn的方差不能用V(μmn)解釋的部分;cov(Yms,Ymt)=c(μms,μmt;α),c(·)為已知函數(shù),α又叫相關(guān)參數(shù)。構(gòu)造的廣義估計(jì)方程:
長(zhǎng)江采砂管理工作是一項(xiàng)綜合性很強(qiáng)的工作,要做好水事糾紛調(diào)解、違法案件查處,執(zhí)法人員不僅要有豐富的法律知識(shí),而且還要懂專業(yè)、政治素質(zhì)高、協(xié)調(diào)能力強(qiáng),這也是提高執(zhí)法人員素質(zhì)中要亟待解決的問(wèn)題。目前大家都有一個(gè)誤解,認(rèn)為執(zhí)法人員素質(zhì)不高,只是對(duì)法律、法規(guī)的學(xué)習(xí)不透徹。其實(shí)要辦理好一個(gè)水事案件,不僅僅需要法律、法規(guī)知識(shí),還要在專業(yè)知識(shí)、政治素質(zhì)、人性化管理和綜合協(xié)調(diào)能力上下工夫。
解該方程可得到回歸系數(shù)β的一致性估計(jì)。
1.資料的描述性分析
本次研究共調(diào)查536例嬰兒,其中追蹤得到體重發(fā)育資料較完整的樣本521例。有效應(yīng)答率為97.2%。其中男嬰270例,女?huà)?51例,出生性別比為1.07∶1。新生兒平均出生體重為(3.3±1.6)kg,男嬰和女?huà)氲某錾w重差別沒(méi)有統(tǒng)計(jì)學(xué)意義(P=0.29),低出生體重兒(出生體重<2500g)20例,發(fā)生率3.8%。表1、表2是研究對(duì)象的基本情況。
2.重復(fù)測(cè)量方差分析
SAS輸出的Mauchly球性檢驗(yàn)結(jié)果,其中P<0.001,拒絕球性假設(shè),須看H-F調(diào)整之后的概率結(jié)果。由表3可得到新生兒出生體重、是否就醫(yī)、月齡、月齡與是否就醫(yī)的交互作用對(duì)嬰兒體重生長(zhǎng)發(fā)育的影響有統(tǒng)計(jì)學(xué)意義(P<0.05)。
表1 521例嬰兒各月齡的體重及睡眠時(shí)長(zhǎng)測(cè)量值
表2 嬰兒隨訪一般情況描述
表3 重復(fù)測(cè)量的方差分析結(jié)果
3.混合線性模型
混合線性模型擬合生長(zhǎng)發(fā)育資料時(shí),首先要確定合適的方差/協(xié)方差結(jié)構(gòu),本文分別擬合UN、UN(1)、CS、AR(1)這四種常用的協(xié)方差結(jié)構(gòu)。在構(gòu)造模型相同的情況下,信息準(zhǔn)則越小,模型的擬合優(yōu)度越高[2]。本文發(fā)現(xiàn)當(dāng)擬合的協(xié)方差結(jié)構(gòu)type=UN時(shí),其似然比值、AIC值、BIC值均最小,故本模型采用UN結(jié)構(gòu)進(jìn)行分析,得到協(xié)方差參數(shù)估計(jì)值和固定效應(yīng)的檢驗(yàn)結(jié)果如表4。結(jié)果表明,嬰兒出生體重、月齡、母親的文化水平、喂養(yǎng)方式、睡眠時(shí)長(zhǎng)以及月齡與喂養(yǎng)方式的交互作用對(duì)嬰兒體重增長(zhǎng)有影響(P<0.05)。
表4 各因素固定效應(yīng)的檢驗(yàn)假設(shè)結(jié)果
4.廣義估計(jì)方程模型
作業(yè)相關(guān)矩陣是廣義估計(jì)方程中的一個(gè)重要指標(biāo),可以反映因變量每次測(cè)量值的相關(guān)性,常用Rm(α)表示。常見(jiàn)的Rm(α)形式有獨(dú)立、等相關(guān)、不確定型相關(guān)等。本研究采用體重的生長(zhǎng)發(fā)育隨訪資料,故連接函數(shù)選擇線性函數(shù),考慮到等相關(guān)作業(yè)相關(guān)矩陣給出的相關(guān)系數(shù)是相同的,結(jié)果較為簡(jiǎn)單,便于理解,故本模型選擇等相關(guān)矩陣進(jìn)行擬合。在等相關(guān)情況下求出任意兩次體重觀測(cè)值的平均相關(guān)系數(shù)是0.2573。各因素的參數(shù)估計(jì)和檢驗(yàn)假設(shè)的結(jié)果見(jiàn)表5,可得嬰兒的出生體重、月齡、喂養(yǎng)方式、睡眠時(shí)長(zhǎng)以及月齡與喂養(yǎng)方式的交互作用對(duì)嬰兒日后體重的增長(zhǎng)具有統(tǒng)計(jì)學(xué)意義(P<0.05)。
表5 各因素的參數(shù)估計(jì)和檢驗(yàn)假設(shè)的結(jié)果
1.影響因素討論
上述三種統(tǒng)計(jì)分析方法均可用于嬰兒體重增長(zhǎng)的影響因素分析。本文結(jié)果表明純母乳喂養(yǎng)的嬰兒體重要高于混合喂養(yǎng)的同月齡嬰兒,這可能是由于母乳中含有對(duì)嬰兒生長(zhǎng)發(fā)育有利的活性營(yíng)養(yǎng)物質(zhì),如乳清蛋白等。這些活性營(yíng)養(yǎng)物質(zhì)可以促進(jìn)嬰幼兒的腸道吸收,增進(jìn)免疫系統(tǒng),維持機(jī)體的健康生長(zhǎng),有利于嬰兒的體重增長(zhǎng)[3]。本文結(jié)果顯示,嬰兒的體重增長(zhǎng)還與其睡眠時(shí)長(zhǎng)有關(guān),與已有研究結(jié)論相符[4],這可能與嬰幼兒在睡眠時(shí)有助于體內(nèi)生長(zhǎng)激素的分泌有關(guān)。Kavle,J(2016)等人[5]在文章中提到嬰兒期間發(fā)生腹瀉與嬰兒的體重增長(zhǎng)沒(méi)有關(guān)聯(lián),這與本文研究結(jié)果相同。此外,本結(jié)果顯示母親的文化水平越高越有利于嬰兒的體重增長(zhǎng),這可能是由于母親的學(xué)歷越高,其獲取合理的嬰兒喂養(yǎng)知識(shí)的途徑越多,采用的喂養(yǎng)行為更合理[6]。綜合上述三種統(tǒng)計(jì)方法的研究結(jié)果,影響嬰兒體重增長(zhǎng)的因素主要有出生體重、月齡、母親的文化水平、喂養(yǎng)方式、睡眠時(shí)長(zhǎng)、是否患病就醫(yī)等。
2.三種統(tǒng)計(jì)方法的特點(diǎn)及應(yīng)用
(1)重復(fù)測(cè)量方差分析
重復(fù)測(cè)量方差分析可以處理典型的生長(zhǎng)發(fā)育資料,并且判斷測(cè)量指標(biāo)是如何隨時(shí)間發(fā)生變化的以及是否與時(shí)間存在交互作用。該模型的優(yōu)點(diǎn)是每一個(gè)體作為自身的對(duì)照,克服了個(gè)體間的變異。但該模型應(yīng)用條件較為嚴(yán)格,必須滿足方差分析基本要求;還要求協(xié)方差矩陣滿足球形性的假設(shè)條件,若不滿足就必須進(jìn)行多元方差分析或?qū)統(tǒng)計(jì)量進(jìn)行校正,獲得校正概率[7];并且重復(fù)測(cè)量方差分析的資料不可避免地會(huì)存在缺失值,若不能補(bǔ)充樣本,方差分析會(huì)因減小樣本量而降低檢驗(yàn)效能,對(duì)結(jié)論造成影響。
(2)混合線性模型
混合線性模型充分考慮到數(shù)據(jù)的聚集性和相關(guān)性問(wèn)題,運(yùn)用相應(yīng)的迭代方法,可以更準(zhǔn)確地同時(shí)估計(jì)固定效應(yīng)和隨機(jī)效應(yīng),使結(jié)果更易于外推[8]??紤]到生長(zhǎng)發(fā)育資料本身的特殊性,長(zhǎng)期的前瞻性隨訪,就會(huì)造成無(wú)法避免的數(shù)據(jù)缺失,混合線性模型可以克服數(shù)據(jù)含有缺失值的不足,充分利用現(xiàn)有數(shù)據(jù)的信息,使得到的結(jié)果更為可靠[9],因此混合線性模型對(duì)于生長(zhǎng)發(fā)育隨訪資料的應(yīng)用有其特有的優(yōu)勢(shì)。但是若所分析的因變量是分類資料、等級(jí)資料或者是多反應(yīng)變量時(shí),混合線性模型則不適用,應(yīng)該選擇它的擴(kuò)展模型混合效應(yīng)模型[10]。
(3)廣義估計(jì)方程
廣義估計(jì)方程在處理生長(zhǎng)發(fā)育隨訪資料時(shí),可以很好地解決數(shù)據(jù)相關(guān)性的問(wèn)題,即使模型的作業(yè)相關(guān)結(jié)構(gòu)指定不夠準(zhǔn)確,模型對(duì)參數(shù)的估計(jì)也有較好的一致性[1]。GEE也可以像混合線性模型一樣處理含有缺失值的資料,Liang已經(jīng)證明,只要資料的缺失值比例不大,并且為隨機(jī)缺失時(shí),廣義估計(jì)方程得到的估計(jì)仍是一致并且穩(wěn)健的[11]。GEE可根據(jù)因變量的多種分布類型選擇設(shè)定相應(yīng)的連接函數(shù),適用于多種類型的因變量,如二分類、有序多分類等資料,還可以同時(shí)納入多種類型的自變量[1,12]?;谝陨蟽?yōu)點(diǎn),廣義估計(jì)方程在生長(zhǎng)發(fā)育隨訪資料中的應(yīng)用具有極大的靈活性。
綜上所述,三種統(tǒng)計(jì)方法都適用于生長(zhǎng)發(fā)育隨訪資料的分析,各有優(yōu)缺點(diǎn),在分析嬰兒體重增長(zhǎng)的影響因素時(shí)存在一定差別。因此,在實(shí)際工作中,應(yīng)從具體分析的目的、資料的類型、數(shù)據(jù)的完整性等多個(gè)方面綜合考慮,選擇適用并且檢驗(yàn)效能高的模型,才能得到較為可靠的參數(shù)估計(jì)和模型預(yù)測(cè)。
[1]趙振,潘曉平,張俊輝.廣義估計(jì)方程在縱向資料中的應(yīng)用.現(xiàn)代預(yù)防醫(yī)學(xué),2006,33(5):707-708.
[2]秦正積,沈毅,王燕南,等.三種重復(fù)測(cè)量資料的統(tǒng)計(jì)分析方法比較研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2014,31(3):542-545.
[3]張紅梅,賴建強(qiáng).乳清蛋白對(duì)嬰幼兒生長(zhǎng)發(fā)育影響的研究進(jìn)展.中國(guó)食物與營(yíng)養(yǎng),2011,17(9):67-71.
[4]熊昌輝,顏艷,譚珊,等.面板數(shù)據(jù)模型在嬰兒生長(zhǎng)發(fā)育評(píng)價(jià)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2015,32(6):939-941.
[5]Kavle JA,F(xiàn)lax VL,Abdelmegeid A,et al.Factors associated w ith early grow th in Egyptian infants:implications for addressing the dual burden ofmalnutrition.Maternal and Child Nutrition,2016,12(1):139-151.
[6]李春雨,黃磊,馬曉晨,等.北京市4-12月齡嬰兒輔食喂養(yǎng)指數(shù)分析.中國(guó)兒童保健雜志,2014,22(2):125-127.
[7]王超,王汝芬,張淑嫻.混合效應(yīng)線性模型與單因素方差分析在重復(fù)測(cè)量數(shù)據(jù)中的應(yīng)用比較.?dāng)?shù)理醫(yī)藥學(xué)雜志,2006,19(4):355-357.
[8]黃坤,倪宗瓚,程薇波.混合線性模型在臨床試驗(yàn)中重復(fù)測(cè)量資料的應(yīng)用.現(xiàn)代預(yù)防醫(yī)學(xué),2005,32(11):166-167.
[9]周倩,張晉昕.含缺失值的重復(fù)測(cè)量資料分析在SPSS和SAS中的實(shí)現(xiàn).循證醫(yī)學(xué),2013,13(2):120-123.
[10]薩建.混合效應(yīng)模型在多反應(yīng)變量重復(fù)測(cè)量資料分析中的應(yīng)用.山西醫(yī)科大學(xué),2007.
[11]夏彥,潘曉平,劉元元,等.廣義估計(jì)方程在臨床試驗(yàn)重復(fù)測(cè)量資料中的應(yīng)用.現(xiàn)代預(yù)防醫(yī)學(xué),2005,32(5):444-445.
[12]高茂龍.分類重復(fù)測(cè)量資料廣義估計(jì)方程應(yīng)用.山西醫(yī)科大學(xué),2007.
(責(zé)任編輯:郭海強(qiáng))
A Com parative Study of Three Statistical Analysis Methods on Baby Grow th and Development Follow-up Data
Sha Tingting,Yan Yan,Gao Xiao,et al
(School of Public Health,Central South University(410078),Changsha)
ObjectiveUsing themethod of repeatedmeasure analysis of variance,m ixed linearmodel,generalized estimating equations to fit the grow th and development data respectively,comparing the results of three statistical analysismethods and exploring the influence factors of baby weight gain.MethodsWe used the SAS9.2 software to analyze the retrospective birth cohort study.ResultsThemethod of repeated measure analysis of variance revealed that birth weight,month age,health seeking and the interactions ofmonth age and whether or not go to a doctor had a significant effect on baby weight gain.The method ofm ixed linearmodel revealed that birth weight,month age,level ofmaternal education,feeding pattern,sleeping time,and the interactions ofmonth age and feeding pattern had a significant effect on baby weight gain.We got the same resultsw ith them ixed linearmodel except for level of thematernal education by method of generalized estimating equations.ConclusionThree statisticalmethods can be applied to analyze the grow th and development data and eachmethod has advantages and disadvantages respectively,though there are some differences between the results.We should consider the specific conditions and determ ine to choose which kind ofmethod formore reliable results.
Grow th and development data;M ixed linearmodel;Generalized estimating equations;Repeated measure analysis of variance
本研究獲國(guó)家自然科學(xué)基金資助(81373101)
1.中南大學(xué)湘雅公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)專業(yè)(410083)
2.長(zhǎng)沙市開(kāi)福區(qū)衛(wèi)生局
3.長(zhǎng)沙市開(kāi)福區(qū)四方坪街道社區(qū)衛(wèi)生服務(wù)中心
4.長(zhǎng)沙市開(kāi)福區(qū)東風(fēng)路街道社區(qū)衛(wèi)生服務(wù)中心
5.長(zhǎng)沙市開(kāi)福區(qū)新河街道社區(qū)衛(wèi)生服務(wù)中心
△通信作者:顏艷,E-mail:yanyan@csu.edu.cn