賀倩倩 張軍鋒
【提 要】 目的 探討心血管疾病與骨關(guān)節(jié)炎疾病患病情況之間的相關(guān)性,進而評價傾向評分匹配法在橫斷面資料處理中的應(yīng)用價值。方法 對山西省陽城縣和偏關(guān)縣農(nóng)村社區(qū)7126名16歲以上常住居民進行心血管疾病與骨關(guān)節(jié)炎的相關(guān)調(diào)查,根據(jù)心血管患病情況分為2組進行比較;利用Stata14.0對組間協(xié)變量進行傾向評分卡鉗匹配,計算2組的傾向評分,對匹配前后心血管疾病組與非心血管疾病組發(fā)生骨關(guān)節(jié)炎的危險性進行評估。結(jié)果 心血管疾病組與非心血管疾病組各有1123例匹配成功,匹配前2組骨關(guān)節(jié)炎患病率比較差異有統(tǒng)計學(xué)意義(P<0.001);經(jīng)傾向評分匹配后,年齡、性別、職業(yè)、口味、BMI、吸煙情況等協(xié)變量達到了均衡,2組骨關(guān)節(jié)炎患病率比較差異仍有統(tǒng)計學(xué)意義(P<0.001)。 結(jié)論 心血管疾病與骨關(guān)節(jié)炎患病之間有一定的相關(guān)性,但具體機制仍需進一步的研究證實。傾向評分匹配法能有效降低觀察性研究組間的混雜偏倚,在橫斷面資料數(shù)據(jù)處理中有廣闊的應(yīng)用前景。
隨著人口老齡化問題的日益加重,心血管疾病(CVD)、骨關(guān)節(jié)疾病(OA)等慢性非傳染性疾病的患病率逐年升高,Hochberg 等[1]研究發(fā)現(xiàn),在心血管疾病的合并癥中伴有骨關(guān)節(jié)炎的患者比無骨關(guān)節(jié)炎的患者更容易患高血壓(40% vs 25%)。美國一項關(guān)于關(guān)節(jié)炎流行率、危險因素分析以及與心血管疾病關(guān)聯(lián)性的研究也表明,在一般人群中CVD與OA密切相關(guān)[2]。目前關(guān)于CVD和OA相關(guān)性的研究甚少,且大多來自臨床試驗,混雜因素較多難以控制,其結(jié)論存在一定爭議[3]。而觀察性研究具有特征客觀,對目標(biāo)人群不采取干預(yù)措施,納入和排除標(biāo)準(zhǔn)相較于隨機對照試驗來說相對寬泛等優(yōu)點,使其研究結(jié)果外推性更強,更具有說服力。但是在觀察性研究中也存在著許多缺陷,例如研究對象無法實現(xiàn)隨機化分組,研究中不可避免存在大量偏倚等問題都影響著研究結(jié)果的準(zhǔn)確性[4]。而傾向評分法(propensity score,PS)以其運用簡單方便、不增加匹配難度、研究步驟標(biāo)準(zhǔn)化程度高等優(yōu)勢被廣泛地應(yīng)用于大量的非隨機化研究中[5]。本研究應(yīng)用傾向評分法對山西省農(nóng)村地區(qū)骨關(guān)節(jié)炎流行病學(xué)調(diào)查資料進行了分析,以探討CVD與OA患病情況之間的相關(guān)性,進而評價傾向評分法在橫斷面資料處理中的應(yīng)用價值。
數(shù)據(jù)來源于山西省農(nóng)村社區(qū)人群骨關(guān)節(jié)疾病流行病學(xué)調(diào)查資料,調(diào)查點位于山西省陽城縣和偏關(guān)縣,對當(dāng)?shù)剞r(nóng)村社區(qū)16歲以上常住居民進行有關(guān)心血管疾病與骨關(guān)節(jié)炎的流行病學(xué)調(diào)查。所有參與者在問卷調(diào)查前均要簽署知情同意書。根據(jù)實際調(diào)查情況,共收集到7126份合格資料。
膝骨關(guān)節(jié)炎診斷采用美國風(fēng)濕病學(xué)會(ACR)1986年標(biāo)準(zhǔn),手和髖骨關(guān)節(jié)炎采用ACR 1990年和1991年標(biāo)準(zhǔn)。其他部位骨關(guān)節(jié)炎采用臨床癥狀加X線標(biāo)準(zhǔn)。本研究所指的心血管疾病主要包括高血壓病、高脂血癥和冠狀動脈粥樣硬化[6]。
傾向評分法由 Rosenbaum 和 Rubin 在 1983年首次提出,是將研究中所有的混雜因素或協(xié)變量綜合成一個變量,使對照組和處理組達到均衡化,從而減少研究中的偏倚[7]。
(1)傾向評分法的基本原理
傾向評分的定義為:在給定一組變量(xi)條件下,將任意一個研究對象i(i=1,2,…,N)劃分到處理組(Zi=1)或者對照組(Zi=0)的條件概率。也就是說傾向評分,即P(x)是所有觀察到的協(xié)變量的函數(shù),表示處理組(Z=1)和對照組(Z=0)的分布情況。
為了使傾向評分得到正式有效的調(diào)整,必須考慮處理組的樣本分布情況,因此將第i個研究對象被分配到處理組的概率可以表達為:
e(xi)=P(Zi=1|xi)
假設(shè)分組變量Zi與特征變量xi相互獨立,則對任意一個觀察變量xi:
其中,e(xi)即P,被稱為傾向評分[8]。
可以具體解釋為P(x)為經(jīng)模型計算得出的傾向評分理論值,Z為處理變量,即研究中存在的混雜因素,當(dāng)Z=1時表示樣本接受處理。假設(shè)處理組研究對象為i,那么P(xi)=P(Z=1|xi);對照組研究對象為j,那么P(xj)=P(Z=1|xj),當(dāng)P(xi)=P(xj),即處理組與對照組的傾向性評分相同或相近時,可認(rèn)為兩組的混雜因素相同,以此保證研究的均衡性。但是當(dāng)研究中某些重要的混雜因素未納入到傾向評分模型中時,傾向評分法的應(yīng)用可能會受到一定的限制。在實際研究中,協(xié)變量的入選不僅僅要根據(jù)統(tǒng)計學(xué)顯著性來判定,更重要的是要根據(jù)臨床專業(yè)知識和經(jīng)驗盡可能全面收集混雜因素。
(2)研究方法
傾向評分法可大致分為四種,分別是匹配法、分層法、協(xié)變量調(diào)整法和加權(quán)法[9]。這四種方法因其各自特點不同,在各種研究中都有著不同程度的應(yīng)用。其中大多數(shù)的醫(yī)學(xué)研究常采用傾向評分匹配法。而匹配法又具體分為最近鄰匹配法(nearest-neighbor matching)、卡鉗匹配(caliper matching)、分層匹配法(stratification matching)、基于馬氏距離的匹配法等方法[9]。本研究主要采用卡鉗匹配的方法對兩組間個體進行匹配。
(3)卡鉗匹配的具體步驟
①以分組變量及心血管的患病情況為因變量,協(xié)變量及研究中基于基線信息中可能的混雜因素(年齡、性別、BMI、口味、職業(yè)等) 為自變量,通過logistic模型計算每個心血管疾病患者的PS得分;
②以傾向評分為依據(jù),采用卡鉗匹配。首先隨機排列處理組與對照組成員,選擇第一個處理組成員i,如果i與對照組成員j之間的傾向值差的絕對值落入預(yù)先設(shè)定的卡尺范圍ε,且此差值的絕對值是該卡尺范圍內(nèi)i和其他j形成所有配對的傾向值差的絕對值中最小的一個,那么,j就可以作為i的一個匹配。
③檢驗組間匹配效果,即協(xié)變量的均衡性比較,對于定量資料采用t檢驗,對于定性資料采用χ2檢驗;
④對匹配后的數(shù)據(jù)進行統(tǒng)計分析,研究心血管疾病的發(fā)生與骨關(guān)節(jié)炎之間的聯(lián)系。
建立Epidata 3.1數(shù)據(jù)庫,錄入采用雙人雙份錄入的方式,嚴(yán)格進行質(zhì)量控制。形成規(guī)范的數(shù)據(jù)集后再利用Stata14.0對組間協(xié)變量進行PS卡鉗匹配,然后進行相應(yīng)的統(tǒng)計學(xué)分析,即定量資料采用t檢驗,定性資料采用χ2檢驗,以P<0.05為差異有統(tǒng)計學(xué)意義。
此次兩地調(diào)查的有效人數(shù)為7126例,其中男性3609例(占50.6%),女性3517例(占49.4%);平均年齡為43.90±16.56歲(范圍為16~90歲)。陽城縣調(diào)查人數(shù)為4378例,偏關(guān)縣調(diào)查人數(shù)為2748例。
傾向評分匹配前,心血管疾病患者有1734例,未患該病者有5392例;兩組協(xié)變量資料中年齡、性別、BMI、吸煙、取暖設(shè)備、職業(yè)等的比較差異有統(tǒng)計學(xué)意義(P<0.05);通過傾向評分法對組間數(shù)據(jù)進行卡鉗匹配后,兩組各有1123例,成功匹配率為31.52%;傾向評分匹配后,協(xié)變量年齡、性別、BMI、吸煙、取暖設(shè)備、職業(yè)等在組間分布均達到均衡(P>0.05),結(jié)果見表1、表2。
表1 傾向評分匹配前后協(xié)變量分布
*:定量變量資料采用t檢驗
傾向評分匹配前,心血管疾病組中骨關(guān)節(jié)炎的患病率高達47.6%;而在未患心血管疾病組中,只有22.3%的居民患骨關(guān)節(jié)炎;經(jīng)χ2檢驗得出心血管疾病與骨關(guān)節(jié)炎相關(guān)性有統(tǒng)計學(xué)意義(P<0.001)。經(jīng)傾向評分處理后,心血管疾病組骨關(guān)節(jié)炎的患病率為64.4%,對照組中患病率為54.7%,檢驗得出心血管疾病與骨關(guān)節(jié)炎相關(guān)性仍有統(tǒng)計學(xué)意義(P<0.001),結(jié)果見表3。
20世紀(jì)90年代,傾向評分法日益受到人們的關(guān)注。相對于樣本量較少、花費上漲的隨機化試驗,觀察性研究應(yīng)用傾向評分均衡組間協(xié)變量的不均衡性不失為一種好的方法[9]。PS特別適用于大樣本的觀察性的研究,近年來國內(nèi)醫(yī)學(xué)界應(yīng)用傾向評分法的研究越來越多,主要應(yīng)用于非隨機干預(yù)研究資料、觀察性研究中的病例對照研究、隊列研究等,但在橫斷面研究方面鮮有應(yīng)用。橫斷面研究是流行病學(xué)研究中重要的方法之一,不經(jīng)過處理的橫斷面資料直接進行統(tǒng)計分析得出的統(tǒng)計結(jié)論錯誤率較高,主要原因是混雜因素的干擾導(dǎo)致偏倚的存在,但經(jīng)PS處理后,可以明顯降低結(jié)論出現(xiàn)錯誤的概率。若PS模型中包含了所有的混雜因素,那么我們就可以得到平均處理效應(yīng)的無偏估計, 相當(dāng)于“事后隨機化”[10]。但其局限性也在于能平衡已知的混雜因素,對于某些未知的混雜變量仍然會對研究的最終結(jié)果造成一定的影響。
*:定性變量資料采用χ2檢驗。
表3 心血管疾病與骨關(guān)節(jié)炎患病關(guān)系(n,%)
眾所周知,OA是一種高度流行的慢性病,是導(dǎo)致老年人致殘的主要疾病。CVD是全球?qū)е滤劳龅念^號殺手[11]。近年來,關(guān)于OA與CVD相關(guān)性的研究也逐漸增加,但是大多數(shù)研究是依據(jù)收集到的資料直接進行分析比較,并未考慮到兩組協(xié)變量之間的均衡性,其是否存在內(nèi)部聯(lián)系還存在爭議。本文主要通過比較心血管患者與非患者間骨關(guān)節(jié)炎的患病頻率來評價CVD與OA患病之間的關(guān)系。原始數(shù)據(jù)直接分析結(jié)果表明CVD與OA相關(guān)性有統(tǒng)計學(xué)意義,經(jīng)過傾向評分處理后,均衡掉基線資料的11個不均衡的影響因素,結(jié)果顯示CVD與OA相關(guān)性仍有統(tǒng)計學(xué)意義,說明CVD與OA之間存在相關(guān)性。
CVD發(fā)生導(dǎo)致OA患病風(fēng)險增加的一種可能的解釋是這兩種疾病具有共同的危險因素,例如年齡、吸煙和飲酒等因素[12]。本研究中均衡了心血管疾病組與對照組在這些因素間的不平衡性后,仍觀察到兩種疾病間存在相關(guān)性。同時Pfister[13]等人的隊列研究對這些因素和其他明確的心力衰竭的危險因素進行校正后,仍能觀察到在骨密度和心力衰竭風(fēng)險之間存在著顯著的相關(guān)性;因此,傳統(tǒng)的危險因素似乎沒有促成所觀察到的相關(guān)性。
對研究結(jié)果的另一種解釋是共同的潛在的生物學(xué)進程可能導(dǎo)致了CVD和OA的伴隨發(fā)生。在Rahman[14]等人在心血管疾病患者導(dǎo)致骨關(guān)節(jié)疾病的前瞻性縱向研究中發(fā)現(xiàn),OA的發(fā)生與CVD的患病風(fēng)險增加有關(guān)。但是Hoeven[15]等人發(fā)現(xiàn),在年齡大于55歲的4868名受試者中,OA與CVD沒有顯著性關(guān)聯(lián),即說明CVD沒有使其發(fā)生OA的風(fēng)險增加。對于這些研究之間存在的差異性,可能存在以下一些原因:首先,在這些研究中,參與者的年齡存在著差異性;第二,CVD的判斷標(biāo)準(zhǔn)不同導(dǎo)致不同的結(jié)果;第三,診斷臨床OA的標(biāo)準(zhǔn)不同也可能導(dǎo)致不同的結(jié)果;最后,這些研究中都未提及參與者身體素質(zhì)的水平以及使用藥物的情況,這些因素可能是估計OA與CVD之間相關(guān)性的重要因素。
綜上所述,本研究結(jié)果提示心血管疾病與骨關(guān)節(jié)炎患病之間有一定的相關(guān)性,但具體機制仍需進一步的研究證實。就本研究而言,其不足主要表現(xiàn)為無法保證已完全排除所有可能存在的混雜因素,仍需進一步進行多地區(qū)大樣本調(diào)查研究以明確CVD與OA之間的關(guān)系。但可以確認(rèn)的是傾向評分匹配法能有效降低觀察性研究組間的混雜偏倚,在橫斷面資料數(shù)據(jù)處理中有廣闊的應(yīng)用前景。