唐 迅,張杜丹,劉曉非,劉秋萍,曹 洋,李 娜,黃少平,竇會東,高 培△,胡永華△
(1. 北京大學公共衛(wèi)生學院流行病與衛(wèi)生統計學系,北京 100191; 2. Cardiovascular Epidemiology Unit, Department of Public Health and Primary Care, University of Cambridge, Cambridge CB1 8RN, United Kingdom; 3. 北京市房山區(qū)疾病預防控制中心,北京 102446; 4. 北京市房山區(qū)第一醫(yī)院,北京 102400)
腦卒中目前在全球范圍內位列第三位死因,也是中國人群的首位死因,并且隨著我國人口老齡化進程的加速發(fā)展,有效預防腦卒中等心血管病已成為重要的公共衛(wèi)生問題之一[1-2]。心血管病預防實踐的進展很大程度上得益于對多種危險因素的綜合風險評估,采用準確的預測工具可以更好地開展風險分層,進而針對不同風險水平的對象,制訂相應的綜合干預或危險因素管理方案,這對于降低心血管病在人群中的總體風險具有重要的公共衛(wèi)生學意義。基于該策略開發(fā)的各類風險預測模型用于風險評估和分層干預已被多個西方發(fā)達國家的心血管病一級預防指南廣泛接受和應用[3]。2017年美國弗明漢研究更新了改良的弗明漢腦卒中風險評分(Framingham stroke risk profile, FSRP), 用于預測5年和10年腦卒中發(fā)病風險[4];2019年中國動脈粥樣硬化性心血管疾病風險預測研究(prediction for atherosclerotic cardiovascular disease risk in China, China-PAR)也新開發(fā)了適用于中國人群的China-PAR腦卒中模型[5]。對上述最新發(fā)表的預測模型進行外部驗證,將會直接影響到風險評估工具的推廣和應用,因此本研究在中國北方農村人群的前瞻性隊列中,獨立驗證并比較FSRP和China-PAR腦卒中模型的預測準確性,為預測模型在一級預防中實際應用的評價提供證據。
本研究是一項以人群為基礎的前瞻性隊列研究,采用整群抽樣的方法選取了北京房山農村社區(qū)32個行政村登記的40歲及以上常住戶籍居民,2010年6月至8月開展的基線調查中共計7 577人完成了心血管疾病及其相關危險因素的收集,包括完整的問卷調查、體格檢查和生化檢測[6]。后期隨訪工作包括每年的電話隨訪和每3年1次的現場隨訪,結合該地區(qū)的監(jiān)測系統(包括健康檔案和死因監(jiān)測等常規(guī)監(jiān)測以及村醫(yī)提供的隨訪事件線索的定向監(jiān)測),對冠心病、腦卒中、糖尿病、高血壓及惡性腫瘤等主要慢性疾病的發(fā)病和死亡事件進行追蹤調查,并通過連接醫(yī)療保險數據庫和該地區(qū)主要二級醫(yī)院的電子病歷檔案中的住院及死亡數據進行診斷核實。最近一次現場隨訪時間為2016年8月,電話隨訪時間為2017年1月,醫(yī)療保險和電子病歷數據庫記錄核查時間為2017年1月[7]。由于目前隊列人群的隨訪周期未到10年,依照國際慣例[4-5]本研究將對基線無冠心病、腦卒中及心力衰竭病史的40~79歲人群進行5年腦卒中發(fā)病風險預測模型的評估。根據納入、排除標準,本研究的研究對象選擇流程如圖1所示,共有6 483名研究對象進入最終的統計分析。本研究已通過北京大學生物醫(yī)學倫理委員會的批準(IRB00001052-16013), 所有研究對象調查前均書面簽署知情同意書。
參照FSRP[4]及China-PAR研究[5]的預測模型中納入的變量及定義,本研究中腦卒中事件的定義主要包括腦卒中(ICD-10編碼為I60~I64, I67, I69)的發(fā)病和死亡。腦卒中定義為急性進行性的血管源性的中樞神經系統局灶性或大范圍的功能障礙(包括出血性、缺血性腦卒中)超過24 h,且必須經過二級及以上醫(yī)院CT或磁共振成像確診。問卷調查中,父母腦卒中家族史定義為研究對象的親生父母中至少一人有腦卒中病史;吸煙定義為平均每天吸紙煙1支(或采用其他吸煙方式消耗相當于1支紙煙的煙草量)及以上,并已持續(xù)1年及以上;糖尿病定義為空腹血糖水平≥7.0 mmol/L,或2 h口服葡萄糖耐量試驗≥11.1 mmol/L,或有明確的糖尿病病史并在接受降糖藥物治療;高血壓治療定義為調查前兩周內規(guī)律服用降壓藥物進行治療;心房顫動定義為既往心電圖或24 h動態(tài)心電圖記錄到的P波消失代之以小而不規(guī)則的f波(頻率350~600次/min),且心室率絕對不規(guī)則。體格檢查過程中,血壓、身高、體質量、腰圍、心電圖等指標采用標準、規(guī)范的方法進行測量。空腹抽取靜脈血,血脂生化指標使用7060型全自動生化分析儀(日本HITACHI公司)進行血清學檢測。
調查前對所有調查員集中進行統一培訓;現場調查過程中由質控員核查全部問卷和體檢表的完整性,并抽取1%復核其完整性、有效性;在結局事件的隨訪和確認方面,通過監(jiān)測系統、電話和現場隨訪以及已覆蓋99%以上人群的醫(yī)療保險系統可以有效減少低估或遺漏結局事件的發(fā)生,并且通過醫(yī)院數據庫的核查確診可以降低高估結局事件的風險。生化檢測符合北京市臨床檢驗中心臨床檢驗室間質量評價標準,具有嚴格的實驗室內和實驗室間的質量控制措施;數據錄入過程中使用Epidata 3.0軟件進行平行雙錄入,并設置邏輯核查。
基線數據中連續(xù)變量用均數±標準差表示,分類變量用百分比(%)表示,對非正態(tài)分布資料用對數轉換后進行統計學檢驗,均為雙側檢驗,顯著水平為α=0.05,連續(xù)變量和分類變量分別采用t檢驗和卡方檢驗比較不同性別之間各模型預測變量的基線差異。5年腦卒中發(fā)病風險評分的預測值分別采用China-PAR腦卒中模型[5]和美國FSRP[4]中各自的公式和參數分性別進行計算,保持預測變量的系數不變,采用本隊列人群基線時危險因素水平以及腦卒中發(fā)病風險的均值進行再校準(recalibration),便于模型比較。腦卒中發(fā)病風險預測模型的驗證包括區(qū)分度(discrimination)和校準度(calibration)的評估[8],區(qū)分度是反映預測模型的風險評分能夠正確區(qū)分早發(fā)病者為高風險,通常采用C統計量(Harrell’sCstatistics)評估受試者特征曲線的曲線下面積,一般認為0.7以上較好;校準度是衡量預測模型估計的絕對風險的預測值與觀察到的實際情況之間擬合的一致程度,通常采用Hosmer-Lemeshow檢驗評價預測模型的校準度,按照風險評分的預測值分為10組進行比較并作圖表示,總體χ2<20表示校準度好。觀察到的5年腦卒中事件實際發(fā)生數通過Kaplan-Meier分析獲得,根據每個研究對象生存時間的順序從小到大排列,直接采用條件概率及概率乘法原理估計研究對象5年后仍然未出現結局事件的累積概率,用(1-累積概率)×總人數即可得到結局事件的實際發(fā)生數,該方法調整了刪失數據對結局事件發(fā)生數的影響。計算預測風險與實際發(fā)病率的比值(expected-observed ratio, EOR),比值為1表示預測準確,EOR>1表示高估風險,EOR<1表示低估風險[9]。采用Stata 16軟件進行統計分析。
本研究隊列中40~79歲基線無心血管病史的研究對象共6 483人,平均隨訪時間為(5.83±1.14)年,共計37 778.91人年,研究人群的平均年齡(55.4±8.8)歲,34.2%為男性(2 215/6 483),基線特征如表1所示??傮w而言,男性比女性具有更高的吸煙率和血壓水平,但高血壓治療率以及血脂水平低于女性(P<0.05)。在平均(5.83±1.14)年的隨訪周期內,共發(fā)生438例腦卒中結局事件(其中男性202例,女性236例),經過Kaplan-Meier方法調整后的5年腦卒中事件發(fā)生率也是男性高于女性,提示各類主要的心血管病危險因素以及結局事件均存在明顯的性別差異,風險預測模型需分性別進行評估。
SBP, indicates systolic blood pressure; DBP, diastolic blood pressure; HDL-C, high-density lipoprotein cholesterol; a, to convert total cholesterol and HDL-C to mmol/L, multiply by 0.025 9.
與Kaplan-Meier方法調整后的5年腦卒中實際發(fā)生數(136.1)相比,在男性中再校準后的China-PAR(130.3)和FSRP(125.6)模型均顯示預測準確性較好,且China-PAR腦卒中模型更好(表2);進一步計算EOR發(fā)現各模型在男性中均提示稍有低估,相比于FSRP模型風險低估的 7.7%,China-PAR僅低估了4.3%。在男性中,China-PAR和FSRP模型區(qū)分度的C統計量均高于 0.7,提示兩個模型的區(qū)分度均較好,并且兩個模型的校準度也均顯示總體預測準確性較好(P>0.05)。
表2 研究人群中China-PAR和FSRP模型分別用于5年腦卒中風險預測的外部驗證及比較
a, actual number of stroke events through follow-up; b, observed number of stroke events after Kaplan-Meier adjustment through follow-up; c, expected number of events based on the five-year stroke prediction models through follow-up. China-PAR, prediction for atherosclerotic cardiovascular disease risk in China; FSRP, Framingham stroke risk profile;CI, confidence interval.
如圖2所示,根據十等分的風險分組,在預測風險最高的第10組,在男性中China-PAR模型僅低估了 4.4%,但FSRP模型反而高估了14.9%。校準圖(圖3)也發(fā)現在男性中FSRP模型偏離45°的校準線,而且預測風險越大偏離越遠;而China-PAR模型校準度較好。因此,在男性中China-PAR比FSRP模型外部驗證的預測準確性更好。
在女性中再校準后的China-PAR和FSRP模型的驗證均顯示了預測風險的高估(表2), China-PAR模型在預測女性風險方面高估了11.6%,而FSRP模型高估了30.0%。在女性中,China-PAR和FSRP模型的C統計量均高于0.7,提示兩個模型的區(qū)分度均較好,但China-PAR模型(P=0.188)在女性中的校準度優(yōu)于FSRP模型(P=0.004)。
十等分的風險分組圖(圖2)顯示,在女性中預測風險最高的第10組,China-PAR和FSRP模型的預測風險分別高估了20.5%和90.0%。校準圖(圖3)也提示女性中FSRP模型在最高風險組偏離45°的校準線較遠,因此,在女性中China-PAR模型外部驗證的預測準確性也優(yōu)于FSRP模型。
對風險預測模型的校準和對人群絕對風險的準確評估將直接影響到心血管病一級預防的風險分層及后續(xù)干預[3]。2019年最新發(fā)布的《中國心血管病風險評估和管理指南》正式推薦采用China-PAR模型對35歲及以上存在心血管病危險因素的個體進行風險評估(Ⅰ類推薦,C級證據)[10]。本研究組前期在中國北方農村人群的前瞻性隊列中驗證了China-PAR模型的預測準確性,發(fā)現China-PAR模型對于中國人群5年心血管病發(fā)病風險的預測優(yōu)于美國的匯總隊列公式,特別是在男性中更準確[7]。值得注意的是,雖然該結果與已報道的多數驗證研究一致[9],再校準后的China-PAR模型和匯總隊列公式都出現了不同程度的風險高估,考慮到中國人群腦卒中高發(fā)的特點,以及本研究人群屬于中國北方“腦卒中帶(stroke belt)”的高危人群的情況,在高危人群中仍然出現高估風險提示需要進一步建立針對中國人群腦卒中的風險預測模型。2019年最新發(fā)表的China-PAR腦卒中模型[5]是特別針對中國人群腦卒中風險預測而開發(fā)的,但目前尚未有研究進行獨立外部驗證的報道。本研究進一步在上述人群中同時比較了China-PAR腦卒中模型和國外經典的FSRP模型的預測準確性,發(fā)現China-PAR對于中國人群5年腦卒中發(fā)病風險的預測優(yōu)于FSRP模型,特別是在男性中更準確。
國外廣泛使用的FSRP模型最初建立于1991年,考慮到原有模型的陳舊數據不能反映當前高血壓、糖尿病和吸煙等腦卒中危險因素流行情況的變化,2017年美國弗明漢心臟病研究(Framingham Heart Study)發(fā)布了更新的FSRP模型[4],并分別在法國三城市研究(3 cities study)和美國腦卒中地理和種族差異原因研究(reasons for geographic and racial differences in stroke, REGARDS)的兩個隊列中進行了驗證。三城市研究在1999—2001年選取了2 949名年齡在65歲及以上的基線無心血管病史的法國人群,FSRP在該研究的低風險歐洲人群中預測腦卒中10年風險的準確性一般,在男性和女性中的區(qū)分度C統計量分別為0.70和0.72,校準度卡方值分別為12.5和6.5,與本研究結果基本一致。但考慮到三城市研究的樣本量較小且入選人群年齡偏大,美國“腦卒中帶”高風險人群的REGARDS研究更具有借鑒意義。REGARDS前瞻性隊列在2003—2007年共納入10 808例年齡在55歲及以上的基線無心血管病史的美國白人和黑人,驗證結果顯示FSRP高估了腦卒中的5年發(fā)病風險,特別是在腦卒中發(fā)病風險更高的黑人中。FSRP在男性和女性中的區(qū)分度C統計量分別為0.66和0.71,校準度卡方值分別為30.6和90.3,提示FSRP在“腦卒中帶”人群中的驗證效果還有待改善。
目前有關FSRP模型在其他人群中驗證的報道較少,美國多種族動脈粥樣硬化研究(multi-ethnic study of atherosclerosis, MESA)[11]對6 712名基線無心血管病史的多種族人群平均隨訪10.7年發(fā)現,FSRP模型對腦卒中10年風險預測具有較好的準確性,C統計量為0.716,校準度卡方值為6.55(P=0.59)。來自歐洲人群的鹿特丹研究(Rotterdam study)[12]也驗證了腦卒中10年發(fā)病風險的FSRP模型,該研究從2002—2006年共納入7 966例55歲及以上的基線無心血管病的荷蘭人,研究對象平均年齡69.5歲,58.9%為女性,結果顯示校準度男性(χ2=22.2)優(yōu)于女性(χ2=36.4),而區(qū)分度相反,C統計量在男性和女性分別為0.68和0.74。由于疾病譜、危險因素流行情況等差異,FSRP模型在不同人群中的驗證結果并不一致,本研究結果也提示國外隊列開發(fā)的預測工具可能并不適用于中國人群。
作為China-PAR腦卒中模型的原始驗證隊列之一,中國代謝綜合征社區(qū)干預研究(community intervention of metabolic syndrome in China, CIMIC)[5]同時比較了China-PAR腦卒中模型和FSRP模型預測5年腦卒中發(fā)病風險的準確性,結果也顯示在區(qū)分度和校準度方面China-PAR優(yōu)于FSRP模型,CIMIC研究隊列中China-PAR模型預測風險(男性高估12.9%,女性高估26.7%)優(yōu)于FSRP模型(男性低估43.1%,女性低估 50.7%)。與本研究前期結果[7]類似,后續(xù)研究仍需要重點考慮在女性人群的風險預測模型中加入相關預測因素。本研究的局限性包括由于隨訪時間有限僅驗證了5年發(fā)病風險,但腦卒中結局事件發(fā)生隨時間的變化并非簡單的線性關系,5年和10年發(fā)病風險預測模型驗證結果的差異仍需要通過進一步隨訪并在后續(xù)研究中繼續(xù)驗證。另外,由于本研究人群僅是中國北方“腦卒中帶”的農村人群,結論的外推性受限,China-PAR原始模型在南方或城市人群中的預測準確性仍需要在其他研究中進一步獨立驗證。
綜上所述,本研究提示China-PAR腦卒中模型對于中國北方農村人群5年腦卒中發(fā)病風險的預測優(yōu)于FSRP模型,特別是在男性中更準確。采用準確適合的風險預測工具進行人群腦卒中的風險評估,將對進一步完善心血管病一級預防策略具有重要的公共衛(wèi)生學意義。