韓春霞,鄭嘉祺,王 煥,徐凌霄,劉 俊,艾自勝
(同濟(jì)大學(xué)醫(yī)學(xué)院,上海 200092)
髖部骨折是目前許多國家面臨的重要公共衛(wèi)生問題,其有較高的發(fā)病率和死亡率,對個(gè)人和醫(yī)療保健都產(chǎn)生巨大的影響和經(jīng)濟(jì)負(fù)擔(dān)[1-2]。據(jù)估計(jì),到2050年,全球?qū)l(fā)生626萬例髖骨骨折,其中443萬例(71%)將發(fā)生在亞洲和其他的發(fā)展中國家[3]。而股骨頸骨折作為臨床上常見的一種髖部骨折尤其值得關(guān)注,其大約占全部髖部骨折的一半[4]。大多數(shù)患者為保留自身髖部的正常功能會選擇內(nèi)固定作為主要的治療方式。但術(shù)后患者常因嚴(yán)重的并發(fā)癥面臨再次手術(shù)的風(fēng)險(xiǎn),再手術(shù)率為高達(dá)10%~48.8%[5]。術(shù)后常見的并發(fā)癥包括骨折不愈合、股骨頭壞死以及股骨頸短縮等,其中股骨頭壞死是導(dǎo)致再手術(shù)的主要并發(fā)癥,發(fā)生率為10%~45%[6-7]。
機(jī)器學(xué)習(xí)正被應(yīng)用于社會和科學(xué)的各個(gè)領(lǐng)域。而神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)領(lǐng)域的一種數(shù)據(jù)分類算法,具有強(qiáng)大的非線性分類能力,尤其是針對于復(fù)雜的回歸問題[8-9]。神經(jīng)網(wǎng)絡(luò)模擬了生物大腦的模式識別能力,主要由3層組成:輸入層、隱藏層、輸出層,其通過梯度下降的方法使損失函數(shù)達(dá)到最小,從而達(dá)到最佳的預(yù)測效果。本研究將探討神經(jīng)網(wǎng)絡(luò)在預(yù)測股骨頸骨折術(shù)后并發(fā)癥方面的應(yīng)用價(jià)值,為臨床研究和實(shí)踐提供更多的科學(xué)依據(jù)。
收集同濟(jì)大學(xué)附屬同濟(jì)醫(yī)院、同濟(jì)大學(xué)附屬第十人民醫(yī)院、上海交通大學(xué)附屬第六人民醫(yī)院等3家醫(yī)院2013年3月—2017年1月行內(nèi)固定手術(shù)的新鮮股骨頸骨折患者。所有病例股骨頭壞死的診斷依照X線攝片或MRI,X線攝片壞死表現(xiàn)為股骨頭硬化、囊性變、密度不勻等改變,軟骨下出現(xiàn)新月征,股骨頭塌陷變性,髖關(guān)節(jié)間隙變窄;MRI壞死表現(xiàn)為T1出現(xiàn)帶狀低信號、T2出現(xiàn)雙線征,根據(jù)X線攝片和MRI結(jié)果將患者分為壞死組和非壞死組。
納入標(biāo)準(zhǔn):(1) 年齡≥18周歲;(2) 隨訪時(shí)間≥36個(gè)月;(3) 臨床資料完整;(4) 骨折前能獨(dú)立行走無其他損傷傷側(cè)髖關(guān)節(jié)活動(dòng)受限的因素。排除標(biāo)準(zhǔn):(1) 病理性骨折以及假體周圍骨折;(2) 多發(fā)性損傷或合并其他部位的骨折;(3) 有精神疾病或者神志不清楚的患者;(4) 長期使用激素類藥物的患者。
根據(jù)納入排除標(biāo)準(zhǔn),共納入378例股骨頸骨折患者,其中未壞死組295例,壞死組83例。所有患者的基線信息見表1。
表1 股骨頸骨折患者基線信息Tab.1 Baseline information of patients with femoral neck fracture M(P25,P75),[n(%)]
將單因素差異有統(tǒng)計(jì)學(xué)意義的變量Logistic多因素回歸共篩選出8個(gè)變量(表2),分別是BMI、Garden分型、完全負(fù)重時(shí)間、受傷至手術(shù)時(shí)長、VAS評分、術(shù)后錯(cuò)位程度、取不取內(nèi)固定、CCI。
表2 Logistic多因素回歸結(jié)果Tab.2 The results of Logistic regression
3種模型的構(gòu)建均采用SPSS 20.0進(jìn)行構(gòu)建。MLP神經(jīng)網(wǎng)絡(luò)模型最佳參數(shù)設(shè)置:隱藏層數(shù)為2,第一層單位數(shù)為2,第二層單位數(shù)為5,隱藏層和輸出層激活函數(shù)分別為sigmoid和softmax函數(shù)。RBF神經(jīng)網(wǎng)絡(luò)模型最佳參數(shù)設(shè)置:隱藏層數(shù)為1,單位數(shù)為3,隱藏層和輸出層激活函數(shù)分別為標(biāo)準(zhǔn)化徑向基和softmax函數(shù)。
3種模型訓(xùn)練集和測試集預(yù)測性能結(jié)果顯示,MLP神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度(0.940±0.022,0.917±0.013)、精確度(0.878±0.015,0.876±0.017)、召回率(0.828±0.024、0.885±0.018)、F1分?jǐn)?shù)(0.897±0.019、0.938±0.000)以及AUC(訓(xùn)練集:0.940,測試集:0.923)均高于Logistic回歸模型和RSF神經(jīng)網(wǎng)絡(luò)模型,見表3、4及圖1。MLP神經(jīng)網(wǎng)絡(luò)變量重要性圖顯示排名前3的自變量分別是VAS評分、Garden分型、CCI,見圖2。
圖1 訓(xùn)練集和測試集3種模型的ROC曲線圖Fig.1 ROC curves of three models for training and testing cohorts
圖2 MLP神經(jīng)網(wǎng)絡(luò)變量重要性圖Fig.2 The importance plot of variables for MLP neural network
表3 訓(xùn)練集3種模型預(yù)測性能指標(biāo)Tab.3 Prediction performance metrics of three models for the training cohort
訓(xùn)練集和測試集3種模型預(yù)測性能指標(biāo)比較結(jié)果顯示MLP神經(jīng)網(wǎng)絡(luò)在準(zhǔn)確度、精確度、召回率、F1分?jǐn)?shù)以及AUC值等性能指標(biāo)方面的表現(xiàn)均優(yōu)于Logistic和RBF神經(jīng)網(wǎng)絡(luò)模型,各指標(biāo)之間差異有統(tǒng)計(jì)學(xué)意義(P<0.05)見表5、6。
表4 測試集3種模型預(yù)測性指標(biāo)Tab.4 Prediction performance metrics of three models for the testing cohort
表5 訓(xùn)練集3種模型預(yù)測性能指標(biāo)比較Tab.5 Comparison of prediction performance metrics of three models in the training cohort
表6 測試集3種模型預(yù)測性能指標(biāo)比較Tab.6 Comparison of prediction performance metrics of three models in the testing cohort
近年來隨著交通以及建筑行業(yè)的興起,股骨頸骨折的發(fā)生逐漸呈年輕化趨勢,中青年股骨頸骨折患者在術(shù)后易發(fā)生股骨頭壞死,已經(jīng)成為再次手術(shù)的高危人群。目前關(guān)于術(shù)后股骨頭壞死的危險(xiǎn)因素分析,絕大多數(shù)研究[10-13]使用的仍然是傳統(tǒng)Logistic回歸。本研究通過分析378例經(jīng)內(nèi)固定治療的新鮮股骨頸骨折患者的臨床資料和預(yù)后信息,分別使用Logistic回歸、MLP神經(jīng)網(wǎng)絡(luò)以及RBF神經(jīng)網(wǎng)絡(luò)3種方法建立股骨頸術(shù)后并發(fā)癥預(yù)測模型,尋找最佳的預(yù)后預(yù)測方法。
在本研究中,多因素分析結(jié)果顯示,VAS評分、Garden分型、術(shù)后錯(cuò)位程度、髖疏松、CCI、受傷至手術(shù)時(shí)長、BMI、取不取內(nèi)固定等8個(gè)因素與術(shù)后股骨頭壞死相關(guān)(P<0.05)。VAS評分越高,Garden分型等級越高、術(shù)后錯(cuò)位程度越嚴(yán)重、受傷至手術(shù)時(shí)長越長、CCI越低、BMI越高、完全負(fù)重時(shí)間越短以及保留內(nèi)固定的患者術(shù)后更易發(fā)生股骨頭壞死。本研究結(jié)果與國內(nèi)外許多研究一致,一項(xiàng)關(guān)于250例股骨頸骨折患者7.5年的隨訪研究表明,術(shù)后錯(cuò)位程度、Garden分型以及內(nèi)固定取出均是股骨頭壞死重要的危險(xiǎn)因素[14]。Shen等[15]和Lee等[16]的研究顯示,BMI較高的患者,其術(shù)后股骨頭壞死的發(fā)生率也明顯升高,與本研究結(jié)果一致。主要原因可能是BMI較高的患者其對骨折斷端產(chǎn)生的壓力較大,增加了骨折斷端的剪切力和移位程度,會導(dǎo)致血管進(jìn)一步扭曲,這提示臨床上應(yīng)注意對于BMI較高患者的術(shù)后恢復(fù)期間的體重管理。潘顯明等[17]對82例中青年股骨頸骨折患者進(jìn)行研究發(fā)現(xiàn)下地負(fù)重行走時(shí)間越早(<6個(gè)月),股骨頭缺血壞死概率越大,壞死的程度也越重,與本研究結(jié)果一致。因此,對于術(shù)后的患者應(yīng)主張?jiān)缁顒?dòng)晚負(fù)重的理念,來降低術(shù)后股骨頭壞死的發(fā)生率[18]。此外,本研究還發(fā)現(xiàn)VAS疼痛評分以及CCI與術(shù)后股骨頭壞死也有較強(qiáng)的關(guān)聯(lián),這可能主要是由于VAS疼痛評分較高和CCI較低的患者大多為高能量損傷的中青年患者,骨折移位程度較大,血管扭曲損傷程度嚴(yán)重,術(shù)后血運(yùn)難恢復(fù),從而易發(fā)生股骨頭壞死[11,19-20]。同時(shí)本研究顯示受傷至手術(shù)時(shí)間越長,股骨頭壞死發(fā)生的危險(xiǎn)性越高,Jain等[21]的研究發(fā)現(xiàn)受傷至手術(shù)時(shí)長>12 h的患者其術(shù)后股骨頭壞死發(fā)生率明顯高于<6 h的患者,與本研究結(jié)果一致;然而Xu等[22]的一項(xiàng)Meta分析并未發(fā)現(xiàn)受傷至手術(shù)時(shí)長與股骨頭壞死之間存在關(guān)聯(lián),可能是由于各研究人群以及受傷至手術(shù)時(shí)長分組不一致,導(dǎo)致研究存在偏倚,所以受傷至手術(shù)時(shí)長對于股骨頭壞死的影響還需進(jìn)一步深入研究。
神經(jīng)網(wǎng)絡(luò)作為一種非線性分類模型,其通過神經(jīng)元儲存大量的信息,提高了對于數(shù)據(jù)信息的記憶力,便于處理高噪聲的復(fù)雜數(shù)據(jù),從而改善預(yù)測的精度[23-24]。本研究構(gòu)建了MLP和RBF兩種神經(jīng)網(wǎng)絡(luò)模型,研究結(jié)果表明訓(xùn)練集和測試集MLP神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確度、精確度、召回率、F1分?jǐn)?shù)以及AUC值均高于Logistic回歸預(yù)測模型和RBF神經(jīng)網(wǎng)絡(luò)模型(P<0.05),表明MLP神經(jīng)網(wǎng)絡(luò)模型具有良好的表現(xiàn)性能。而且針對于機(jī)器學(xué)習(xí)領(lǐng)域的“黑匣子”問題,本研究通過MLP神經(jīng)網(wǎng)絡(luò)模型對所有變量的重要性進(jìn)行了排序,明確了VAS評分、Garden分型、CCI以及BMI等相關(guān)變量對于預(yù)測股骨頸骨折患者術(shù)后股骨頭壞死方面的重要性,為神經(jīng)網(wǎng)絡(luò)用于個(gè)性化預(yù)測提供了依據(jù)。
本研究仍存在一些不足之處。首先,本研究收集的是上海市3家醫(yī)院的回顧性病例,且陽性樣本量偏少。其次,本研究構(gòu)建的是單層神經(jīng)網(wǎng)絡(luò),導(dǎo)致模型預(yù)測精度有限,后續(xù)應(yīng)嘗試多層甚至更復(fù)雜的模型。最后,研究還存在未被納入的影響因素如營養(yǎng)狀況、骨密度等影響股骨頭壞死的因素。
綜上所述,MLP神經(jīng)網(wǎng)絡(luò)在預(yù)測股骨頸骨折術(shù)后股骨頭壞死方面的預(yù)測效能高于傳統(tǒng)的Logistic回歸,可以為臨床上股骨頭壞死的預(yù)防與診治提供參考依據(jù),協(xié)助臨床醫(yī)生更加精準(zhǔn)的預(yù)測股骨頭壞死的發(fā)生,具有較好的應(yīng)用前景。