甄濤 胡大成 周健 沈起鈞
膝關(guān)節(jié)半月板損傷是指半月板的連續(xù)性和完整性遭到破壞,可由退變或外傷引起,而其損傷程度與骨關(guān)節(jié)炎的嚴(yán)重程度呈正相關(guān)[1-2]。膝關(guān)節(jié)半月板撕裂是一種常見的半月板損傷,每年發(fā)病率高達(dá)(60~70)/10萬[3]。半月板撕裂可以引起膝關(guān)節(jié)的應(yīng)力異常及關(guān)節(jié)內(nèi)環(huán)境的變化,從而引起關(guān)節(jié)軟骨損傷及關(guān)節(jié)交鎖,是導(dǎo)致膝關(guān)節(jié)骨性關(guān)節(jié)炎發(fā)生和發(fā)展的主要危險因素之一[4-5]。因此,早期評估半月板損傷程度,提前進(jìn)行干預(yù),有助于延緩骨關(guān)節(jié)炎的發(fā)展。目前MRI是評估半月板損傷的首選檢查,但由于傳統(tǒng)評估方法仍屬于定性評估,且膝關(guān)節(jié)MRI圖像細(xì)節(jié)較多,且受到主觀因素的影響,組內(nèi)及組間結(jié)果的不統(tǒng)一不可避免[6],另外作為定性診斷其無法對撕裂風(fēng)險度進(jìn)行評估。隨著人工智能的發(fā)展,計算機(jī)輔助診斷系統(tǒng)被用來檢測膝關(guān)節(jié)的異常,以達(dá)到早期診斷和治療的目的[7]。人工智能深度學(xué)習(xí)的方法也已經(jīng)初步在骨關(guān)節(jié)病變的檢測中發(fā)揮作用[8-10]。但多數(shù)針對半月板的研究仍停留于損傷有無的定性評估,且深度學(xué)習(xí)模型解釋性較差,并無可視化的過程[6,9,11]。本研究通過基于多參數(shù)MRI影像組學(xué)特征及臨床特征的列線圖,以可視化的形式對膝關(guān)節(jié)半月板損傷風(fēng)險度進(jìn)行量化,旨在為臨床精準(zhǔn)治療提供更客觀更有效的評估。
1.1 對象 選取2020年11月至2021年11月在浙江大學(xué)醫(yī)學(xué)院附屬杭州市第一人民醫(yī)院行右膝關(guān)節(jié)MRI檢查的患者86例。其中男33例,女53例;年齡12~90(52.9±11.7)歲。按照7∶3的比例進(jìn)行分層抽樣,將86例患者隨機(jī)分為訓(xùn)練組59例,驗證組27例。兩組患者性別、年齡和外傷史等一般資料比較差異均無統(tǒng)計學(xué)意義(均P>0.05),見表1。另選取2020年9月至2021年12月在浙江大學(xué)醫(yī)學(xué)院附屬杭州市腫瘤醫(yī)院(下稱外院)行左膝關(guān)節(jié)MRI檢查的患者30例作為外部驗證,其中男7例,女23例;年齡19~82(57.3±12.6)歲。納入標(biāo)準(zhǔn):(1)有膝關(guān)節(jié)疼痛、活動障礙、關(guān)節(jié)不穩(wěn)或有彈響等癥狀的患者;(2)通過查體發(fā)現(xiàn)可疑半月板損傷的患者;(3)能夠配合MRI檢查的患者。排除標(biāo)準(zhǔn):(1)由膝關(guān)節(jié)骨性關(guān)節(jié)炎、類風(fēng)濕性關(guān)節(jié)炎等導(dǎo)致膝關(guān)節(jié)嚴(yán)重?fù)p壞的患者;(2)有膝關(guān)節(jié)感染及其他系統(tǒng)性疾病的患者;(3)膝關(guān)節(jié)周圍腫瘤累及半月板的患者;(4)由于圖像偽影或者魔角效應(yīng)等導(dǎo)致圖像模糊的患者。本研究經(jīng)浙江大學(xué)醫(yī)學(xué)院附屬杭州市第一人民醫(yī)院醫(yī)學(xué)倫理委員會審批通過[倫理號(2020-150-01)],所有患者或其家屬簽署知情同意書。
表1 訓(xùn)練組和驗證組患者一般資料比較
1.2 臨床資料收集 由同一位骨科醫(yī)生完成,包括患者性別、年齡、外傷史等指標(biāo)。
1.3 MRI掃描方法 使用西門子avanto1.5T MR掃描儀配備膝關(guān)節(jié)專用線圈行膝關(guān)節(jié)掃描,掃描序列包括矢狀位質(zhì)子密度加權(quán)像(proton density weighted image,PdWI)、T1WI及冠狀面PdWI。掃描參數(shù)分別為:T1WI[重復(fù)時間(repetition time,TR)418 ms,回波時間(echo time,TE)11 ms],PdWI(TR 2 810 ms,TE 47 ms),層厚3 mm,層間距0.5 mm,視野170 mm×170 mm;掃描圖像以DICOM格式導(dǎo)出。外院患者使用同型號掃描儀及相同參數(shù)進(jìn)行圖像采集。
1.4 膝關(guān)節(jié)半月板損傷的MRI評價 由2位有10年以上骨肌系統(tǒng)影像診斷經(jīng)驗的高級職稱醫(yī)師根據(jù)Stoller等[12]提出的MRI診斷標(biāo)準(zhǔn)進(jìn)行膝關(guān)節(jié)半月板損傷分級,若存在分歧時,通過與另1位有10年以上骨肌系統(tǒng)影像診斷經(jīng)驗的高級職稱醫(yī)師討論后進(jìn)行診斷。根據(jù)MRI信號將半月板損傷分成Ⅰ~Ⅲ級,Ⅰ級:半月板內(nèi)有1個或多個點狀高信號;Ⅱ級:半月板內(nèi)條狀高信號未達(dá)關(guān)節(jié)面;Ⅲ級:半月板內(nèi)出現(xiàn)條狀或其他復(fù)雜形態(tài)的高信號到達(dá)關(guān)節(jié)面。由于Ⅲ級損傷即半月板撕裂需要手術(shù)治療,而Ⅰ~Ⅱ級損傷未達(dá)到需要手術(shù)治療的程度,因此本研究將Ⅲ級損傷定義為半月板撕裂,Ⅱ級以下?lián)p傷及正常半月板定義為未撕裂。
1.5 圖像勾畫、特征提取及篩選 由2位具有5年以上骨肌影像診斷經(jīng)驗的放射科主治以上職稱醫(yī)師使用聯(lián)影智能科研平臺上的圖像分割軟件手動對膝關(guān)節(jié)MRI的T1WI及PdWI圖像上的半月板進(jìn)行勾畫,沿著半月板邊緣逐層勾畫其感興趣區(qū)(region of interest,ROI),盡量避免將周圍關(guān)節(jié)囊、軟骨及韌帶等組織勾畫其中,并保存勾畫的ROI,勾畫示意圖見圖1-2。勾畫完成后,應(yīng)用平臺上的組學(xué)模塊進(jìn)行特征提取,對2位醫(yī)師所提取的特征進(jìn)行一致性分析,保留組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficients,ICC)≥0.75的特征,然后對其中1位醫(yī)師保留的特征數(shù)據(jù)使用Z值歸一化算法進(jìn)行標(biāo)準(zhǔn)化,通過最小絕對緊縮與選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對各個特征進(jìn)行降維,得到有統(tǒng)計學(xué)意義的影像組學(xué)特征參數(shù),同時計算影像組學(xué)特征參數(shù)分?jǐn)?shù)(Rad-score),基于Rad-score建立影像組學(xué)模型。對每個潛在預(yù)測變量包括性別、年齡、外傷史等進(jìn)行單因素分析及多因素二元logistic回歸分析,最終篩選出獨立危險因素。
圖1 矢狀位質(zhì)子密度加權(quán)像的感興趣區(qū)勾畫示意圖
圖2 感興趣區(qū)的三維容積重建圖像
1.6 模型建立與驗證 將篩選出的獨立危險因素和Rad-score構(gòu)建聯(lián)合模型,并制作列線圖。模型建立之后,使用Hosmer-Lemeshow檢驗分析擬合度。繪制ROC曲線,采用AUC評價各個模型對半月板損傷風(fēng)險度的評估效能。使用決策曲線評估各個模型的凈效益。
1.7 統(tǒng)計學(xué)處理 采用MedCalc 19.1及R 4.1.2統(tǒng)計軟件。符合正態(tài)分布的計量資料以表示,組間比較采用兩獨立樣本t檢驗;不符合正態(tài)分布的計量資料以M(P25,P75)表示,組間比較采用 Mann-WhitneyU檢驗。計數(shù)資料組間比較采用χ2檢驗。訓(xùn)練組和驗證組構(gòu)建的Rad-score對半月板損傷風(fēng)險度的評估效能比較采用Wilcoxon秩和檢驗。采用Hosmer-Lemeshow檢驗分析模型擬合度,P>0.05提示模型擬合較好。繪制決策曲線分析凈效益。模型間AUC的比較采用Delong檢驗。采用ICC評價2位ROI勾畫醫(yī)生的測量一致性,ICC≥0.75為一致性較好。采用Kappa檢驗比較外部驗證數(shù)據(jù)實際結(jié)果與聯(lián)合模型預(yù)測結(jié)果的一致性,Kappa值≥0.75為一致性較好,0.4<Kappa值<0.75為一致性中等,Kappa值≤0.4為一致性較差。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 臨床特征選擇 根據(jù)Stoller等[12]提出的MRI診斷標(biāo)準(zhǔn)將所有患者分為撕裂組50例和未撕裂組36例。撕裂組患者年齡大于未撕裂組,差異有統(tǒng)計學(xué)意義(P<0.01);而兩組患者性別和外傷史比較差異均無統(tǒng)計學(xué)意義(均P>0.05),見表2。經(jīng)多因素二元logistic回歸分析顯示年齡的OR值為1.068,P<0.01,因此篩選出年齡這個獨立危險因素用于建立臨床特征模型,見表3。
表2 撕裂組和未撕裂組患者一般資料比較
表3 患者一般資料的多因素二元logistic回歸分析
2.2 組學(xué)特征篩選及模型建立 兩位ROI勾畫醫(yī)生均提取得到2 475個PdWI和2 475個T1WI特征,其中Pd-WI特征中 ICC≥0.75的特征 2 203個,T1WI特征中ICC≥0.75的特征數(shù)2 251個,對其中1位醫(yī)師提取并保留的所有組學(xué)特征進(jìn)行降維共得到8個PdWI和4個T1WI圖像的影像組學(xué)特征。再用二元logistic回歸對12個特征進(jìn)行進(jìn)一步篩選,最終選定5個特征:包括2個T1WI特征[log_glcm_log-sigma-0-5-mm-3D-JointEntropy(LGLS)和 wavelet_glcm_wavelet-LHH-Idnd2(WGWLI)]和3個PdWI特征[recursivegaussian_gldm_Large DependenceHighGrayLevelEmphasis(RGL)、wavelet_glszm_wavelet-LLL-HighGrayLevelZoneEmphasis(WGWLH)、curvatureflow_gldm_DependenceNonUniformity(CGD)],見圖3-4。
圖3 訓(xùn)練組最優(yōu)特征間的相關(guān)系數(shù)熱圖
圖4 驗證組最優(yōu)特征間的相關(guān)系數(shù)熱圖
按相關(guān)系數(shù)加權(quán)求和得到Rad-score,最終公式為:Rad-score=LGLS×(-0.1408)+WGWLI×(-1.5147)+RGL×2.203 4+WGWLH×0.679 0+CGD×0.632 1+1.486 6?;赗ad-score建立影像組學(xué)特征模型。撕裂組組患者Rad-score為2.58(1.13,6.08),高于未撕裂組的[-0.88(-2.74,0.24)],差異有統(tǒng)計學(xué)意義(Z=5.699,P<0.01);訓(xùn)練組和驗證組患者Rad-score分別為 1.08(-0.50,2.76)和2.41(-1.48,6.22),兩組比較差異無統(tǒng)計學(xué)意義(Z=-1.112,P>0.05)。訓(xùn)練組與驗證組患者半月板損傷程度鑒別的Rad-score比較,差異均有統(tǒng)計學(xué)意義(均P<0.01),見圖5。
圖5 訓(xùn)練組與驗證組的半月板影像組學(xué)特征參數(shù)分?jǐn)?shù)比較
將Rad-score和年齡共2個特征作為評估半月板損傷風(fēng)險度的危險因素進(jìn)行聯(lián)合模型建立,并獲取聯(lián)合模型的列線圖(圖6),實現(xiàn)模型的可視化,該列線圖可以作為指導(dǎo)臨床快速預(yù)測半月板損傷風(fēng)險度的工具。分別繪制臨床模型、影像組學(xué)特征模型及聯(lián)合模型的ROC曲線,見圖7。訓(xùn)練組患者聯(lián)合模型和影像組學(xué)特征模型的AUC均高于臨床模型,差異均有統(tǒng)計學(xué)意義(Z=2.910、1.963,均P<0.05),但聯(lián)合模型和影像組學(xué)模型AUC比較,差異無統(tǒng)計學(xué)意義(Z=0.234,P>0.05),見表4。驗證組患者聯(lián)合模型的AUC最高,臨床模型的AUC最低,但3者兩兩比較(臨床-影像組學(xué)、臨床-聯(lián)合、影像組學(xué)-聯(lián)合),差異均無統(tǒng)計學(xué)意義(Z=0.753、1.197、1.647,均P>0.05),見表5。決策曲線顯示聯(lián)合模型在大部分概率閾值范圍都有最高的凈獲益(圖8)。
圖6 聯(lián)合模型的列線圖
圖7 訓(xùn)練組和驗證組的各個模型的ROC曲線比較
表4 訓(xùn)練組模型間的比較
表5 驗證組模型間的比較
圖8 3種模型的決策曲線圖
2.3 外部數(shù)據(jù)驗證 通過外院30例膝關(guān)節(jié)MRI圖像進(jìn)行聯(lián)合模型的外部驗證,結(jié)果顯示,模型預(yù)測結(jié)果準(zhǔn)確度為0.733(22/30),聯(lián)合模型預(yù)測結(jié)果與膝關(guān)節(jié)半月板實際損傷呈中等的一致性(Kappa=0.467,P<0.01),因此該模型的預(yù)測結(jié)果可以較好反映半月板實際損傷情況,見表6。
表6 外部數(shù)據(jù)驗證模型
本研究建立了一種用于評估膝關(guān)節(jié)半月板損傷風(fēng)險度的臨床-影像組學(xué)聯(lián)合模型,結(jié)果發(fā)現(xiàn)聯(lián)合模型優(yōu)于單獨的臨床模型及影像組學(xué)特征模型,同時制作的決策曲線也顯示聯(lián)合模型較影像組學(xué)特征模型有更好的凈效益,并且本研究通過構(gòu)建列線圖實現(xiàn)了模型可視化。本研究結(jié)果表明,該聯(lián)合模型構(gòu)建的列線圖可以作為半月板損傷風(fēng)險度的定量評估工具,可以一定程度的減少臨床醫(yī)生診斷誤差,提高診斷的準(zhǔn)確性。
目前MRI對膝關(guān)節(jié)半月板的評估主要還停留在定性診斷,而定性診斷往往受多種因素影響。因此,MRI由于其固有的局限性導(dǎo)致了人為判讀的偏差,特別是內(nèi)側(cè)半月板后角的小撕裂和累及不到1/3外側(cè)半月板的撕裂的檢測,是MRI評估的一個盲點[13-14]。在合并前交叉韌帶損傷的患者中,MRI診斷半月板撕裂的準(zhǔn)確性也會降低[11]。另外半月板的特殊解剖結(jié)構(gòu),如膝橫韌帶、腘肌腱等走行不規(guī)則時,也常被誤診為半月板撕裂。半月板的游離緣的纖毛化也常被過度診斷為半月板撕裂。由于每個膝關(guān)節(jié)MRI檢查的圖像的細(xì)節(jié)較多,判讀時容易出現(xiàn)組間及組內(nèi)的一致性差異,即使是獲得認(rèn)證的高級骨肌關(guān)節(jié)放射科醫(yī)生也存在同樣的問題[6,15],因此準(zhǔn)確判讀膝關(guān)節(jié)MRI需要豐富的經(jīng)驗及大量的時間。早在2009年,Ramakrishna等[16]就試圖通過計算機(jī)輔助診斷系統(tǒng)幫助醫(yī)生探查半月板損傷,他們通過對40例膝關(guān)節(jié)可疑損傷患者T1WI的內(nèi)外側(cè)半月板的各一個層面的圖像進(jìn)行半月板的撕裂的評估,得到該系統(tǒng)的靈敏度和特異度分別為83.87%和75.19%,是對人工智能應(yīng)用于半月板損傷的初步探索,但該系統(tǒng)的數(shù)據(jù)只基于二維圖像。本研究的模型基于整個內(nèi)外側(cè)半月板的三維圖像信息,且融合了T1WI及PdWI的影像特征,除了基本的形態(tài)特征,還包括紋理特征、小波特征等內(nèi)在信息。Bien等[6]開發(fā)了一個基于MRI的膝關(guān)節(jié)半月板撕裂檢測深度學(xué)習(xí)模型,該模型的AUC為0.847,靈敏度為74.1%,特異度為71%,靈敏度顯著低于人工判讀結(jié)果,特異度與人工判讀結(jié)果無明顯差異。Roblot等[17]同樣開發(fā)了一個基于神經(jīng)卷積網(wǎng)絡(luò)的算法模型,其AUC為0.94。這些模型的診斷效能與本研究相近或略高,然而其數(shù)據(jù)量卻數(shù)十倍于本研究。深度學(xué)習(xí)與本研究一樣都是構(gòu)建了一個分類模型,然而深度學(xué)習(xí)的解釋性較差,無法對分類的結(jié)果進(jìn)行原因分析,且深度學(xué)習(xí)為確保結(jié)果的準(zhǔn)確性,需要的樣本量巨大,單中心機(jī)構(gòu)難以獨立開展,而且深度學(xué)習(xí)對計算機(jī)硬件及軟件的要求也較高,因此開展及推廣有一定難度。本研究旨在應(yīng)用小樣本量的數(shù)據(jù)構(gòu)建模型,提高模型的普適性。本研究還通過繪制列線圖實現(xiàn)了模型的可視化,通過該列線圖可以實現(xiàn)半月板損傷風(fēng)險度的量化評估。與傳統(tǒng)評估方法相比,它友好的數(shù)字界面,不僅能夠?qū)崿F(xiàn)快速診斷,而且可以賦予半月板一個損傷風(fēng)險的定量值,該數(shù)值越高,患者半月板損傷的風(fēng)險越高。這也使臨床能更容易了解疾病的預(yù)后,并作出相應(yīng)決策[18]。
研究發(fā)現(xiàn)隨著年齡的增長,半月板無癥狀撕裂的發(fā)生率增加,而且通常是水平狀撕裂[13]。這與本研究相符,本研究通過對患者各種臨床因素進(jìn)行二元logistic回歸分析,發(fā)現(xiàn)年齡是導(dǎo)致半月板撕裂的危險因素,撕裂組患者年齡明顯高于未撕裂組。因此雖然單獨的影像組學(xué)特征模型的診斷效能已經(jīng)較高,但年齡這個臨床特征也被納入了診斷模型,以進(jìn)一步優(yōu)化模型,提高診斷效能。本研究聯(lián)合模型訓(xùn)練組診斷準(zhǔn)確度為0.797,驗證組的準(zhǔn)確度為0.889,外部驗證的準(zhǔn)確度也有0.733(22/30),已經(jīng)接近甚至超過了人工診斷的水平。同時本研究模型數(shù)據(jù)全部用的是右膝關(guān)節(jié)的數(shù)據(jù),而外部驗證全部用了左膝關(guān)節(jié)的數(shù)據(jù),提示該模型有較好的泛化能力。
本研究仍存在不足之處:本研究所提取的影像學(xué)數(shù)據(jù)都是手工半自動勾畫,工作量較大,并且目前的數(shù)據(jù)量還不足以使聯(lián)影智能科研平臺的訓(xùn)練模塊通過自主學(xué)習(xí)生成自動分割圖像的模型,隨著未來樣本量的擴(kuò)大,通過聯(lián)影智能科研平臺的訓(xùn)練模塊得到的自主勾畫模型不僅可以較大程度減少工作量,同時可以減少人工誤差。本研究缺少盤狀半月板患者,而盤狀半月板由于其解剖學(xué)變異及紊亂的膠原纖維結(jié)構(gòu),使其更易受到接觸面壓力和剪切力的影響出現(xiàn)退行性改變,因此更易引起半月板撕裂,也是預(yù)測半月板損傷的危險因子之一[19]。另外受限于樣本量的原因,本研究未對撕裂組樣本進(jìn)行撕裂類型的區(qū)分。
綜上所述,本研究獲得了一個聯(lián)合影像組學(xué)特征和臨床危險因素的臨床-影像組學(xué)列線圖,可以作為評估膝關(guān)節(jié)半月板損傷風(fēng)險度的工具,輔助臨床作出治療決策,實現(xiàn)個體化精準(zhǔn)醫(yī)療。