謝婷婷,劉想,林子楹,張曉東,張耀峰,張大斗,成官迅,王霄英
Couinaud’s肝段分類系統(tǒng)是目前最為廣泛使用的肝段劃分方法[1-2],是肝臟占位病變的定位基礎,也用于計算剩余肝臟體積百分比(Future liver remnant,F(xiàn)LR %),進而評估手術可行性。目前,肝段體積測量和FLR %評估主要依賴于外科醫(yī)生在后處理工作站上“虛擬切除”目標肝段后獲得[3-4],臨床應用受限、耗時較長。實現(xiàn)肝段的自動分割、體積測量及FLR %評估已成為臨床需求。
近年來通過深度學習實現(xiàn)CT圖像上肝臟分割已有報道[5-7],但肝段分割、體積測量乃至進一步運用到術前FLR %評估罕見。本研究基于U形全卷積神經網絡(U-shaped fully convolutional neural network,U-Net),使用肝臟增強CT薄層圖像訓練深度學習模型,并驗證其準確性,旨在探討此模型植入臨床工作中的可行性。
本研究獲得北京大學第一醫(yī)院、北京大學深圳醫(yī)院倫理審查委員會的批準[2019(169)、2021(071)]。本研究為回顧性研究,按照北京大學第一醫(yī)院AI項目研發(fā)規(guī)范進行。
1.用例定義
根據本單位AI項目管理方法,首先定義研發(fā)增強CT薄層圖像Couinaud’s肝段分割模型用例(Use Case)。分割模型的目標對象定義為增強CT薄層圖像上基于Couinaud’s分類系統(tǒng)的肝段。AI模型的預測結果(即8個獨立的Couinaud’s肝段及肝段體積)用于半肝切除術(右半肝切除術、擴大右半肝切除術、左半肝切除術、擴大左半肝切除術)相應FLR %的計算。AI模型提供的數(shù)據包括8個獨立的Couinaud’s肝段分割結果及體積。
2.研究隊列的建立
回顧性收集2017年1月至2019年2月在北京大學第一醫(yī)院(醫(yī)學中心A)行腹部CT增強掃描連續(xù)病例的資料,為增加模型適用性,納入多種肝臟背景。病例納入標準:CT報告診斷為“肝臟未見異?!薄ⅰ爸靖巍奔啊案斡不闭?。病例排除標準:①直徑≥2 cm的肝臟占位;②肝臟術后、先天性肝葉缺如等導致的肝臟形態(tài)異常;③肝靜脈或門靜脈三級分支及以上顯示不清;④肝臟分割結果不滿意?;仡櫺允占?021年1月至2021年6月在北京大學深圳醫(yī)院(醫(yī)學中心B)行腹部CT增強掃描的連續(xù)病例資料,納入CT報告診斷為“肝臟未見異?!薄⑴懦龢藴释息邰艿牟±?。醫(yī)學中心A、B分別納入170例、50例(分別定義為數(shù)據集A、B,圖1)。
圖1 本研究納排標準。
3.CT檢查方法
醫(yī)學中心A、B所使用的掃描儀器、掃描參數(shù)見表1。
表1 醫(yī)學中心A、B所使用的掃描儀器及掃描參數(shù)
肝臟增強掃描對比劑為優(yōu)維顯(碘含量370 mg/mL),采用高壓注射器經肘前靜脈注射,劑量1.5~2.0 mL/kg,注射流率2.5~5.0 mL/s,動脈期為注射對比劑后20~25 s,門脈期及延遲期分別為注射對比劑后85~90 s、300 s。
4.圖像標注
先將肝臟增強CT掃描的DICOM圖像匿名化,轉換為NiFTI格式,使用ITK-SNAP軟件標注肝段。先由一位具有5年腹部影像診斷經驗的影像科醫(yī)師標
Couinaud’s肝段的標注根據Couinaud’s肝段劃分標準進行。因尾狀葉右緣和腹側緣的界定在學術界仍存在爭議[8-9],故本研究統(tǒng)一以靜脈韌帶裂右緣至下腔靜脈右緣連線作為劃分Ⅰ段右緣和腹側緣的分界線。手工標注流程及半肝切除術模擬圖見圖2。
圖2 肝段分割結果及半肝切除術三維模擬圖(手術模擬圖中白色部分為擬切除的肝段,彩色部分模擬半肝切除術后剩余肝臟)。
5.模型構建
肝臟分割:本單位已訓練了肝臟分割模型,用已有肝臟分割模型預測肝臟范圍,經醫(yī)師修改、確認后為肝臟分割結果。
肝段分割:在肝臟分割結果的基礎上,根據Couinaud’s肝段劃分標準分割肝段。數(shù)據集A隨機分為訓練集(train set,132例)、調優(yōu)集(validation set,19例)和測試集(test,19例),數(shù)據集B作為外部驗證,輸入數(shù)據為增強CT門脈期薄層圖像和標注(肝段體積記錄為V),輸出數(shù)據為模型的預測結果,包括各肝段及相應肝段體積(記錄為V’)。深度學習的模型為 3D U-Net[10]。將NIFTI格式的NCHCT圖像分辨率設置為128×192×256,窗寬300 HU,窗位30 HU。采用隨機噪聲、平移、仿射變換等圖像擴增方法。使用ADAM梯度下降優(yōu)化算法,初始學習率(learning rate)為1×10-4,每次讀取的圖像數(shù)量(batch size)為 2。訓練次數(shù)(Epoch)為400,研究所使用的程序語言為Python。模型訓練的硬件為GPU NVIDIA Tesla P100 16G,軟件包括Python3.6、Pytorch 0.4.1、Opencv、Numpy、SimpleITK等。
半肝切除術FLR %的計算:右半肝切除術定義為切除Ⅴ至Ⅷ段(或在此基礎上同時切除Ⅰ段),擴大右半肝切除術為切除Ⅳ至Ⅷ段(或在此基礎上同時切除Ⅰ段);左半肝切除術定義為切除Ⅱ至Ⅳ段(或在此基礎上同時切除Ⅰ段),擴大左半肝切除術定義為切除Ⅱ至Ⅳ段及Ⅴ、Ⅷ段(或在此基礎上同時切除Ⅰ段)[11]。FLR %=半肝切除術后剩余肝臟體積/肝臟總體積×100%[4],模型預測的FLR%為半肝切除術后剩余肝臟的預測體積/預測的肝臟總體積×100%(表2)。
表2 四種半肝切除術及相應FLR %計算方法
6.模型評價
模型分割效果的客觀評價指標為Dice相似性系數(shù)(dice similarity coefficient,DSC)值,計算公式為DSC=(2|X∩Y|)/(|X|+|Y|),X和Y分別代表放射科醫(yī)生標注的肝段區(qū)域和模型預測區(qū)域內包含的像素集。
為測試模型應用到FLR %評估的可行性,主觀評價指標為:模型與醫(yī)師基于FLR %預測半肝切除術是否可行的一致性。因臨床常建議正常肝臟、脂肪肝、明顯肝纖維化和肝硬化患者的FLR %分別大于20%、30%、40%[12-13]以最大程度降低術后肝功能衰竭的發(fā)生,故本研究設定正常肝臟、脂肪肝、肝硬化患者FLR %分別大于20%、30%、40%為半肝切除術可行的標準。
7.統(tǒng)計學分析
采用SPSS 21.0和Prism 7軟件進行統(tǒng)計學分析。計量資料以中位數(shù)(上、下四分位數(shù))表示,采用Bland-Altman分析比較模型與醫(yī)師測量結果的差異,使用Pearson相關分析和Bland-Altman分析模型預測與手工標注在FLR %預測結果方面的相關性和一致性,McNemar’s檢驗分析兩者在預測半肝切除術可行性上的一致性。以P<0.05為差異有統(tǒng)計學意義。
1.研究數(shù)據特征
醫(yī)學中心A、B的一般病例資料見表3。兩個醫(yī)學中心所有患者平均年齡為(52.91±7.1)歲,各肝段體積見圖3,肝臟總體積平均值為(1290.98±23.66)mL(95% CI:1244.36~1337.61)。外部驗證集手工標注的肝段體積為(37.59±1.26)mL至(241.76±6.07)mL,模型分割的肝段體積為(35.45±1.14)mL至(254.29±5.94)mL,兩者具有強相關性(r=0.956,P<0.05),與金標準相比,模型分割方法輕微高估肝段體積(平均偏差1.363 mL),95% 一致范圍(limit of agreement,LoA)為-8.53至11.26(圖4)。
圖3 兩個醫(yī)學中心共220例數(shù)據各肝段體積。 圖4 外部驗證集中模型預測與手工標注在肝段體積測量的相關性(a)和一致性(b)。兩者FLR %評估具有強相關性(r=0.956),一致性高,僅6 %數(shù)據位于95 %置信區(qū)間之外。 圖5 外部驗證中模型預測與手工標注在半肝切除術FLR %評估的相關性(a)和一致性(b)。兩者FLR %評估具有強相關性(r=0.99),一致性高,約7.5 %數(shù)據位于95 %置信區(qū)間之外。 圖6 各肝段DSC值。
表3 入組病例的基線資料
外部驗證集手工標注FLR %為12.41%~74.71%,平均38.27%,模型分割的FLR %為12.38%~75.81%,平均38.42%,兩者FLR%具有強相關性(r=0.99,P<0.05),與金標準相比,模型分割方法輕微低估FLR%(平均偏差- 0.16%),95% LoA 為0.9872~0.9927(圖5)。
2.模型定量評估
外部驗證各肝段的DSC值在0.46~0.99之間,平均DSC值為0.92±0.00(95% CI:0.91~0.93,圖6),提示模型預測結果與人工標注結果重合度較高。
3.模型定性評估
數(shù)據集B共50例數(shù)據,模型和醫(yī)師各200個FLR %預測數(shù)據。醫(yī)師預測手術可行而模型預測手術不可行3例(1.50%,3/200),均出現(xiàn)在擴大右半肝切除術,余兩者預測結果相同(兩者均預測手術可行172例,占86.0%;兩者均預測手術不可行25例,占12.5%;醫(yī)師預測手術不可行,模型預測手術可行0例)。McNemar’s檢驗精確顯著性P值為0.25,提示模型與醫(yī)師在預測手術可行性方面差異無統(tǒng)計學意義。
實現(xiàn)對正常肝臟、脂肪肝、肝硬化等多種肝臟背景下肝段的自動分割、體積測量及半肝切除術術前FLR %評估,為臨床迫切需求。
本研究使用AI技術先分割肝臟,再分割肝段,結果顯示U-Net模型用于增強CT薄層圖像肝段分割的平均DSC值為0.92,模型與醫(yī)師在FLR %評估上相關性高,在預測半肝切除術可行性上差異無統(tǒng)計學意義。本研究結果初步證明了U-Net模型用于增強CT薄層圖像上肝段分割、FLR %評估是可行的,為后續(xù)大樣本、細化肝臟背景的模型訓練并植入半肝切除術術前FLR %評估提供了依據。
本研究在肝段體積測量上模型預測與手工標注高度重合,是植入FLR %評估的關鍵和前提。因Couinaud’s肝段的解剖基礎為門脈與肝靜脈,故模型提供的肝段體積有潛力提示肝臟血管變異、以肝右葉萎縮及尾狀葉增大為特征的肝硬化和布加綜合征的輔助診斷。
目前罕見基于深度學習的半肝切除術FLR %評估的研究報道。本研究以深度學習方法分割肝段為基礎,初步證實了自動獲得FLR %值并預測不同肝臟背景患者半肝切除術的可行性。FLR %是半肝切除術后并發(fā)肝衰竭的獨立危險因子[14],本研究在一定程度上為自動預測半肝切除可行性提供了重要信息。
本研究存在以下局限性:①外部驗證中只有正常肝臟背景數(shù)據,缺乏脂肪肝、肝硬化數(shù)據,模型在此類患者中的分割性能如何將成為下一步研究計劃。②本研究排除了既往存在肝段或肝葉切除史、肝臟介入手術史的患者,在未來擴大樣本的模型訓練中將增加此類肝臟形態(tài)異常的數(shù)據。③本研究評估FLR %時未剔除肝內大血管、直徑小于2 cm的病灶,有可能造成FLR %預測結果與術后FLR %不完全一致,因此下一步將在現(xiàn)有模型基礎上行肝內血管及病灶的亞分割。
綜上所述,基于深度學習的U-Net分割算法可在增強CT圖像上實現(xiàn)Couinaud’s肝段的自動分割、體積測量并初步運用到半肝切除術的FLR %評估中,未來的研究將拓寬模型的納入標準并在臨床應用中檢驗其預測價值。