范盈盈,向旭輝,雷 婷,周燕燕,步 宏,,鄭眾喜
乳腺癌是常見的惡性腫瘤之一,人表皮生長因子受體2(human epidermal growth factor 2, HER-2)基因擴(kuò)增可見于15%~20%的乳腺癌,HER-2陽性與乳腺癌患者不良預(yù)后相關(guān)[1]。目前最常用的HER-2檢測(cè)方法為免疫組化,但是該方法受病理醫(yī)師的經(jīng)驗(yàn)及主觀差異的影響,不同實(shí)驗(yàn)室間HER-2判讀的一致性及可重復(fù)性差異顯著[2]。計(jì)算機(jī)在圖像處理方面具有優(yōu)越性,因此被用于提高HER-2免疫組化判讀的準(zhǔn)確性及可重復(fù)性。傳統(tǒng)機(jī)器算法的性能較大程度上依賴于特征提取選擇,而特征提取選擇存在差異,并且傳統(tǒng)的機(jī)器算法不能支持大量數(shù)據(jù)的研究[3],而深度學(xué)習(xí)在病理圖像上表現(xiàn)出較高的準(zhǔn)確性及實(shí)用性,因此目前逐漸取代傳統(tǒng)的計(jì)算機(jī)算法應(yīng)用于病理圖像處理中[4-5]。
回顧相關(guān)文獻(xiàn),大部分已發(fā)表的研究僅對(duì)感興趣區(qū)域進(jìn)行分析,導(dǎo)致最終準(zhǔn)確性變化大[6-7]。因此在本實(shí)驗(yàn)中使用深度學(xué)習(xí)算法建立準(zhǔn)確性高、基于全片腫瘤區(qū)域的HER-2免疫組化的自動(dòng)判讀模型,并且對(duì)該模型性能及其臨床應(yīng)用的可行性進(jìn)行分析。
1.1 臨床資料收集2018年1月~2019年8月四川大學(xué)華西醫(yī)院存檔的浸潤性導(dǎo)管癌手術(shù)切除標(biāo)本215例?;颊吲R床病理資料均直接取自本院的臨床病歷資料或者病理資料,包括患者年齡、性別、腫瘤直徑、病理學(xué)分級(jí)等。
1.2 方法標(biāo)本均經(jīng)10%中性福爾馬林固定,常規(guī)行脫水及石蠟包埋,4 μm厚連續(xù)切片,行HE和免疫組化染色。免疫組化染色使用羅氏Ventana全自動(dòng)免疫組化染色儀,以DAB顯色、蘇木精對(duì)比染色。使用羅氏公司克隆號(hào)為4B5的兔抗人HER-2單克隆抗體為一抗,操作步驟嚴(yán)格按試劑盒說明書進(jìn)行。
1.3 判讀標(biāo)準(zhǔn)HER-2免疫組化判讀以《乳腺癌HER-2檢測(cè)指南(2019)》[8]為標(biāo)準(zhǔn),即:無著色或≤10%的浸潤癌細(xì)胞呈不完整的、微弱的細(xì)胞膜染色為(0);>10%的浸潤癌細(xì)胞呈不完整、微弱的細(xì)胞膜染色為(1+);>10%浸潤癌細(xì)胞呈弱~中等強(qiáng)度的完整細(xì)胞膜染色或者≤10%的浸潤癌細(xì)胞呈完整、強(qiáng)且均勻的細(xì)胞膜染色為HER-2(2+);>10%的浸潤癌細(xì)胞呈完整、強(qiáng)且均勻的細(xì)胞膜染色為HER-2(3+)。HER-2(0~1+)為陰性,HER-2(2+)為不確定,HER-2(3+)為陽性。
1.4 HER-2自動(dòng)評(píng)分模型HER-2免疫組化切片使用優(yōu)納公司數(shù)字病理切片掃描儀進(jìn)行全片掃描,形成全載玻片成像(whole slide imaging, WSI)。選取15例WSI作為訓(xùn)練數(shù)據(jù),200例WSI作為測(cè)試數(shù)據(jù)。15張WSI中的感興趣區(qū)域(即浸潤性導(dǎo)管癌)在物鏡10×下進(jìn)行不重疊地分割,分割為32×32像素大小,由病理醫(yī)師對(duì)每張分割圖片進(jìn)行分類。每張分割圖片分為0及1+、2+、3+、其它四類。其中其它分類用以區(qū)分腫瘤組織與非腫瘤組織,包括:背景(沒有確切的細(xì)胞核)、壞死區(qū)域、正常乳腺組織、間質(zhì)及異常著色區(qū)域。訓(xùn)練數(shù)據(jù)中用于圖片特征學(xué)習(xí)的訓(xùn)練集分割圖片合計(jì)12 550張:0及1+為2 226張,2+為2 074張,3+為2 124張,其它為6 126張。訓(xùn)練數(shù)據(jù)中用于模型選取的驗(yàn)證集包含2 013張圖片:0及1+為428張,2+為298張,3+為449張,其它為838張。
基于Inception V3和Resnet網(wǎng)絡(luò)建立深度學(xué)習(xí)網(wǎng)絡(luò)。深度學(xué)習(xí)模型實(shí)現(xiàn)HER-2免疫組化的自動(dòng)評(píng)分主要由兩部分構(gòu)成,即分割圖片分類及HER-2評(píng)分(圖1)。分割圖片分類步驟中將WSI分割為32×32像素大小的圖片。將分割圖片輸入到深度學(xué)習(xí)模型中,模型對(duì)每張分割圖片進(jìn)行分類判讀。HER-2評(píng)分步驟中將分割圖片的判讀結(jié)果進(jìn)行信息整合,最后計(jì)算判讀為0及1+、2+及3+分類的分割圖片百分比,對(duì)全片HER-2免疫組化圖像進(jìn)行判讀。200例測(cè)試集數(shù)據(jù)均由3名經(jīng)驗(yàn)豐富的病理醫(yī)師進(jìn)行獨(dú)立判讀,共同的判讀結(jié)果作為標(biāo)準(zhǔn)判讀。第4名病理醫(yī)師獨(dú)立于3名病理醫(yī)師進(jìn)行判讀。
1.5 統(tǒng)計(jì)學(xué)方法采用SPSS 20.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析,計(jì)數(shù)資料采用Pearson χ2檢驗(yàn),評(píng)估兩種檢測(cè)方法之間的一致性采用Kappa值。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 臨床特點(diǎn)患者平均年齡為52.9歲,腫塊平均直徑為2.5 cm,病理組織學(xué)分級(jí):WHO Ⅰ級(jí)2例,WHO Ⅱ級(jí)95例,WHO Ⅲ級(jí)118例,患者均為女性,均為手術(shù)切除標(biāo)本。
2.2 HER-2免疫組化染色結(jié)果判讀實(shí)驗(yàn)納入陰性病例HER-2(0及1+)130例(60.5%),不確定病例HER-2(2+)42例(19.5%),陽性病例HER-2(3+)43例(20%)。WSI中深度學(xué)習(xí)模型判讀為0及1+、2+、3+、其它四類的分割圖片如圖2所示。200例測(cè)試集中深度學(xué)習(xí)模型及病理醫(yī)師判讀結(jié)果中陰性病例分別為101例(50.5%)及92例(46%),不確定病例為56例(28%)及68例(34%),陽性病例為43例(21.5%)及40例(20%)。深度學(xué)習(xí)模型判讀結(jié)果見表1。深度學(xué)習(xí)模型判讀的準(zhǔn)確率為87.5%(75/200),病理醫(yī)師判讀的準(zhǔn)確率為81.5%(163/200),深度學(xué)習(xí)模型判讀的準(zhǔn)確率高于病理醫(yī)師的判讀準(zhǔn)確率(P<0.05)。深度學(xué)習(xí)模型判讀結(jié)果與標(biāo)準(zhǔn)判讀之間的Kappa值為0.79(P<0.05),病理醫(yī)師判讀結(jié)果與標(biāo)準(zhǔn)判讀之間Kappa值為0.71(P<0.05),深度學(xué)習(xí)模型判讀結(jié)果與病理醫(yī)師判讀結(jié)果之間的Kappa值為0.70(P<0.05),深度學(xué)習(xí)模型判讀結(jié)果與標(biāo)準(zhǔn)判讀及病理醫(yī)師判讀結(jié)果之間的一致性較高。深度學(xué)習(xí)模型與病理醫(yī)師在不確定病例中判讀的準(zhǔn)確率分別為60.7%(34/56)及50%(34/68),兩者差異無統(tǒng)計(jì)學(xué)意義(P=0.23)。與病理醫(yī)師判讀相比,深度學(xué)習(xí)模型減少17.6%(12/68)的不確定病例。
圖1 HER-2免疫組化自動(dòng)判讀模型判讀流程
圖2 感興趣區(qū)域進(jìn)行分割后的圖片:A.0;B.1+;C.2+;D.3+;E.其它,異常著色區(qū)域;F.其它,背景沒有確切的細(xì)胞核
表1 深度學(xué)習(xí)模型判讀結(jié)果
2.3 評(píng)判不一致病例深度學(xué)習(xí)模型判讀與標(biāo)準(zhǔn)判讀間有25例判讀不一致病例,深度學(xué)習(xí)模型將22例陰性病例判讀為不確定,3例不確定病例判讀為陽性,假陽性率為1.5%(3/200)。病理醫(yī)師判讀的假陽性率及假陰性率分別為0.5%(1/200)及1%(2/200)。25例判讀不一致的病例中,病理醫(yī)師判讀與標(biāo)準(zhǔn)判讀的一致性僅為52%;而在判讀一致的175例中,病理醫(yī)師判讀與標(biāo)準(zhǔn)判讀之間的一致性為85.7%,兩者差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。深度學(xué)習(xí)模型判讀與標(biāo)準(zhǔn)判讀之間判讀不一致的病例中13例為HER-2異質(zhì)性表達(dá),2例為組織重疊,1例在腫瘤周圍及腫瘤組織中存在術(shù)中定位墨汁。
本實(shí)驗(yàn)提出的HER-2免疫組化自動(dòng)判讀模型,是在分割圖片分類的基礎(chǔ)上進(jìn)行全片腫瘤細(xì)胞HER-2免疫組化判讀。目前發(fā)表的相關(guān)研究中,大部分研究是基于感興趣區(qū)域進(jìn)行HER-2免疫組化判讀,該方法通常受感興趣區(qū)域數(shù)量、非腫瘤區(qū)域的面積以及選擇者之間主觀差異的影響,最終的HER-2免疫組化判讀的準(zhǔn)確性變化大,準(zhǔn)確性為78%~98.33%[6-7,9]。與這些研究相比本組實(shí)驗(yàn)提出的方法實(shí)現(xiàn)了HER-2免疫組化全片腫瘤區(qū)域的判讀,避免了由感興趣區(qū)域以及選擇者間主觀差異對(duì)HER-2免疫組化判讀的影響,與病理醫(yī)師實(shí)際工作中基于全片的HER-2免疫組化判讀方法一致。
Khameneh等[10]為了實(shí)現(xiàn)全片腫瘤區(qū)域腫瘤細(xì)胞的細(xì)胞核、膜的分割識(shí)別,采用包括支持向量機(jī)(support vector machine, SVM)、局部二值模式(local binary patterns, LBP)及顏色直方圖等算法提取圖像特征,區(qū)分上皮及非上皮成分。本實(shí)驗(yàn)中將間質(zhì)成分、正常的乳腺組織及異常著色等非腫瘤區(qū)域的分割圖片歸到一個(gè)類別中,標(biāo)記工作簡單,避免由傳統(tǒng)算法中手動(dòng)提取特征過程中導(dǎo)致的圖像數(shù)據(jù)的流失及選擇偏移。值得一提的是Vandenberghe等[11]對(duì)全片中免疫細(xì)胞、基質(zhì)細(xì)胞、人工假象及不同分級(jí)的腫瘤細(xì)胞進(jìn)行探測(cè)分類,這種方法在標(biāo)注過程中易受標(biāo)注者間的主觀差異影響,這可能是導(dǎo)致其結(jié)果準(zhǔn)確性不高的原因。
本實(shí)驗(yàn)的準(zhǔn)確性為87.5%,低于部分目前已經(jīng)發(fā)表的研究(表2)。除了與WSI全片判讀的方法相關(guān)外,可能與計(jì)算方法相關(guān)。依據(jù)已發(fā)表文獻(xiàn)準(zhǔn)確率的計(jì)算方法,去除本實(shí)驗(yàn)中1.5%的假陽性率,98.5%的準(zhǔn)確率高于目前已發(fā)表的相關(guān)研究。本實(shí)驗(yàn)中提出的HER-2免疫組化自動(dòng)評(píng)分模型的準(zhǔn)確率高,能準(zhǔn)確識(shí)別出陰性病例,無假陰性病例,在臨床病理診斷工作中能在一定程度上減輕病理醫(yī)師的工作負(fù)荷。
本實(shí)驗(yàn)中HER-2免疫組化自動(dòng)判讀模型與標(biāo)準(zhǔn)判讀一致的病例中與病理醫(yī)師的判讀一致性明顯高于與評(píng)讀不一致的病例,提示深度學(xué)習(xí)模型能識(shí)別部分易于誤判的病例,可以幫助病理醫(yī)師識(shí)別高風(fēng)險(xiǎn)病例提高判讀的準(zhǔn)確性,與Vandenberghe等[11]的結(jié)論相似。
HER-2 (2+)病例及HER-2表達(dá)異質(zhì)性病例是日常病理診斷工作的難點(diǎn)[12-13]。本實(shí)驗(yàn)的深度學(xué)習(xí)模型能在保持與病理醫(yī)師判讀相同準(zhǔn)確性的同時(shí),能減少17.6%判讀為HER-2 (2+)的病例。深度學(xué)習(xí)模型判讀不一致的病例中超過50%的病例具有HER-2表達(dá)異質(zhì)性,是影響深度學(xué)習(xí)模型準(zhǔn)確性的主要因素,因此這部分病例的判讀結(jié)果需要病理醫(yī)師進(jìn)行復(fù)核判讀。
表2 已發(fā)表的使用深度學(xué)習(xí)HER-2免疫組化評(píng)估研究
總之,本實(shí)驗(yàn)提出的深度學(xué)習(xí)模型是在進(jìn)行簡單標(biāo)記的測(cè)試集數(shù)據(jù)上進(jìn)行模型的建立,在此基礎(chǔ)上建立了準(zhǔn)確性高的HER-2免疫組化全片自動(dòng)判讀模型。該模型能識(shí)別明確的陰性病例,幫助病理醫(yī)師識(shí)別高風(fēng)險(xiǎn)病例,減少判讀為HER-2 (2+)病例的數(shù)量,提高病理醫(yī)師判讀的準(zhǔn)確性及一致性。深度學(xué)習(xí)模型在一定程度上能減少病理醫(yī)師的工作負(fù)荷,為乳腺癌患者臨床治療方案的決策及預(yù)后提供更準(zhǔn)確的信息。