范玉 張乾 白金華 張宇航
摘要:由于皮膚癌黑色素瘤特有的噪聲分布不均一、關鍵信息占比小的問題,使得圖像病灶邊緣模糊,容易出現(xiàn)誤分割,無法滿足精度要求。提出一種改進的結(jié)構(gòu)森林模型對黑色素瘤圖像病灶進行分割,設計一種有效的輸入方案,通過二維高斯函數(shù)進行去噪,根據(jù)圖像像素特點自適應選擇閾值增強病灶邊緣,結(jié)合數(shù)學形態(tài)學突出有效信息,從而提高分割精度。在ISIC公開的數(shù)據(jù)集HAM10000上選取的部分數(shù)據(jù)試驗結(jié)果表明,改進后的模型在保持大部分關鍵信息的情況下,比原始模型分割速度更快、效果更好。
關鍵詞:皮膚癌黑色素瘤;改進結(jié)構(gòu)森林;數(shù)學形態(tài)學;病灶分割
中圖分類號:TP393文獻標志碼:A文章編號:1008-1739(2021)22-66-5
0引言
醫(yī)學圖像分割是醫(yī)學圖像處理與分析領域復雜而關鍵的步驟,目的是將醫(yī)學圖像中具有某些特殊含義的部分分割出來,有助于后續(xù)提取圖像感興趣區(qū)域的相關特征,并給臨床診療和病理學研究提供可靠的依據(jù),輔助醫(yī)生做出更為準確的診斷。
目前國內(nèi)外廣泛使用的醫(yī)學圖像分割方法有很多種,包括傳統(tǒng)算法和深度學習[1]算法,本文主要了解關于傳統(tǒng)的圖像分割方法。閾值分割是最常見的一種分割方法,基于對灰度圖的假設,有效對圖像進行了分割,比如伏金浩等人[1]提出的一種基于改進閾值與邊緣梯度的亮場干細胞圖像分割方法,準確分割了細胞的邊緣輪廓,比傳統(tǒng)的閾值分割方法具有更好的分割效果。基于邊緣的分割方法是人們最早研究的方法,由于區(qū)域邊緣上的像素變化一般比較劇烈,所以該方法試圖通過檢測不同區(qū)域間的邊緣來解決圖像分割問題,龐明明和安建成[3]將模糊數(shù)學與局部二值模式相融合,結(jié)合Canny算子[4]提出了一種FLBP-Canny算法來提取圖像目標區(qū)域輪廓,實驗結(jié)果表明該算法有較好的檢測率;基于區(qū)域的分割方法按照圖像的相似性準則對圖像區(qū)域進行劃分,比如柳丁和張東[4]對分水嶺算法多分割的缺點用2種算法進行了改進,并將其有效用到了超聲腫瘤圖像中進行分割。還有一種通過求解能量泛函的最小值找到目標輪廓來實現(xiàn)分割過程的活動輪廓模型,王孝義[6]等人提出了一種基于自適應能量偏移場的無邊緣主動輪廓模型AEOF-CV,對DDSM數(shù)據(jù)庫的乳腺腫塊圖像進行處理后,使用該模型乳腺腫塊進行分割,總識別率高達94%,提高了乳腺癌檢測的精準度和效率。基于圖論的分割方法則將圖像分割問題與圖的最小割問題關聯(lián),由于皮膚圖像在邊界、對比度和形狀大小方面存在的困難,Seetharani等人[7]用GrabCut算法[8]對皮膚病灶進行分割,再用傳統(tǒng)的K-means聚類算法[10]改善了分割邊界,在PH2與ISBI2017的數(shù)據(jù)集上試驗后,Dice系數(shù)值分別為0.913 9和0.823 6,展示了不錯的分割效果,顯示了圖論方法分割的優(yōu)良。
本文充分借鑒前人在傳統(tǒng)機器學習領域所做的工作,參考Dollár Piotr和Zitnick C Lawrence[9]提出了一種結(jié)合結(jié)構(gòu)化學習與隨機森林(Random Forest,RF)的結(jié)構(gòu)隨機森林算法[12],針對獲取的黑色素瘤皮膚鏡圖像,考慮黑色素瘤本身的特性,對結(jié)構(gòu)森林模型進行改進后用于皮膚病灶的精確分割。
1相關理論
1.1隨機森林
RF[13]是集成多棵決策樹的組合,這些決策樹之間是相互獨立的,且該算法實現(xiàn)簡單、計算開銷小、穩(wěn)定性高,比單棵決策樹具有更好的泛化能力和抗過擬合能力。隨機森林是對個獨立樹的訓練,給定一個樣本,輸入在樹上的輸出,存儲在到達的葉子處的預測可以是目標標簽∈或是標簽上的分布,使用一個集成模型將決策樹的預測結(jié)果組合成單個輸出,RF流程如圖1所示。
為了使輸出空間更泛化,引入一個近似的更一般的信息增益準則,并用于結(jié)構(gòu)化標簽中得到廣義結(jié)構(gòu)森林公式,將隨機決策森林擴展到結(jié)構(gòu)隨機森林。
1.2結(jié)構(gòu)森林
圖像局部塊的邊緣是高度相互依賴的,而一種被稱為結(jié)構(gòu)化學習的方法被用于解決這種表現(xiàn)出相似特征的問題,本文利用圖像邊緣塊的這種固有結(jié)構(gòu),提出一種應用于邊緣檢測的結(jié)構(gòu)化學習方法,通過將隨機決策森林擴展到二維空間,利用其框架捕獲結(jié)構(gòu)化信息來進行訓練,得到結(jié)構(gòu)森林模型。
結(jié)構(gòu)森林是一個用結(jié)構(gòu)化標簽訓練RF的過程,使用結(jié)構(gòu)化標簽來確定樹中每個分支的分裂函數(shù)來學習ID3決策樹,這也同時帶來了2個主要挑戰(zhàn),一是結(jié)構(gòu)化標簽的信息增益定義困難;二是結(jié)構(gòu)化輸出空間高維復雜,計算復雜度較高,下面針對2個挑戰(zhàn)提出了以下的解決措施:
2本文方法
結(jié)構(gòu)森林將邊緣檢測問題表達為在給定輸入圖像塊的情況下預測局部分割掩模,且結(jié)構(gòu)化標簽可以預測整個圖像領域的信息,大大減少了需要評估的樹的數(shù)量,相比同類算法極大提升了訓練效率。
3實驗分析
3.1數(shù)據(jù)采集
本文的研究對象是皮膚癌黑色素瘤,本實驗數(shù)據(jù)集HAM10000來源于國際皮膚圖像官網(wǎng)ISIC,該數(shù)據(jù)集收集了大量常見的色素性皮膚病變的多源皮膚鏡圖像,數(shù)據(jù)具備充分性和多樣性,研究證明可以作為學術機器學習的基準數(shù)據(jù)集[16]。
本文僅選取部分圖像進行試驗,圖像數(shù)據(jù)如圖2所示。數(shù)據(jù)選取具有隨機性,主要包括良性和惡性皮膚鏡圖像,數(shù)據(jù)格式為常用的JPG格式,分辨率大小一致,均為600 pixel×450 pixel。
3.2結(jié)果分析
試驗的結(jié)構(gòu)森林模型訓練環(huán)境為MATLAB2014a;實驗環(huán)境為個人PC機,處理器Intel(R) Core(TM) i7-8750H CPU @ 2.2 GHz,內(nèi)存為8 GB,軟件環(huán)境Windows10(64-bit)操作系統(tǒng)。
根據(jù)本文選取的黑色素瘤的良性和惡性皮膚鏡圖像數(shù)據(jù),先將數(shù)據(jù)集中的圖像輸入原始結(jié)構(gòu)森林模型進行訓練,結(jié)構(gòu)森林訓練結(jié)果如圖3所示,其中分割圖seg1與分割圖seg2均為結(jié)構(gòu)森林模型的分割結(jié)果,二者是一對二值反色圖,本質(zhì)上是一致的,目的是增強模型分割的對比效果。
從結(jié)構(gòu)森林的訓練結(jié)果可得,左側(cè)兩圖中的惡性圖像具有噪聲擾動大和邊界不規(guī)則的性質(zhì),訓練時圖像容易受到這些特性的影響,造成分割效果較差,而右側(cè)兩圖中的良性圖像的邊界分布較均勻,擾動也較小,但是分割效果也不佳,明顯觀察到其中的毛發(fā)、氣泡這些信息被誤認為是主要分割內(nèi)容,掩蓋了真正要分割的部分,造成整體分割精度不理想。
原始的結(jié)構(gòu)森林的黑色素瘤分割主要帶來了2個問題:一是圖像屬性差異使得病灶邊緣模糊,不易確定分割區(qū)域;二是醫(yī)學圖像本身的毛發(fā)、氣泡等噪聲干擾使得分割時易產(chǎn)生誤分,關鍵信息占比也受到極大影響。為了解決這些問題,本文對結(jié)構(gòu)森林模型進行改進,通過高斯濾波去除圖像噪聲,減少干擾因子,利用大津閾值法確定圖像病灶邊緣。圖4(a)為經(jīng)大津法得到的雙峰直方圖,用于確定最佳閾值,通過該閾值的選取完成對圖像的初步分割,得到圖4(b)中初分割后的直方圖,從圖4中可以看到,不同灰度級(0~255)對應的像素個數(shù)隨著灰度級的變化而變化的情況。
接著采用二值形態(tài)學閉運算去除黑色素瘤的毛發(fā)、氣泡等無關信息,突出關鍵信息,改進后的結(jié)構(gòu)森林效果顯著,圖5是改進后的模型分割差異對比,對比原始結(jié)構(gòu)森林,模型改進后的圖像分割效果遠遠好于改進前,這是因為本文提出的方法在處理具有類似黑色素瘤圖像這樣的特質(zhì)時有較強的針對性,使得圖像中的噪聲干擾大大降低,明顯觀察到圖像分割邊界更加完整,關鍵信息尤其突出,分割效果大大提升,且訓練速度相比原始的模型更快、更穩(wěn)定,再次驗證了本文的改進方法應用于黑色素瘤中時分割效果相當顯著。
4結(jié)束語
通過將皮膚癌黑色素瘤在改進前后模型中的分割圖進行對比,得出改進后的結(jié)構(gòu)森林對于黑色素瘤圖像分割效果明顯提升,首先因為黑色素瘤的圖像不同于普通圖像,不僅包括普通圖像的特征,還有醫(yī)學圖像固有的特性,需要針對這種特性使用有針對性的處理方法。而實驗結(jié)果也表明,本文使用的這種改進方式能有效解決提出的問題,不僅減弱了噪聲,還凸顯了關鍵信息,提升了模型分割精度,且改進的結(jié)構(gòu)森林算法對醫(yī)學領域具有較好的解釋,對于同類問題的應用有很好的發(fā)展前景,為更準確地對皮膚癌進行早期診斷打下堅實基礎。
參考文獻
[1]彭璟,羅浩宇,趙淦森,等.深度學習下的醫(yī)學影像分割算法綜述[J].計算機工程與應用,2021,57(3):44-57.
[2]伏金浩,王劍平,聞路紅,等.基于改進閾值與邊緣梯度的亮場干細胞圖像分割方法[J].電子測量技術,2020,43(20):109-114.
[3]龐明明,安建成.融合模糊LBP和Canny邊緣的圖像分割[J].計算機工程與設計,2019,40(12):3533-3537.
[4]李祥健,朱家明,徐婷宜.基于改進Canny算子的雙水平集醫(yī)學圖像分割[J].無線電通信技術,2021,47(2):226-231.
[5]柳丁,張東.改進的分水嶺算法在超聲腫瘤圖像分割中的應用[J].半導體光電,2017,38(6):898-901.
[6]王孝義,邢素霞,王瑜,等.基于自適應能量偏移場無邊緣主動輪廓模型的乳腺腫塊分割與分類方法研究[J].中國醫(yī)學物理學雜志,2020,37(8):1010-1016.
[7] SEETHARANI M J, PALANIAPPAN M, CHANDRABOSE A. Automated Skin Lesion Segmentation of Dermoscopic Images Using Grabcut and K-Means Algorithms[J]. IET Computer Vision, 2018,12(8):1088-1095.
[8] U NVER H M,AYAN E. Skin Lesion Segmentation in Dermoscopic Images with Combination of YOLO and GrabCut Algorithm[J]. Diagnostics,2019,9(72):97-114.
[9]王波,馮旭鵬,劉利軍,等.基于改進YOLO算法的肺部CT圖像中結(jié)節(jié)檢測研究[J].北京生物醫(yī)學工程,2020,39(6): 615-621.
[10]宗曉萍,田偉倩.采用K-means的腦腫瘤磁共振圖像分割與特征提取[J].計算機工程與應用,2020,56(3):187-193.
[11] DOLLA R P, ZITNICK C L. Fast Edge Detection Using Structured Forests[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015,37(8):1558-1570.
[12] LIU X H. Cell Coverage Estimation Based on Structured Random Forests Edge Detection and Boundary Tracking Proceedings of 2020 International Conference on Artificial Intelligence and Communication Technology (AICT 2020). Chongqing: Clausius Scientific Press, 2020: 22-25.
[13]李長勝,王瑜,肖洪兵,等.基于隨機森林算法的阿爾茨海默癥醫(yī)學影像分類[J].中國醫(yī)學物理學雜志,2020,37(8): 1005-1009.
[14]劉俠,甘權,李冰,等.融合加權隨機森林的自動3D椎骨CT圖像主動輪廓分割方法[J].光電工程,2020,47(12):37-48.
[15] RAFAEL C G.數(shù)字圖像處理:第3版[M].阮秋琦,譯.北京:電子工業(yè)出版社,2017.
[16] PHILIPP T,CLIFF R,HARALD K. The HAM10000 Dataset, a Large Collection of Multi-Source Dermatoscopic Images of Common Pigmented Skin Lesions[J]. Scientific Data, 2018,5(1):1068-1073.