◇皖南醫(yī)學(xué)院醫(yī)學(xué)影像學(xué)院 崔曼曼 王 敏 陳許瀅 金雪婷 徐爭元 張解和
急性白血病的診斷目前主要是依靠白細胞形態(tài)學(xué)的檢查,但是由于工作強度大、醫(yī)生連續(xù)工作導(dǎo)致疲勞等原因,使得人工的檢驗效率低下。在21世紀,隨著人工智能的發(fā)展,其在白血病診斷方面應(yīng)用的優(yōu)勢愈發(fā)明顯。本文主要介紹了人工智能在白血病診斷中的基本過程和相關(guān)技術(shù),并進一步分析了相關(guān)技術(shù)的優(yōu)缺點。
急性白血病是惡性克隆性疾病,惡性程度極大,與骨髓中白血病細胞異常大量增殖并抑制正常骨髓的造血作用有關(guān),在沒有得到及時治療的狀況下急性白血病人平均存活期只有3~4個月左右[1]。因此,及時快速發(fā)現(xiàn)診斷白血病對于挽救病人生命有著重大的臨床意義,早發(fā)現(xiàn)和早治療成為醫(yī)學(xué)界的共同追求。對血細胞涂片進行人工鏡檢,是確診急性白血病最可靠的實驗室方法,但由于每日鏡檢量龐大、人力資源消耗大、鏡檢效率低、重復(fù)性高,同時具有高度的主觀性,沒有精確的標準,所以人工鏡檢在一定程度上診斷的效率和正確率不高。
人工智能(ArtificialIntelligence,AI)是一門用于模擬、發(fā)展和擴展智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的新技術(shù)科學(xué),是計算機科學(xué)的重要分支[2]。使用人工智能技術(shù)可以提供白細胞圖像的細胞計數(shù)和形態(tài),從而對白細胞圖像進行識別和分類,達到診斷急性白血病的目的。
人工智能在疾病診斷中的應(yīng)用,主要是通過收集醫(yī)院患者的基因數(shù)據(jù)、圖像診斷、病理診斷等龐大的信息為基礎(chǔ),建立一個相應(yīng)的數(shù)據(jù)庫,得出與疾病有關(guān)的數(shù)據(jù),以極其簡便快捷的方式進行數(shù)據(jù)的整理以及建模分析,從而有效分析疾病的病因和機制,將人工智能技術(shù)運用在患者的疾病診斷以及治療中,可以有助于醫(yī)療工作者更加有效地研發(fā)優(yōu)質(zhì)的治療方案[3]。
相對于傳統(tǒng)的人工鏡檢白細胞圖像,運用人工智能技術(shù)診斷急性白血病的優(yōu)勢可以表現(xiàn)在以下幾個方面:可精確提取白細胞圖像的顏色、紋理和形狀特征,實現(xiàn)定量性診斷病情,避免人工鏡檢的主觀性,使得診斷結(jié)果更加客觀公正標準;可將圖像進行線上存儲,建立數(shù)據(jù)庫,從而對日后疾病的復(fù)診起到輔助作用;可通過總結(jié)專家診斷經(jīng)驗,并建立相關(guān)疾病診斷系統(tǒng),供醫(yī)生之間交流溝通和相互學(xué)習(xí),從而使醫(yī)生診斷水平有所提高;可為病人與醫(yī)生遠程會診提供條件[4]。
故近些年來,許多專家學(xué)者都積極的開展以人工智能技術(shù)為基礎(chǔ),對血細胞圖像識別進行白細胞分類和診斷的課題研究,為了更加精確地實現(xiàn)白血病細胞圖像的分割和識別,臨床醫(yī)學(xué)人員和工程技術(shù)人員做了大量的嘗試。許多用于血液涂片圖像的自動分割識別以達到檢測診斷白血病的方法和技術(shù)已經(jīng)被學(xué)者們提出,一系列研究文獻顯示利用計算機進行的處理技術(shù)有助于更精確、更標準地分割和識別細胞[5]。
在白血病的診斷中,人工智能技術(shù)的應(yīng)用歷史已久,許多專家以計算機輔助圖像識別技術(shù)為基礎(chǔ),對白細胞進行分類的研究,其中細胞分割及識別的算法研究是此類研究的關(guān)鍵點。具體過程如下所示。
(1)血細胞圖像的采集。采集血細胞圖像首先通過抽血或者骨髓穿刺方法抽取外周血或者骨髓液,抽取完畢后立即進行涂片,即將樣本放置于載玻片上,進行推片,制成多張血細胞涂片,最后將干燥的涂片經(jīng)姬氏染色固定后在顯微鏡下拍攝血細胞圖像,如圖1所示。
圖1
(2)血細胞圖像的預(yù)處理。由于在第一步驟收集到的白細胞圖像通常會被復(fù)雜的背景圖像和不同的情況所影響,例如:成熟紅細胞或由于操作或血液中所含有的雜質(zhì)等可干擾白細胞分型和診斷,在不同的成像參數(shù)和成像儀器下得到的圖像會不一樣以及得到的白細胞圖像成片質(zhì)量會受到偽影噪聲等影響。因此,我們需要對白細胞圖像進行預(yù)處理。目前對于圖像預(yù)處理所包含的方法有:直方圖均衡、平滑濾波和銳化濾波等[6-9]。所謂直方圖均衡,是一種增加圖像對比度的技術(shù),主要通過圖像直方圖實現(xiàn);平滑濾波,可以去除圖像中混入的噪聲,使得圖像更加清晰;而銳化濾波,能消除圖像的低頻區(qū)域,保留高頻部分,從而突出細節(jié)。由于各種方法利弊兼存,在平時應(yīng)用過程中針對我們所要的不同結(jié)果要求去選擇恰當?shù)念A(yù)處理方法。
(1)圖像分割技術(shù)。圖像分割技術(shù)在白血病細胞識別診斷中具有重要地位,它是一種把圖像通過相關(guān)技術(shù)分割成多個特定的、具有獨特性質(zhì)的區(qū)域,并從中提取出目標區(qū)域的興起科技。處理圖像時,人們通常只需要圖像的某些區(qū)域或部分,即所謂的目標區(qū)域。為了滿足人們的需求,我們需要分割并提取所謂的目標區(qū)域。在白細胞圖像中主要包括兩大部分—白細胞和其它,白細胞由細胞核、細胞質(zhì)和細胞膜構(gòu)成,而其它包括紅細胞、淋巴細胞等其他細胞和各種各樣的雜質(zhì)等。每個部分的圖像區(qū)域灰度不一樣,這也是進行白細胞分割的主要參數(shù)依據(jù)。按照灰度值從大到小排列,依次為:背景圖像—紅白細胞細胞質(zhì)—白細胞細胞核。白細胞分割的難點在于它的圖像多樣性和變化性,首先成熟程度的差異會導(dǎo)致白細胞圖像不一樣,其次病理、生理狀態(tài)等的不同也會導(dǎo)致細胞當時所處的狀態(tài)不一樣,所以白細胞的分割是在整個應(yīng)用過程中比較困難的步驟。目前主要的白血病細胞分割技術(shù)有閾值分割、邊界技術(shù)分割、區(qū)域技術(shù)分割、邊界和區(qū)域技術(shù)分割等。
(2)圖像分割技術(shù)的應(yīng)用。自白細胞分割理念的提出至今,學(xué)者們提出了大量針對細胞分割的前沿技術(shù),其中大多數(shù)都以局部信息為基礎(chǔ)。但是,盡管其簡單性和基本性,但該方法僅適用于分割圓形單元格。Liao和Deng[10]對于分割白細胞提出了一種形態(tài)分析算法,血細胞圖像在經(jīng)過基本的閾值分割后,經(jīng)過分析形態(tài)確定白細胞形狀,這種算法雖然簡便,但是缺點是只能應(yīng)用于圓形的細胞。OngunG,HaliciU等[11]人開發(fā)了差分血液計數(shù)器(DBC)系統(tǒng),在這個系統(tǒng)中運用了基于活動輪廓模型的細胞分割算法;Duan[12]等人為了提升圖像識別的質(zhì)量,將基于顏色直方圖和基于區(qū)域合并的兩種分割方法相結(jié)合,分別從白細胞中提取細胞核和細胞質(zhì),并對這兩部分進行識別,其分割的結(jié)果顯示比起其他方法更加的高效以及準確。
(3)白細胞分割需要解決的問題。盡管大量的白細胞分割技術(shù)被提出,但是由于白細胞的復(fù)雜性,目前仍存在以下問題需要被解決:因為白細胞胞核顏色深而胞漿顏色淺,所以兩者的顏色反差大,因此可通過最大類間方差法進行核漿分離,比較困難的是白細胞胞質(zhì)上色程度不高,想要將其與紅細胞及背景分離開比較困難;急性白血病骨髓增生活躍,因此在其骨髓中白細胞數(shù)量繁多,分布密度大,容易黏連重疊,可通過分水嶺算法合并距離變換解決細胞黏連問題。
分割白細胞圖像后,我們需要進行對白細胞的特征進行提取,這是細胞識別的前提。首先,我們需要了解各類白血病細胞所特有的特征,尤其是在正常白細胞與惡性白細胞之間,這是我們診斷急性白血病的重要基礎(chǔ),通常病理科的醫(yī)生會從白細胞的變異程度、胞漿比和胞核的顏色大小等方面來進行白細胞的診斷。但是對于計算機提取白細胞特征來說,所需要提取的是白血病圖像中的數(shù)字特征,用不同的數(shù)字特征來近似的描述白血病細胞的關(guān)鍵特征,以此進行白血病細胞的分類識別。
(1)常用的白細胞特征。白細胞的圖像特征主要有三類:顏色特征、紋理特征和形狀特征[13]。前兩者概括事物外在特征,又分別被稱為統(tǒng)計特征和視覺特征,包括直方圖、能量、區(qū)域亮度和紋理輪廓等。形狀特征是外部特征,包括輪廓特征(如周長等)、區(qū)域特征(如面積等)和變換特征。
(2)白細胞特征提取技術(shù)的應(yīng)用。Aus等[14]使用圖像處理技術(shù)檢測白血病中單核母細胞的形態(tài)學(xué)差異;朱雪明等[15]選取47例急性白血病骨髓片,經(jīng)顯微鏡投影后記錄有核細胞細胞和細胞核的形態(tài),同時應(yīng)用計算機技術(shù)對白細胞圖像進行測量,從而提取特征,其結(jié)果顯示正確率為77%。但是這些方法缺乏針對性,都是在特定條件下對所有類別細胞特征定量的總體反映。
最后一步就是對于白細胞的分類識別。根據(jù)臨床應(yīng)用的要求,將白細胞分類成嗜酸性粒細胞、嗜堿性粒細胞、中性粒細胞、單核細胞和淋巴細胞,除此之外還需要將中性粒細胞分成分葉狀和桿狀。
目前對于白細胞分類技術(shù)可以分為兩大類,一是淺層機器學(xué)習(xí),另一個是深層機器學(xué)習(xí)。前者是常用的方法,包括Bayes(貝葉斯)分類、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)、RBF(徑向基函數(shù))網(wǎng)絡(luò)等,但其具有局限性--即對復(fù)雜函數(shù)的表示能力有限,其中人工神經(jīng)網(wǎng)絡(luò)以BP神經(jīng)網(wǎng)絡(luò)最多見,Ai等[16]人利用BP神經(jīng)網(wǎng)絡(luò)技術(shù)識別150例骨髓細胞,準確率在80%以上;Zhang[17]等運用BP人工神經(jīng)網(wǎng)絡(luò)構(gòu)造分類器識別血細胞涂片圖像中的紅細胞和一系列的粒細胞。后者是近些年來新出現(xiàn)的圖像識別算法,其具有強大的特征學(xué)習(xí)能力,賈洪飛[18]設(shè)計的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)進行外周血白細胞的自動五分類的白細胞的平均識別率為99.64%,不僅提高了識別率,而且同時大大降低了算法的復(fù)雜性。
目前人工智能診斷急性白血病方面取得了一定的成果,并且隨著21世紀人工智能技術(shù)的快速發(fā)展,細胞的分類識別必然向更精確、更優(yōu)化的方向發(fā)展,這一技術(shù)在急性白血病診斷中的應(yīng)用大大降低了人工對細胞形態(tài)分析診斷的主觀性,提高了診斷的效率和準確度,同時在診斷歸類白血病類型時,由于需要在分析不同種類不同發(fā)展階段細胞的數(shù)量比率以及形態(tài)異常的細胞相應(yīng)情況的基礎(chǔ)上結(jié)合診斷標準做出判斷,這對細胞圖像的分割與識別技術(shù)提出了更高的要求,但也促使了相關(guān)技術(shù)的發(fā)展,這對醫(yī)療行業(yè)有著重大的意義。