高學(xué)田
(福建星網(wǎng)銳捷通訊股份有限公司,福建 福州 350000)
在建設(shè)“智慧醫(yī)院”背景下,將醫(yī)學(xué)影像處理技術(shù)和數(shù)據(jù)挖掘技術(shù)相結(jié)合,從海量醫(yī)學(xué)影像數(shù)據(jù)中提取出符合醫(yī)學(xué)診斷需要或表示疾病類型的信息,可以達(dá)到輔助決策診斷的效果。在設(shè)計輔助診斷系統(tǒng)時,可選擇的數(shù)據(jù)處理算法有多種,例如BP 神經(jīng)網(wǎng)絡(luò)算法、粗糙集算法等,但是在實(shí)際應(yīng)用中均存在一定缺陷,例如收斂速度慢、全域檢索能力差等。RBF(徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)具有最優(yōu)逼近、全局逼近的特點(diǎn),基于該數(shù)據(jù)挖掘算法構(gòu)建輔助診斷系統(tǒng),將提高影像數(shù)據(jù)的分析速度和利用效率,從而在輔助醫(yī)師診斷方面發(fā)揮更為離線的效果。
神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用在模式識別、數(shù)據(jù)挖掘等方面。面對海量化數(shù)據(jù)和高標(biāo)準(zhǔn)的處理要求,單層神經(jīng)網(wǎng)絡(luò)由于只能解決線性可分問題,實(shí)際應(yīng)用效果大打折扣。構(gòu)建多層前饋神經(jīng)網(wǎng)絡(luò)、提升分類能力成為增強(qiáng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力和應(yīng)用價值的一種有效手段。多層前饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1 所示。
圖1 神經(jīng)網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)
結(jié)合圖1 可知,該系統(tǒng)共有3 部分,即輸入部分、訓(xùn)練部分、輸出部分。采集到的樣本進(jìn)入到輸入部分,完成篩選、預(yù)處理后,通過訓(xùn)練部分進(jìn)行網(wǎng)絡(luò)的權(quán)系數(shù)(W)調(diào)整,最后輸出結(jié)果。期望的輸出信號可以作為參照信號,再返回與實(shí)際輸出進(jìn)行對比,根據(jù)兩者之間的誤差(e)重新修改權(quán)系數(shù),直到實(shí)際輸出符合預(yù)期輸出。但是神經(jīng)網(wǎng)絡(luò)系統(tǒng)在數(shù)據(jù)挖掘中也存在缺點(diǎn),例如每輸入一個新的樣本,就必須修改一次權(quán)值,大幅度增加了訓(xùn)練成本,而徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)系統(tǒng)則規(guī)避了這一問題。
徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)算法的機(jī)理是利用徑向基函數(shù)作為隱單元的“基”,在此基礎(chǔ)上構(gòu)建隱含層。在確定了徑向基函數(shù)的中心后,相應(yīng)的映射關(guān)系也被確定下來。在隱含層與輸出層之間建立實(shí)線性的映射關(guān)系,多個隱單元輸出的權(quán)值線性相加,即可得到該神經(jīng)網(wǎng)絡(luò)的總輸出。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2 所示。
圖2 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
輸入層包含n 個神經(jīng)元,與輸入矢量維數(shù)(x∈Rn)相等;同樣的,輸出層包含m 個神經(jīng)元,與輸出矢量維數(shù)(y∈Rn)相等。輸入層與隱含層之間、隱含層與輸出層的神經(jīng)元,均采用線性連接。隱含層中各個單元(即隱單元)的作用函數(shù)是徑向基函數(shù),輸入單元到隱單元的權(quán)值統(tǒng)一設(shè)定為1,隱單元到輸出單元的權(quán)值支持靈活調(diào)節(jié)。理論上來說,只要保證隱單元數(shù)量合適,即可將非線性可分問題轉(zhuǎn)化為線性可分問題,并使用線性單元求解,從而加快了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度,在數(shù)據(jù)挖掘與處理中有更加出色的表現(xiàn)。
圖像在轉(zhuǎn)換、傳輸階段很容易受到噪聲干擾,降低圖像的利用價值。因此,在設(shè)計輔助診斷系統(tǒng)時,必須要對醫(yī)學(xué)影像進(jìn)行去噪處理。中值平滑濾波器具有邊界保持的特性,是一種常用的圖像去噪工具。其去噪機(jī)理為:將需要處理的像素作為中心,生成一個尺寸為m×m 的模板,則模板中共有m2個數(shù),并按照從大到小的順序重新排序。從該模板中選擇第k 個與待處理像素的灰度差為最小的像素,然后將k 個像素的灰度中值替換待處理的像素值,達(dá)到降噪效果。
常用的圖像增強(qiáng)方法有頻域法、空域法、粗糙集法等幾種。頻域法計算量較大,空域法普適性差,綜合對比后本文選擇粗糙集法?;诖植诩碚摰膱D像增強(qiáng)流程為:首先對二維醫(yī)學(xué)影像(U)的子圖進(jìn)行劃分,分別得到一個較亮的子圖A1 和較暗的子圖A2。對兩個子圖做不同的變換處理,其中A1 為正切變換,A2 為正弦變換,在圖像增強(qiáng)的基礎(chǔ)上還可以調(diào)節(jié)器明暗對比度。正切變換算法為:
基于正切函數(shù)的圖像變換,通過降低中間灰度集處的對比度,使得圖像中亮處和暗處的對比更加明顯。該灰度集函數(shù)在中間部分的斜率<1,在靠近兩端處的斜率>1。參數(shù)α決定點(diǎn)運(yùn)算效果。正弦變換算法的計算公式為:
基于正弦函數(shù)的圖像變換,通過降低影像中較亮或較暗物體的對比度,達(dá)到加強(qiáng)灰度集處中間范圍物體的對比度。其中,灰度級范圍[0,Dm],參數(shù)α 越大,則上述效果越明顯。
本文選擇基于區(qū)域增長的圖像分割技術(shù),具體方法為:醫(yī)師在觀察病例X 照片的基礎(chǔ)上,確定腫瘤的大體位置,并使用鼠標(biāo)在該位置標(biāo)記一個像素點(diǎn),作為“種子點(diǎn)”。對于腫瘤所在區(qū)域中的任意一點(diǎn),如果與它周圍4 個相鄰點(diǎn)p(i,j)滿足以下條件:
則將該點(diǎn)加入到區(qū)域中,反之則將其排除。上式中Fmax和Fmin分別表示該區(qū)域內(nèi)最大和最小像素值,τ 為閾值,取值范圍[0,1]。重復(fù)上述判斷過程,一直到不存在滿足上述條件的相鄰像素點(diǎn)為止,這樣就可以勾畫出腫瘤邊緣線,從而實(shí)現(xiàn)了圖像分割。在此基礎(chǔ)上使用基于緊湊度的形狀特征提取,公式如下:
式(4)中P 表示區(qū)域邊界的周長,A 表示該區(qū)域的面積,C 為緊湊度。在計算中,P 的取值為邊界點(diǎn)數(shù)量,A 的取值為區(qū)域內(nèi)所含像素點(diǎn)的數(shù)量。C 值越大,表明區(qū)域邊緣的粗糙度越高,形狀特性不明顯。因此需要調(diào)節(jié)P 與A 的數(shù)值,使C盡可能的小,以便于從圖像中提取到腫瘤特征信息,為下一步的分類診斷提供必要的支持。
本文設(shè)計了一種用于乳腺腫瘤細(xì)胞的智能輔助診斷系統(tǒng),預(yù)期功能包括圖像預(yù)處理、腫瘤邊緣分割、腫瘤特征提取等。該系統(tǒng)使用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘、使用粗糙集算法設(shè)計數(shù)據(jù)分類器,可以實(shí)現(xiàn)腫瘤醫(yī)學(xué)圖像紋理特征的自動提取、精準(zhǔn)分類,為輔助醫(yī)師診斷病患乳腺部位有無腫瘤,以及腫瘤是良性還是惡性等提供了依據(jù)。
智能化輔助診斷系統(tǒng)的運(yùn)行流程如圖3 所示。
圖3 系統(tǒng)診斷流程
醫(yī)師進(jìn)入乳腺癌輔助診斷系統(tǒng)后,從“文件”中選擇對應(yīng)的文件夾并導(dǎo)入患者的醫(yī)學(xué)診斷影像,作為原始圖像。然后對該圖像進(jìn)行預(yù)處理,包括圖片反色、圖片去噪、圖片均衡變換,同時在預(yù)處理結(jié)束后自動得到物體區(qū)圖片和背景區(qū)圖片。選中某一副圖片后,從任務(wù)欄中點(diǎn)擊“圖片操作”一項(xiàng),在彈出的對話框中選擇紋理特征提取,從選中的圖片中提取出有價值的信息。然后再從任務(wù)欄中點(diǎn)擊“有無腫瘤分類器”,對提取到的信息進(jìn)行檢測,并判斷有無異常。如無異常,則結(jié)束本次診斷;如有異常,再從任務(wù)欄中點(diǎn)擊“良惡分類器”,在彈出的對話框中進(jìn)行腫瘤邊緣分割,并提取腫瘤形狀特征信息。根據(jù)提取到的信息進(jìn)行良性或惡性的判斷,如果檢測結(jié)果為良性,則結(jié)束本次診斷;如果檢測結(jié)果為惡性,則做進(jìn)一步的活體檢測并使用“最后確診分類器”做最終的診斷。
智能化乳腺癌輔助診斷系統(tǒng)設(shè)計完成后,為了提高圖像處理效率、特征提取精度以及確保診斷結(jié)果的可靠性,還必須進(jìn)行大量的數(shù)據(jù)樣本訓(xùn)練,系統(tǒng)訓(xùn)練流程如圖4 所示。
圖4 系統(tǒng)訓(xùn)練流程
該系統(tǒng)的訓(xùn)練模塊包含3 種類型的分類器,由于其功能各不相同,因此需要分別進(jìn)行訓(xùn)練。對于正常/異常分類器,功能是對患者的乳腺X 照片圖像進(jìn)行預(yù)處理,包括圖像去噪、圖像增強(qiáng)等。該分類器是基于灰度共生矩陣生成,訓(xùn)練前將采集到的海量醫(yī)學(xué)圖像紋理特征存入到數(shù)據(jù)庫中,有該分類器調(diào)用并進(jìn)行訓(xùn)練。完成訓(xùn)練后,該分類器可以自動從新的醫(yī)學(xué)影像圖片中提取特征信息并做出病例正?;虍惓5呐袛?。對于良性/惡性分類器,功能是基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò),對提取到的腫瘤圖像做邊緣分割處理,并將分割后的腫瘤邊緣特征存入到數(shù)據(jù)庫中,分類器調(diào)用該數(shù)據(jù)進(jìn)行訓(xùn)練。完成訓(xùn)練后,該分類器可以自動完成腫瘤良性或惡性的判斷。對于最后確診分類器,則是收集生理組織切片數(shù)據(jù)并存入數(shù)據(jù)庫中,以供分類器訓(xùn)練。完成訓(xùn)練后該分類器可以對病例做最終診斷。
智能化乳腺癌輔助診斷系統(tǒng)基于Windows 10 操作系統(tǒng)開發(fā),使用開發(fā)語言為Delphi 8.0,數(shù)據(jù)庫系統(tǒng)為SQL Server 2018;運(yùn)行環(huán)境同上。該系統(tǒng)界面簡潔,人機(jī)交互效果好,并且具有較好的可擴(kuò)展性,可根據(jù)醫(yī)院診斷需要進(jìn)行新功能的開發(fā),提高診斷系統(tǒng)的兼容性。功能方面,經(jīng)過大量的樣本數(shù)據(jù)訓(xùn)練后,該系統(tǒng)可實(shí)現(xiàn)對乳腺X 影像圖片的去噪、增強(qiáng)等處理,并且勾畫腫瘤輪廓,自動完成腫瘤邊緣分割,以及提取邊緣特征信息。利用不同的分類器對提取到的特征信息做差異化處理,包括對病例的正?;虍惓T\斷,以及對病例腫瘤的良性或惡性診斷,對病例生理切片數(shù)據(jù)的最終診斷。整個輔助診斷過程用時短、操作少、結(jié)果可靠度高,不僅極大減輕了醫(yī)師的工作量,而且對提高醫(yī)師診斷結(jié)果的精確性有積極幫助。
在醫(yī)院信息化建設(shè)過程中,輔助診斷系統(tǒng)逐漸在各個科室得到了普及應(yīng)用。該系統(tǒng)的工作原理是在海量樣本數(shù)據(jù)訓(xùn)練的基礎(chǔ)上,自動從新病例的醫(yī)學(xué)影像中提取特征信息,得出判斷結(jié)果,以便于醫(yī)師在診斷中加以參考?;趶较蚧瘮?shù)神級網(wǎng)絡(luò)設(shè)計分類器,配合使用基于粗糙集理論的數(shù)據(jù)挖掘算法,可以做到對圖像去噪、增強(qiáng)處理,在此基礎(chǔ)上提取特征信息并使用分類器做出判斷,讓輔助診斷系統(tǒng)的診斷效率更高、診斷結(jié)果更加可靠,具有推廣應(yīng)用價值。