朱亞飛,付舒悅,楊仕虎,姚佩玲,譚穎
(西南民族大學計算機科學與技術學院,成都610225)
基于血氧水平依賴性(BOLD)效應的功能性磁共振成像(function Magnetic Resonance Imaging,fMRI)技術是一種新興的神經影像學方式。相比于以往的PET、CT 等成像技術,fMRI 有高空間分辨率、無創(chuàng)傷、無輻射等優(yōu)勢。fMRI 技術作為神經影像學中最重要的工具之一,它已經用于腦科學、臨床等相關領域,并被廣泛運用到對人腦功能、精神疾病的研究中。
fMRI 圖像分為靜息態(tài)與任務態(tài)兩種。在人腦中存在著一個默認的功能腦網絡,即使人在休息時依然消耗人體大量的能量。靜息態(tài)下大腦有很多自發(fā)的活動,無任務刺激下大腦內部腦區(qū)間信號較高的同步性,稱為固有功能連接。 與其相對的是任務態(tài),任務態(tài)fMRI 是指預先設計某種任務,例如一段時間內動舌頭、動手指等,在這段時間內連續(xù)采集一個人的腦功能磁共振圖像。本文研究的是靜息態(tài)功能性核磁共振圖像。
精神分裂癥是最常見的重性疾病之一,全球大約有1%的患病人群[1],患者常有知覺、情感、思維等方面的障礙,并且精神活動與環(huán)境表現出明顯的不協(xié)調性,與正常人的思維存在著明顯的不同。目前,精神分裂癥的診斷主要依據患者的行為表現,如常用的陽性與陰性癥狀量表進行定量評估[2],但由于病因未明、診斷信度,如何從根源治療精神疾病等問題仍未解決,揭示其成病機理對診斷和治療都有著重大意義。研究表明,大腦腦區(qū)存在的結構異常更有可能是精神疾病的成病原因[3-5],隨著MRI 成像技術不斷進步,將MRI 圖像運用到對精神分裂癥的分類可以進一步為研究精神分裂癥的成病機理提供明確的方向。
盡管在機器學習領域中分類算法不斷進步,但是基于fMRI 數據的精神分裂癥分類研究仍處于起步階段。其診斷水平遠遠低于人類專家的水平,而基于fMRI 和機器學習的精神分裂癥研究面臨著幾個不可避免的問題和挑戰(zhàn)。
首先,目前對人腦的結構和功能知之甚少。具體來說,精神分裂癥的病因和患有這種疾病的患者大腦的異常模式仍不清楚[6]。目前而言,精神分裂癥分類中唯一可用的特征是從功能性磁共振成像數據構建腦功能連接。因此,利用數學工具從功能性磁共振成像數據中提取深層信息變得越來越重要。
其次,fMRI 數據匱乏,如文獻[7]所列,在近5 年(2014-2018 年)的21 項精神分裂癥分類研究中,平均樣本量為208、中值樣本量為147。因此,如何選擇合適的機器學習方法起關鍵作用。
本實驗使用的數據來自于COBRE(Center for Biomedical Research Excellence)數據集(http://fcon_1000.projects.nitrc.org/indi/retro/cobre.html),是由卓越生物醫(yī)學研究中心提供的來自72 位精神分裂癥患者(58 名男性,18-65 歲)和74 位健康對照組(51 名男性,18-65歲)的原始fMRI 腦影像數據和其他臨床信息,該數據集經過篩選,不包含最近12 個月內有神經系統(tǒng)疾病者,智力低下者,遭受過嚴重的頭部外傷導致喪失意識超過5 分鐘者及有藥物濫用或依賴者。本實驗使用COBRE 數據集的靜息態(tài)fMRI 數據,每個受試者的fMRI 數據集是單個nifti 文件,使用平面回波成像EPI 序列在32 個軸向切片中獲得全腦BOLD 圖像。
原始的fMRI 數據含有較多的噪聲,本實驗使用SPM(Statistical Parametric Mapping)工具包對fMRI 圖像數據進行預處理,先進行時間校正(Slice timing)使不同時間掃面的層校正為同一時間獲得層,然后進行頭動校正(Realignment)對所有圖像進行空間調整,減少在數據采集過程中由頭動引起的數據噪聲和差異,再對圖像標準化(Normalization)以便于確定網絡節(jié)點ROI 和網絡分析結果的組分析,最后采用高斯核(Gaussian kernel)的全寬半高FWHM=8 來對圖形進行平滑化處理(Smooth)提高圖像的信噪比。
對于監(jiān)督學習問題來說,我們需要輸入特征與標簽,然后通過學習得到一個機器學習模型。在神經疾病的神經影像處理中,文獻[8]將構建的腦功能連接作為特征與被試的標簽來學習模型。在提取腦區(qū)與時間序列之后,我們計算腦區(qū)間的皮爾遜相關系數,將其作為特征來學習模型。
COBRE 數據集是四維fMRI 數據(包括三維的空間信息和一維的時間序列)。在實際應用中,我們更多的是利用大腦圖像的時間序列做研究分析。因為無法直接使用四維的數據做相關研究,所以我們提取預處理后的fMRI 數據集在ROI 的時間序列,可以將四維fMRI 數據轉換成二維數據(包括一維時間和一維特征)。我們使用Atlas 腦區(qū)模板來對所有預處理后的fMRI 圖像進行統(tǒng)一劃分。文獻[9-10]通過多學科字典學習算法,從靜息態(tài)fMRI 中提取的組級區(qū)域腦圖譜。它將大腦劃分為39 個腦區(qū),可視化如圖1 所示。
圖1 Atlas腦模板
分區(qū)之后,我們提取每個腦區(qū)的ROI 時間序列。將四維的fMRI 數據轉換成二維的時間序列數據(包括一維的時間序列和一維的空間信息)。這樣,我們得到每個被試的39 個腦區(qū)波動曲線。
圖2 腦區(qū)BOLD信號波動曲線
在每個被試的39 個腦區(qū)上進行相關性分析,即計算腦區(qū)間的相關性系數。皮爾遜相關系數由英國數學家Pearson 提出,用于計算變量之間的線性相關程度,又被人們稱作皮爾遜積矩相關系數。我們通過皮爾遜相關系數來計算腦功能連接。計算公式如下:
其中Pij表示腦區(qū)i 與腦區(qū)j 之間的皮爾遜相關系數;Pi和Pj分別表示腦區(qū)i 和腦區(qū)j 上所有體素上的BOLD 信號均值和表示序列Pi和Pj的均值。
計算后,我們得到每個被試的腦功能連接矩陣(39×39),腦功能連接矩陣是對稱矩陣,如圖3 所示。
圖3 功能連接矩陣
可視化大腦功能連接如圖4 所示。
圖4 功能連接可視化
在機器學習模型上,我們對數據輸入維度有很高要求。當一些高維度數據(例如fMRI 數據Rn*p,其中n 為被試數往往小于500,p 為樣本特征數往往大于10000,可見p 遠遠大于n)在沒有經過特征選擇時,直接進行模型訓練會造成小n 大p 的問題或者維數災難。我們對高維數據分類時,首先要先對其進行降維處理,提取有效特征進行訓練。這樣不僅能簡化機器學習模型,還能提高訓練效率和準確率。
我們選擇了主成分分析法(PCA)來降低特征維度,即減少特征個數。PCA 本質是一種特征提取和降維算法。PCA 算法也稱作卡洛南·洛伊變換,核心思想是通過最小均方誤差,將高維度數據進行線性變換,降低數據維度來提取數據的主要線性成分。
支持向量機(Support Vector Machine)是Cortes 和Vapnik 于1995 年首先提出的,它在解決小樣本、非線性及高維的模式識別中表現出許多特有的優(yōu)勢。
對于分類問題,SVM 通過找到一個超平面來有效地劃分樣本數據,同時使樣本點距超平面的距離盡可能遠。這樣可以將超平面用于對未知樣本進行分類,并且使得劃分錯誤率最小。
SVM 對特征的縮放非常敏感,如圖5 所示,在左圖中,垂直刻度比水平刻度大得多,因此可能的最寬間隔接近于水平。在特征縮放后,決策邊界的間隔更大,分類效果更好。
圖5 歸一化對分類邊界的影響
我們使用準確率(Accuracy,ACC)來衡量一個分類器。即正確分類的個數所占全體測試集的比例。計算方式如下:
其中,我們用4 個指標來衡量敏感性和特異性:TP(True Positive)為正確劃分出病人的個數;FN(False Negative)為錯誤劃分病人的個數;TN(True Negative)為正確劃分正常人的個數;FP(False Positive)為錯誤劃分正常人的個數[11]。
在疾病診斷分類過程中,我們可以使用敏感性(Sensitivity,SEN)和特異性(Specificity,SPE)作為診斷有效性的評估指標,患某疾病為陽性,正常人為陰性。
計算方式如下:
根據以上知識可知,SEN 可理解為在患病人群中,正確劃分出病人的概率;SPE 為在正常人群中,正確劃分出正常人的概率。我們可通過敏感性和特異性來衡量對疾病的診斷結果,SEN 越高,漏診概率越低,SPE越高確診概率越高。
在實驗中,我們選取了3 種常用的核函數,分別是線性核函數(Linear)、多項式核函數(Polynomial,POLY)和徑向基核函數(Radial Basis Function,RBF)。
我們將未歸一化的訓練集和歸一化的訓練集分別送入不同核函數的SVM 訓練,然后采取10 折驗證的方法,得到如表1 的結果。
表1 各個核函數在COBRE 數據集上的得分
通過上表可知:
(1)在線性核函數上,歸一化對結果影響較大;
(2)在線性核函數中,準確率雖然會提高,但是敏感性會降低;
(3)在RBF 核函數中,準確率雖然降低,但是敏感性大幅度特高。
本文對精神分裂癥的分類研究有一定意義。在機器學習領域,我們通過構建功能連接,建立起神經影像與機器學習的橋梁。將功能連接作為被試的特征,對精神分裂癥的成病機制也有較好的解釋。在臨床領域,僅有146 個樣本數據的情況下,分類準確率最高達78.5%,輔助醫(yī)生診斷。