張嘉茗,林 楠,張夢(mèng)翰,張 亮,李淑元,熊墨淼,王笑峰,金 力
(1. 復(fù)旦大學(xué) 生命科學(xué)學(xué)院,上海 200438;2. 德克薩斯大學(xué) 公共衛(wèi)生學(xué)院,休斯頓TX 77030;. 第二軍醫(yī)大學(xué)附屬長(zhǎng)海醫(yī)院 心血管內(nèi)科,上海 200433)
基于三元泛函主成分分析和聚類分析的MRI圖像分類研究
張嘉茗1,林 楠2,張夢(mèng)翰1,張 亮3,李淑元1,熊墨淼2,王笑峰1,金 力1
(1. 復(fù)旦大學(xué) 生命科學(xué)學(xué)院,上海 200438;2. 德克薩斯大學(xué) 公共衛(wèi)生學(xué)院,休斯頓TX 77030;. 第二軍醫(yī)大學(xué)附屬長(zhǎng)海醫(yī)院 心血管內(nèi)科,上海 200433)
一元泛函主成分分析(FPCA)已經(jīng)在fMRI上成功進(jìn)行了應(yīng)用,但是目前很少有研究運(yùn)用多元FPCA對(duì)MRI進(jìn)行探索.本研究將一元FPCA推廣到三元并應(yīng)用于MRI的圖像特征提取,并對(duì)提取的特征進(jìn)行了后續(xù)研究,提出了一整套MRI病理及正常圖像的分析方法.該方法的主要流程是先對(duì)MRI圖像進(jìn)行預(yù)處理(圖像配準(zhǔn)和圖像分割),得到腦脊液圖像,然后運(yùn)用三元FPCA對(duì)腦脊液進(jìn)行特征提取,再對(duì)提取的特征進(jìn)行選擇,隨后利用k- means聚類算法對(duì)特征進(jìn)行聚類,來判斷圖像所屬的類別(正?;虍惓?,從而達(dá)到顱腦MRI圖像病變篩查的目的.將該方法應(yīng)用于顱腦MRI快速自旋回波T2加權(quán)像中,結(jié)果發(fā)現(xiàn),相比于傳統(tǒng)PCA,三元FPCA展現(xiàn)出更好的特征提取能力,可以有效提高圖像分類的準(zhǔn)確率.
泛函主成分分析; 主成分分析; 顱腦MRI; 聚類分析
隨著CT(Computed Tomography, 計(jì)算機(jī)斷層掃描技術(shù))、MRI(Magnetic Resonance Image, 磁共振成像)等影像學(xué)技術(shù)的發(fā)展,醫(yī)學(xué)影像的分辨率在極大提高的同時(shí),MRI等醫(yī)學(xué)影像的數(shù)據(jù)量也在呈指數(shù)級(jí)增長(zhǎng).然而,在疾病篩查工作中,圖像閱讀和診斷的較大工作量是放射科工作人員難以承受的.此外,大量的圖像數(shù)據(jù)和臨床信息還會(huì)導(dǎo)致MRI圖像中存在較多的結(jié)構(gòu)噪音和復(fù)雜的疾病狀態(tài)表現(xiàn),這極大影響了醫(yī)生對(duì)病癥的診斷效率和準(zhǔn)確度.因此,如何從大量的MRI圖像數(shù)據(jù)中提取有效的特征,輔助醫(yī)生進(jìn)行關(guān)于結(jié)構(gòu)或組織病理的診斷,減輕診斷醫(yī)師的工作負(fù)荷并提高診斷的準(zhǔn)確性,是目前醫(yī)學(xué)圖像分析領(lǐng)域中一個(gè)亟待解決的問題.
目前關(guān)于MRI圖像特征提取的主要方法有主成分分析(Principal Component Analysis, PCA)[1]、獨(dú)立成分分析(Independent Component Analysis, ICA)[2]等.PCA能從數(shù)據(jù)的協(xié)方差陣中提取不相關(guān)的主要活動(dòng)信號(hào);而ICA不僅能抑制高斯白噪聲,還能分解出獨(dú)立的非高斯信號(hào).但是,ICA方法獲得的各個(gè)獨(dú)立信號(hào)的幅值缺乏實(shí)際意義,導(dǎo)致該方法無法對(duì)多個(gè)獨(dú)立信號(hào)間的關(guān)系進(jìn)行后續(xù)的量化分析.
通常,MRI體數(shù)據(jù)多為規(guī)則結(jié)構(gòu)化體數(shù)據(jù)集,該數(shù)據(jù)的特點(diǎn)是在空間中存在明確的拓?fù)湎噜応P(guān)系,因而可以定義為一個(gè)三維空間上的采樣函數(shù).但是ICA方法僅將MRI體數(shù)據(jù)作為一種離散數(shù)據(jù)進(jìn)行分析,未能考慮到不同切層圖像之間的相鄰性以及圖像信號(hào)隨空間變化的潛在規(guī)律.這使得上述方法無法有效擴(kuò)展到MRI三維體數(shù)據(jù)的分析工作中.針對(duì)這類局限性,Ramsay和Dalzell[3]正式提出了泛函數(shù)據(jù)分析(Functional Data Analysis, FDA)的概念,并使用泛函主成分分析(Functional Principal Component Analysis, FPCA)方法對(duì)加拿大溫度與降水量的關(guān)系進(jìn)行了實(shí)證研究.與傳統(tǒng)數(shù)據(jù)分析相比,F(xiàn)DA將連續(xù)變化的曲線作為研究的單元,能有效解決數(shù)據(jù)采集時(shí)間間隔不同或者數(shù)據(jù)缺失的問題.從動(dòng)態(tài)的角度考慮問題,F(xiàn)DA的優(yōu)勢(shì)是沒有傳統(tǒng)統(tǒng)計(jì)方法的參數(shù)限制,從而使其具有更強(qiáng)的適用性.另外,F(xiàn)DA將大量數(shù)據(jù)描述為函數(shù)形式,這有助于在處理海量數(shù)據(jù)的過程中對(duì)單一曲線求導(dǎo)或者對(duì)多個(gè)曲線進(jìn)行降維,從而為分析曲線之間的差異和曲線內(nèi)部的動(dòng)態(tài)變化模式提供更多的信息.
近年來,泛函數(shù)據(jù)分析方法已經(jīng)開始受到學(xué)者的關(guān)注,并在功能性磁共振成像(functional Magnetic Resonance Imaging, fMRI)領(lǐng)域展開了應(yīng)用.Viviani等[4]將FPCA應(yīng)用于單個(gè)被試的fMRI,通過對(duì)比FPCA和傳統(tǒng)PCA的結(jié)果,發(fā)現(xiàn)FPCA可以更有效地提取fMRI中血氧水平的變化特征;Long等[5]運(yùn)用FPCA估計(jì)多個(gè)被試fMRI中的非平穩(wěn)噪聲.然而上述研究運(yùn)用的FPCA僅僅局限于一元情形,針對(duì)多元FPCA在MRI圖像中的應(yīng)用,目前極少有文獻(xiàn)進(jìn)行討論.針對(duì)MRI三維數(shù)據(jù)的特點(diǎn),本文將一元FPCA推廣到三元FPCA,并給予相應(yīng)的數(shù)學(xué)證明.
本文以顱腦MRI病變篩查為研究目標(biāo),采用三元FPCA的圖像特征提取方法,對(duì)MRI病理及正常圖像的分類進(jìn)行了研究.主要研究步驟如下: 1) 對(duì)MRI圖像進(jìn)行預(yù)處理(圖像配準(zhǔn)和圖像分割),得到腦脊液圖像;2) 運(yùn)用三元FPCA對(duì)腦脊液進(jìn)行特征提取,再對(duì)提取的特征進(jìn)行特征選擇;3) 利用k- means聚類算法對(duì)已選擇的特征進(jìn)行聚類,來判斷圖像所屬的類別(正?;虍惓?,從而達(dá)到顱腦MRI圖像病變篩查的目的.為了驗(yàn)證方法的可靠性和準(zhǔn)確性,我們將實(shí)驗(yàn)結(jié)果與傳統(tǒng)PCA方法進(jìn)行對(duì)比,結(jié)果證明三元FPCA展現(xiàn)出更好的特征提取能力,可以有效提高圖像分類的準(zhǔn)確率.
一般來說,多元統(tǒng)計(jì)分析處理的是每一個(gè)觀測(cè)樣本的多個(gè)變量在同一時(shí)期或時(shí)點(diǎn)上呈現(xiàn)出的數(shù)據(jù).為了對(duì)多變量之間存在的信息冗余進(jìn)行約減,通常采用主成分分析方法將原來較多的變量轉(zhuǎn)化為少數(shù)幾個(gè)綜合變量.
泛函數(shù)據(jù)分析的基本思想是將每個(gè)觀測(cè)對(duì)象帶有泛函性質(zhì)的數(shù)據(jù)看作一個(gè)整體,而不僅僅是個(gè)體觀測(cè)值的一個(gè)序列.泛函分析把傳統(tǒng)的有限維空間中的數(shù)據(jù)擴(kuò)展到了無限維空間,以一個(gè)全新的視角對(duì)數(shù)據(jù)進(jìn)行分析,然而泛函數(shù)據(jù)內(nèi)在的無限維特征也給相關(guān)問題的統(tǒng)計(jì)推斷帶來了挑戰(zhàn).對(duì)此,可以將多元主成分分析的方法引入到泛函數(shù)據(jù)中,稱為泛函主成分分析(FPCA).根據(jù)觀測(cè)對(duì)象測(cè)度變量的個(gè)數(shù),泛函主成分分析可分為一元FPCA和多元FPCA.本文對(duì)多元FPCA進(jìn)行了研究,在一元FPCA的基礎(chǔ)上,推導(dǎo)出三元FPCA的計(jì)算方法及其求解過程.下面以三維MRI體數(shù)據(jù)為例,對(duì)三元FPCA進(jìn)行介紹.
1.1三元FPCA
MRI體數(shù)據(jù)作為三維離散圖像,它可以表示成三維函數(shù)f(s,t,u),其中:
f在三維空間坐標(biāo)點(diǎn)(s,t,u)的值為MR成像時(shí)表現(xiàn)的灰度值.
假設(shè)觀測(cè)數(shù)據(jù)是已經(jīng)過零均值化處理的MRI體數(shù)據(jù)集xi(s,t,u),i=1,2,…,N,其中(s,t,u)表示三維空間中的位置坐標(biāo).設(shè)Ω是空間區(qū)域,(s,t,u)∈Ω,則三元泛函變量的主成分f定義如下:
(1)
其中β(s,t,u)是權(quán)重函數(shù).
進(jìn)而,主成分f的方差為
(2)
其中R(s1,t1,u1,s2,t2,u2)=cov(x(s1,t1,u1),x(s2,t2,u2)),是x(s,t,u)的協(xié)方差函數(shù).
為了避免主成分的權(quán)重函數(shù)β(s,t,u)過度粗糙,導(dǎo)致主成分分析結(jié)果的可解釋性降低,本文在泛函主成分分析過程中引入了粗糙懲罰項(xiàng)來控制函數(shù)的粗糙程度[6],從而得到較平滑的權(quán)重函數(shù).
(3)
第k個(gè)主成分滿足:
(4)
式(4)中μ為平滑參數(shù),約束條件等號(hào)左邊第二項(xiàng)就是粗糙懲罰項(xiàng).μ越大,得到的權(quán)重函數(shù)越平滑,相應(yīng)的主成分函數(shù)的方差受β(s,t,u)粗糙度影響也越大,反之,得到的權(quán)重函數(shù)波動(dòng)越激烈.當(dāng)μ→0時(shí),問題變?yōu)槲词┘討土P的泛函主成分分析問題.這里平滑參數(shù)μ的選擇采用交叉驗(yàn)證的方法[7,8].
應(yīng)用拉格朗日乘數(shù)法,上述條件極值問題可轉(zhuǎn)換為如下最大化問題:
(5)
其中ρ為參數(shù).
定義泛函如下:
(6)
則對(duì)式(5)的求解轉(zhuǎn)變?yōu)閷?duì)式(6)泛函極值的求解,而泛函極值可以通過變分法[9]求得.
設(shè)
(7)
其中δβ(s,t,u)為β(s,t,u)的變分,ε為任意小參數(shù),h(s,t,u)為任意函數(shù).則式(6)的一階變分為
(8)
由極值條件
(9)
得
(10)
由h(s,t,u)的任意性,得
(11)
其中λ是特征值,即三元泛函主成分求解問題可以轉(zhuǎn)化為求解式(11)的積分方程問題.
1.2三元FPCA的求解
由上述可知,平滑的泛函主成分的求解可以轉(zhuǎn)化為式(11)特征值和特征函數(shù)的求解問題.在實(shí)際計(jì)算過程中,常用的求解方法是對(duì)函數(shù)用適當(dāng)?shù)幕归_.本文采用的是傅里葉標(biāo)準(zhǔn)正交基.
假設(shè)經(jīng)過標(biāo)準(zhǔn)化處理后的MRI體數(shù)據(jù)樣本為xi(s,t,u),i=1,2,…,N,{φj(t)}是傅里葉基函數(shù),對(duì)于每個(gè)j,定義ω2j-1=ω2j=2πj.選擇一組基函數(shù){φk(t)}(k=1,2,…,K),對(duì)樣本數(shù)據(jù)進(jìn)行傅里葉展開有
(12)
(13)
其中?表示矩陣的Kronecker積.
類似地有
(14)
(15)
其中b=[b111,…,b11K,…,bKK1,…,bKKK]T.
定義函數(shù)向量X(s,t,u)=[x1(s,t,u),…,xN(s,t,u)]T,則所有N個(gè)樣本數(shù)據(jù)的基函數(shù)展開可以表示為
X(s,t,u)=C(φ(s)?φ(t)?φ(u)),
(16)
(17)
則有
(18)
將式(17)和(18)代入到積分方程(11)中,得
(19)
進(jìn)一步可得
(20)
上式也可以寫成
(21)
其中u=S-1b.
解得u之后根據(jù)b=Su,可得一系列正交的特征向量bj.將bj代入式(14)即可得到一系列的正交特征函數(shù)
βj(s,t,u)=[φT(s)?φT(t)?φT(u)]bjj=1,2,…,J.
(22)
定義擴(kuò)展的內(nèi)積為:
(23)
每組體數(shù)據(jù)集xi(s,t,u)可由這些特征函數(shù)表示如下:
(24)
為了探究三元FPCA對(duì)顱腦MRI圖像病變的特征提取能力,本文對(duì)同樣一組數(shù)據(jù),首先進(jìn)行圖像預(yù)處理,得到腦脊液圖像,然后分別用三元FPCA和傳統(tǒng)PCA對(duì)腦脊液圖像進(jìn)行特征提取,再對(duì)提取的特征進(jìn)行特征選擇,最后利用k- means進(jìn)行聚類,將分類結(jié)果與實(shí)際診斷信息對(duì)比,從而得到分類準(zhǔn)確率,用于比較和分析實(shí)驗(yàn)結(jié)果,具體步驟如下.
2.1磁共振成像數(shù)據(jù)
本文使用的38例顱腦MRI由江蘇省泰州市人民醫(yī)院提供,其中正常13例,25例異常均為非急性期檢查者.在25例異常中,腦卒中24例(缺血性腦梗死15例,腔隙性腦梗死9例),腦腫瘤1例.腦卒中診斷參照2007年《中國(guó)腦血管病防治指南》,排除其他非血管性原因(如硬膜下血腫、癲癇后麻痹、腦外傷等)造成的腦功能障礙.正常個(gè)體指無腦血管病、自身免疫病、血液系統(tǒng)疾病、腫瘤、肝腎功能不全等疾病的個(gè)體.所有被試者體內(nèi)均無金屬植入物或沒有MRI檢查禁忌癥,自愿參加本研究并簽署知情同意書.本研究已獲得復(fù)旦大學(xué)生命科學(xué)學(xué)院倫理委員會(huì)批準(zhǔn).
使用Siemens公司生產(chǎn)的Veior 3.0T磁共振成像系統(tǒng)對(duì)被試者腦部進(jìn)行MRI掃描.常規(guī)三平面定位后,采用快速自旋回波(Turbo Spin Echo, TSE)脈沖序列,獲得T2加權(quán)像(T2 Weighted Image, T2 WI),其掃描參數(shù)如下: TR=3220ms,TE=93ms,F(xiàn)A=150°,層數(shù): 56~60層,層厚=3mm,F(xiàn)OV=22cm×22cm,矩陣=256×256,Nex=1.
2.2MRI數(shù)據(jù)格式轉(zhuǎn)換及預(yù)處理
采用MRIcroN軟件(http:∥www.cabiatl.com/mricro/mricron/dcm2nii.html)將原始DICOM圖像轉(zhuǎn)換成NIfTI文件格式.轉(zhuǎn)換格式后,使用SPM8[10](Statistical Parametric Mapping, Wellcome Trust Centre for Neuroimaging, London, UK)軟件對(duì)T2 WI進(jìn)行預(yù)處理,首先采用仿射變換(affine transformation)和非線性形變(non- linear deformation)進(jìn)行空間標(biāo)準(zhǔn)化,將實(shí)驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化到SPM8自帶的T2模板上,體素大小重采樣至1.5mm×1.5mm×1.5mm;然后對(duì)標(biāo)準(zhǔn)化后的腦結(jié)構(gòu)圖像進(jìn)行解剖分割,得到灰質(zhì)、白質(zhì)和腦脊液3種圖像;最后對(duì)分割后的圖像進(jìn)行高斯平滑(半高全寬參數(shù)=8mm),以提高信噪比,使數(shù)據(jù)更接近高斯隨機(jī)場(chǎng)模型.
2.3預(yù)處理后的腦脊液圖像
本研究采用的25例患者均在非急性期接受MRI檢查,除1例腦腫瘤外,其余皆為缺血性腦梗死(15例)和腔隙性腦梗死(9例).而缺血性腦梗死在MRI的T2 WI上的表現(xiàn)取決于梗死的時(shí)間,過了急性期后大的梗死灶最終形成囊性軟化灶,表現(xiàn)近于腦脊液的信號(hào)[11];腔隙性腦梗死在慢性期,MRI的T2 WI呈高信號(hào),與腦脊液信號(hào)類似[12].此外,對(duì)樣本圖像進(jìn)行預(yù)處理后得到的腦脊液圖像,也顯示其中保留了異常病灶信號(hào)(圖1~圖3(見第46頁)所示).
因此,針對(duì)樣本MRI圖像的特點(diǎn)以及要篩查出的病變,我們考慮利用分割后的腦脊液圖像做后續(xù)的特征提取.
圖1 正常人原始圖像及分割后的組織Fig.1 Original image of a normal person and its segmented tissues
圖2 腔隙性腦梗死原始圖像及分割后的組織Fig.2 Original image of a patient with lacunar infarction and its segmented tissues
圖3 腦腫瘤原始圖像及分割后的組織Fig.3 Original image of apatient with brain tumor and its segmented tissues
2.4MRI圖像特征提取及聚類
對(duì)每例MRI體數(shù)據(jù),分別用三元FPCA和傳統(tǒng)PCA提取主成分,再通過確定性貪心選擇算法(deterministic greedy selection algorithm for column subset selection)[13]對(duì)提取的主成分進(jìn)行特征選擇,從而得到最終的泛函主成分系數(shù)矩陣SFPCA和傳統(tǒng)主成分系數(shù)矩陣SPCA.
采用k- means聚類算法[14]對(duì)主成分系數(shù)矩陣進(jìn)行多次聚類(100次),從中選擇最優(yōu)的結(jié)果,得到分類標(biāo)簽向量.對(duì)比分類得到的標(biāo)簽向量和實(shí)際診斷結(jié)果,計(jì)算準(zhǔn)確率,用于比較和評(píng)價(jià)兩種特征提取方法對(duì)分類準(zhǔn)確率的影響.
實(shí)驗(yàn)結(jié)果(表1)表明,利用三元FPCA進(jìn)行k- means分類的結(jié)果良好,并在準(zhǔn)確率和特異性上優(yōu)于PCA方法.實(shí)驗(yàn)最后使用了96個(gè)泛函主成分進(jìn)行聚類分析,這些主成分的累積方差貢獻(xiàn)率達(dá)到95%.圖4比較了兩種方法前1~5個(gè)主成分對(duì)應(yīng)的累積方差貢獻(xiàn)率.圖4顯示,用三元FPCA得到的第一個(gè)主成分方差貢獻(xiàn)率就已經(jīng)達(dá)到0.49,而PCA僅為0.09,遠(yuǎn)不及三元FPCA的特征提取能力.另外,PCA提取到第5個(gè)主成分的累積貢獻(xiàn)率也才為0.29,而FPCA為0.61.
表1 三元FPCA和PCA的分類結(jié)果比較
以上結(jié)果表明,較之傳統(tǒng)PCA,三元FPCA在對(duì)圖像進(jìn)行數(shù)據(jù)降維和特征提取方面更有優(yōu)勢(shì).原因在于該方法將每例MRI體數(shù)據(jù)集看作一個(gè)連續(xù)的整體,考慮到了每例被試不同切層圖像之間的相鄰關(guān)系,對(duì)所有切層圖像數(shù)據(jù)進(jìn)行了整體的降維,從而使圖像中差異最大的特征得到了更大程度的保留.而傳統(tǒng)PCA對(duì)每例被試的每層圖像數(shù)據(jù)進(jìn)行“獨(dú)立”地降維,并不能發(fā)現(xiàn)數(shù)據(jù)集中的非線性結(jié)構(gòu).此外,上述結(jié)果也驗(yàn)證了基于三元FPCA進(jìn)行顱腦MRI圖像分類識(shí)別的可行性和有效性.
圖4 FPCA、PCA前1~5個(gè)主成分的累積方差貢獻(xiàn)率比較Fig.4 Comparison between the cumulative contribution of variances of the first 5 principal components obtained by FPCA and that obtained by PCA
本文以顱腦MRI疾病篩查為研究目標(biāo),在圖像特征提取方面將一元FPCA推廣到了三元FPCA,再結(jié)合已有的MRI圖像預(yù)處理軟件,建立了一整套MRI病理/正常圖像分析方法.該方法首先對(duì)樣本圖像進(jìn)行圖像配準(zhǔn)和分割,然后運(yùn)用三元FPCA對(duì)腦脊液進(jìn)行特征提取,緊接著再對(duì)特征進(jìn)行選擇,隨后用k- means對(duì)已選擇的特征進(jìn)行聚類,從而達(dá)到顱腦MRI圖像病變篩查的目的.將該方法應(yīng)用于38例顱腦MRI數(shù)據(jù)集上,結(jié)果證實(shí)三元FPCA較傳統(tǒng)PCA有更好的數(shù)據(jù)降維和特征提取能力,有效地提高了MRI圖像分類的準(zhǔn)確率及效率.本文所提出的一整套MRI病理/正常圖像聚類分析方法,可以實(shí)現(xiàn)對(duì)顱腦MRI從圖像配準(zhǔn)、圖像分割、圖像特征提取、分類識(shí)別的全過程控制,為未來大規(guī)模應(yīng)用到MRI圖像中提供了可行性.
[1] JOLLIFFE I T. Principal component analysis [M]. New York: Springer, 2002.
[2] HYVARINEN A, OJA E. Independent component analysis: Algorithms and applications[J].NeuralNetworks, 2000,13(4- 5): 411- 430.
[3] RAMSAY J O, DALZELL C J. Some tools for functional data analysis[J].JournaloftheRoyalStatisticalSociety, 1991,53(3): 539- 572.
[4] VIVIANI R, GRON G, SPITZER M. Functional principal component analysis of fMRI data [J].HumanBrainMapping, 2005,24(2): 109- 129.
[5] LONG C J, BROWN E N, TRIANTAFYLLOU C,etal. Nonstationary noise estimation in functional MRI [J].Neuroimage, 2005,28(4): 890- 903.
[6] RAMSAY J O, SILVERMAN B W. Functional data analysis [M]. New York: Springer, 1997.
[7] 靳劉蕊.函數(shù)性數(shù)據(jù)分析方法及應(yīng)用研究[D].廈門: 廈門大學(xué),2008.
[8] 李紅廣.基于B樣條基粗糙懲罰的某些約束函數(shù)型數(shù)據(jù)光滑方法研究[D].上海: 華東師范大學(xué),2008.
[9] SAGAN H. Introduction to the calculus of variations [M]. New York: Dover Publications, Inc, 1992.
[10] FRISTON K J, HOLMES A P, WORSLEY K J,etal. Statistical parametric maps in functional imaging: A general linear approach [J].HumanBrainMapping, 1994,2(4): 189- 210.
[11] 王維治.CT及MRI在腦血管疾病診斷中的應(yīng)用及評(píng)價(jià)[J].中國(guó)實(shí)用內(nèi)科雜志,2001,21(8): 496- 498.
[12] 金征宇.醫(yī)學(xué)影像學(xué)[M].北京: 人民衛(wèi)生出版社,2010: 69.
[13] CIVRIL A, MAGDON- ISMAIL M. Deterministic sparse column based matrix reconstruction via greedy approximation of SVD[C]∥Proc 19th International Symposium on Algorithms and Computation(ISAAC 2008). New York: Springer, 2008: 414- 423.
[14] MACQUEEN J B. Some methods for classification and analysis of multivariate observations[C]∥Proceedings of 5- th Berkeley Symposium on Mathematical Statistics and Probability[M]. Berkeley: University of California Press, 1967.
Abstract: One dimensional functional principal component analysis(FPCA) has been successfully applied in functional magnetic resonance imaging(fMRI) data. But there is scarce study focused on the application of high dimensional FPCA in magnetic resonance imaging(MRI) data. Three dimensional FPCA extended from one dimensional FPCA was provided and its application in MRI data to extract features was studied. A full set of techniques used to discriminate between pathological images and normal images was designed. It mainly consisted of the following three steps. Firstly, MRI data were preprocessed. The preprocessing steps included image registration and segmentation. The cerebrospinal fluid was obtained after image preprocessing. Secondly, functional PCA was employed to extract features from the segmented images. After that a feature selection method was performed for the extracted features. Thirdly, binary classification results were derived byk- means clustering method using features selected, which reached the goal to screen diseases. The application of this new method to brain MR turbo spin echo T2 weighted image data showed that FPCA outperformed multivariate PCA in feature extraction and classification accuracy.
Keywords: functional principal component analysis; principal component analysis; brain MRI; cluster analysis
ResearchonAlgorithmsBasedonThreeDimensionalFunctionalPrincipalComponentAnalysisandClusterAnalysisforMRIImageClassification
ZHANG Jiaming1, LIN Nan2, ZHANG Menghan1, ZHANG Liang3, LI Shuyuan1, XIONG Momiao2, WANG Xiaofeng1, JIN Li1
(1.SchoolofLifeSciences,FudanUniversity,Shanghai200438,China; 2.SchoolofPublicHealth,UniversityofTexas,HoustonTX77030,USA; 3.DepartmentofCardiology,ChanghaiHospital,SecondaryMilitaryMedicalUniversity,Shanghai200433,China)
R4;O1;TP3
A
0427- 7104(2017)01- 0040- 08
2016- 04- 05
科技部國(guó)際科技合作專項(xiàng)(2014DFA32830);國(guó)家科技支撐項(xiàng)目(2011BAI09B02)
張嘉茗(1991—),女,碩士研究生;金 力,男,教授,博士生導(dǎo)師,通信聯(lián)系人,E- mail: lijin@fudan.edu.cn.