毛之華,高浩,尹建華
(南京航空航天大學自動化學院生物醫(yī)學工程系,南京 210016)
?
基于主成分分析的不同預處理方法對關節(jié)軟骨分類的影響
毛之華,高浩,尹建華*
(南京航空航天大學自動化學院生物醫(yī)學工程系,南京 210016)
本文采用不同方法對來自正常和病變關節(jié)軟骨樣本的紅外光譜進行預處理,而后利用主成分分析對關節(jié)軟骨進行鑒別分析。首先對關節(jié)軟骨切片實現(xiàn)傅里葉變換紅外光譜采集,其次分別采用基線校準、標準化、多元散射校正和標準正態(tài)變量變換對軟骨的紅外光譜進行預處理,然后對原始光譜(矩陣)以及預處理光譜進行主成分分析,根據(jù)得分矩陣對樣本進行分類分析。結果表明:預處理方法結合主成分分析可以更好地對正常和病變關節(jié)軟骨樣本進行分類,而且多種預處理方法的結合可以更好地增強樣本間的區(qū)分度。另外,針對關節(jié)軟骨樣本,多元散射校正比標準正態(tài)變量變換具有更好的增強效果。
關節(jié)軟骨;傅里葉變換紅外光譜;預處理;主成分分析
關節(jié)軟骨是一類半透明的結締組織,呈淡藍,表面光滑。其覆蓋于骨關節(jié)表面,主要的生理功能是在關節(jié)活動過程中減少摩擦、承受壓力以及緩沖震動[1]。關節(jié)軟骨由軟骨細胞外基質和軟骨細胞組成。軟骨基質從外表面到軟骨下骨之間呈現(xiàn)出明顯的板層狀結構,一般分為4層:表層區(qū)(SZ)、過渡區(qū)(TZ)、放射區(qū)(RZ)和鈣化區(qū)[2]。基質中主要含有膠原蛋白、蛋白多糖、無機鹽離子以及水等物質[3]。其中,膠原蛋白形成的纖維結構,構成了軟骨基質的主要骨架,維持了關節(jié)軟骨的形狀和結構。膠原纖維可以有效地固定蛋白多糖并承受壓力[4]。而蛋白多糖可以保證關節(jié)軟骨的彈性及耐壓性[5]。由于關節(jié)軟骨生理功能以及力學特性的要求,基質中蛋白多糖的含量及膠原纖維的空間結構隨深度變化而變化[6]。增齡、創(chuàng)傷以及肥胖等因素都有可能引起軟骨基質中化學成分含量和結構的變化,進一步發(fā)展將會導致骨關節(jié)炎(OA)的發(fā)生[7-8]。OA早期的癥狀主要表現(xiàn)在基質中組分含量和結構的變化,以及軟骨細胞形態(tài)和活性的改變,但不會出現(xiàn)明顯的臨床癥狀,也沒有明顯的組織結構性損傷[9],對骨關節(jié)炎早期的診斷造成了困難。
傅里葉紅外光譜顯微成像(FTIRI)技術可以在實現(xiàn)樣品紅外光譜掃描的基礎上構建其紅外吸收圖像。圖像中每個像素即代表對應位置的紅外光譜,并通過偽彩色表示該處對紅外光的平均吸收率。FTIRI可以用于直觀地表征樣品中各組分的空間分布和含量變化[10-11],具有較高的空間分辨率、光譜分辨率及靈敏度。FTIRI結合化學計量學方法可以實現(xiàn)對關節(jié)軟骨定量或定性的分析[12]。主成分分析(PCA)是化學計量學中的常用方法,通過對原變量進行線性組合,利用新產生的變量來表示原矩陣的數(shù)據(jù)信息。PCA可以從光譜數(shù)據(jù)中提取主成分的半定量信息,在簡化數(shù)據(jù)量的同時,可以在一定程度上去除噪聲的影響。PCA的主要過程是將光譜矩陣分解成載荷矩陣和得分矩陣。其中,載荷矩陣表示對應主成分的歸一化光譜,得分矩陣表示其相對濃度[13]。得分矩陣可用于定性分析,例如可以作為樣本之間馬氏距離的特征變量來判斷界外樣本,或者利用得分向量的二維散點圖實現(xiàn)不同樣本的分類[14]。
由于光譜采集過程中不可避免的基線漂移,光源強度的變化、樣品的散射效應對光譜的影響以及光譜儀自身存在的誤差,在PCA分析前往往需要對光譜進行一定的預處理。但是在關節(jié)軟骨的相關研究方面還沒有文獻報道。本文擬采用不同方法對來自正常和病變關節(jié)軟骨樣本的紅外光譜進行預處理,利用PCA對正常和病變的關節(jié)軟骨樣本進行分類。并對分類結果進行比較分析,討論不同預處理方法對軟骨樣本的PCA的影響。
2.1 實驗儀器及樣品制備
本實驗所采用的成像系統(tǒng)為PerkinElmer Spotlight-300 FTIRI System (Wellesley,MA),主要由一臺傅里葉變換紅外光譜儀和一套顯微成像系統(tǒng)組成。其中,顯微成像系統(tǒng)的探測部分由一個16陣元汞鎘碲化合物(MCT)線陣列檢測器和一個單點的MCT檢測器組成,兩個探測器均由液氮冷卻,用于樣本的紅外信號采集。另外,成像系統(tǒng)還包含一個與上述探測器共軸的可見光CCD探測器,用于樣本的可見光圖像的獲取。紅外光譜儀主要是由紅外光源、邁克遜干涉儀、反射光路、樣品室和檢測器組成。
實驗所用樣品取自正常和病變的狗膝關節(jié)軟骨(各5個樣本)。病變軟骨的獲得是通過對犬膝關節(jié)的前十字交叉韌帶進行手術,從而誘導OA的發(fā)生。樣本的制備過程主要是:首先將實驗所需的關節(jié)軟骨組織切割成2 mm × 2 mm × 2 mm的小立方塊;然后利用生理鹽水清洗1 min后,經(jīng)液氮快速冷凍;最后利用低溫切片機(Leica CM 1950,Germany)在-20 ℃的條件下將小立方塊處理成厚度為10m的切片,用于光譜采集和顯微成像。為了去除水分對紅外光譜測量的影響,將切片風干2 h。
2.2 圖像采集和光譜提取
利用成像系統(tǒng)對制得的切片進行圖像采集,獲得可見光圖像以及紅外吸收圖像。其中,紅外圖像中的像素大小為6.25m,所采集到的光譜范圍為4000~744 cm-1,間隔為8個波數(shù)。對于OA早期,關節(jié)軟骨基質的變化主要表現(xiàn)為蛋白多糖的流失,而且最明顯的區(qū)域一般為SZ和TZ[12]。另外,需要注意的是當軟骨切片貼附在載玻片上時,其邊緣的厚度梯度會使信號光發(fā)生散射和漫反射[9],從而導致該處所探測得到的紅外光譜發(fā)生變形,無法準確反映對應組分的特征信息。所以,本文采用軟骨表面下深度50m左右區(qū)域內的紅外光譜(間隔10m)進行分析,并酌情剔除1至2組來自軟骨基質表層區(qū)外緣的紅外光譜。每個樣本提取5組光譜,共得到50組光譜數(shù)據(jù)(編號#1~50)。
2.3 光譜數(shù)據(jù)分析
考慮到光譜采集過程中不可避免的基線漂移,光源強度變換對定量分析造成的不便以及樣品的散射效應對光譜的影響,另外光譜軟件中獲取的紅外光譜已經(jīng)過一定的平滑處理。本文采用基線校準(Baseline Correction,BC)、標準化(Normalization,Nor)、多元散射校正(Multiplicative Scatter Correction,MSC)和標準正態(tài)變量變換(Standardized Normal Variate,SNV)四種算法以及以上方法不同的組合對光譜矩陣進行預處理。
PCA過程中,首先計算光譜矩陣的協(xié)方差矩陣;再計算得到協(xié)方差矩陣的特征值和特征向量;而后根據(jù)特征值計算主成分的累計方差貢獻率,并選取合適的主成分個數(shù);然后根據(jù)特征向量獲得主成分的載荷矩陣;最后計算對應主成分的得分矩陣,并繪制散點圖。通過計算樣本數(shù)據(jù)點之間的歐氏距離,依據(jù)類內距離最短、類間距離最大的原則來區(qū)分界外樣本,實現(xiàn)對關節(jié)軟骨樣本進一步的分類分析。PCA的主要目的是用盡可能少的因子來解釋研究對象,同時盡量保證數(shù)據(jù)信息不丟失。因此,主成分因子數(shù)選擇的主要依據(jù)是主成分的特征值以及累計方差貢獻率。實驗中,為了盡量減少光譜矩陣中所包含數(shù)據(jù)信息的損失,本文主成分個數(shù)選取的標準為累計方差貢獻率達85%以上。
3.1 圖像及光譜分析
圖1所示為成像系統(tǒng)獲得的正常關節(jié)軟骨的紅外吸收光譜。其中,酰胺I、酰胺II、酰胺III特征峰的中心波數(shù)分別為1650 cm-1、1550 cm-1和1250 cm-1,而1338 cm-1表示脯氨酸側鏈亞甲基的搖擺振動峰,1072 cm-1則為糖帶譜峰。另外,圖1所示光譜為多組分光譜,由于基質中各組分的紅外光譜存在相似譜峰,光譜互相疊加,任何一個吸收峰的強度都不能直接與對應組分的濃度進行關聯(lián)[9]。
Fig.1 The infrared absorption spectra extracted from the healthy cartilage sample
圖2所示分別為正常和病變樣本的紅外吸收及可見光圖像。在紅外圖像中,軟骨細胞表現(xiàn)為亮斑,而在可見光圖像中則為橢圓狀的暗斑。與正常樣本相比,病變關節(jié)軟骨中細胞的大小、形態(tài)和數(shù)量發(fā)生了明顯的改變[15-16]。通過對關節(jié)軟骨的紅外光譜進行歸屬分析,1338和1072 cm-1譜帶更適合用于表征膠原蛋白和蛋白多糖的含量和空間分布。因此,本文利用圖2(b)和2(c)定性地對軟骨樣本中的膠原蛋白和蛋白多糖進行表征。圖中可見,相比于正常關節(jié)軟骨樣本,病變樣本中膠原蛋白和蛋白多糖的含量明顯較低,尤其在SZ與TZ區(qū)域。
Fig.2 Visible image(a) and FTIR images of total absorption (b), at 1338 cm-1(c) and 1072 cm-1(d) from healthy and OA cartilage sections. The absorption max for (b), (c) and (d) are 1.5,1.8 and 2.2, respectively
3.2 主成分分析
表1所示為不同方法預處理后以及原始光譜數(shù)據(jù)經(jīng)PCA降維后所得前四個主成分(PC1,PC2,PC3,PC4)的累計貢獻率。其中,PC1和PC2可能分別對應軟骨基質中的兩類主成分(膠原蛋白和蛋白多糖),PC3及PC4可能對應樣品中的一些微量成分。由表可知:各組光譜數(shù)據(jù)的前兩個主成分的累計貢獻率均高于85%,能夠表示光譜數(shù)據(jù)的大部分特征。其中,由BC以及Nor處理后的光譜矩陣的前兩個主成分的累計貢獻率要略高于未處理的光譜矩陣,而其他方法處理后的累計貢獻率相對較低。
不同方法預處理后以及原始光譜矩陣的前兩個主成分的得分矩陣的散點圖如圖3所示。
Fig.3 The scatter plot of PC1 and PC2 in score matrix calculated by PCA.The solid triangles and circles represent the spectra from OA (▲) and healthy (●) group,respectively
Tab.1 The principal component cumulative variance
圖中數(shù)據(jù)點可以被虛線大致分成兩類,其中三角形表示病變樣本,圓形表示正常樣本。由圖可知:第一,相比于病變樣本的數(shù)據(jù)點分布,正常樣本的數(shù)據(jù)點相對較為集中,說明不同正常樣本的主成分含量差別不大。而病變樣本由于病變程度不一,導致了病變樣本數(shù)據(jù)點分布較為分散。第二,與原始光譜相比,經(jīng)預處理后的正常與病變數(shù)據(jù)點之間的距離明顯增大,即樣本間區(qū)分度增加。這可能是由于經(jīng)預處理后的光譜之間的差別增大,數(shù)據(jù)特征更為明顯。第三,比較不同方法預處理后的結果可以發(fā)現(xiàn),多種方法處理的結果要優(yōu)于單一方法處理的結果。而且在相同條件下,MSC處理后的結果要優(yōu)于SNV處理后的結果,表現(xiàn)為數(shù)據(jù)點之間距離變化的程度。第四,雖然預處理后的樣本間區(qū)分度增加,但是根據(jù)虛線所劃分的分類區(qū)域,可以發(fā)現(xiàn)預處理后的誤判案例比原始光譜的誤判案例多。通過比對數(shù)據(jù)點所對應的光譜編號,可以發(fā)現(xiàn)靠近正常樣本區(qū)域,甚至出現(xiàn)誤判的數(shù)據(jù)點均來自的兩個樣本,說明誤判案例的存在有可能是樣本本身帶來的誤差。第五,比較表1與圖3的結果,表1中主成分累計貢獻率較低的光譜數(shù)據(jù),卻在二維散點圖中顯示出較好的樣本間區(qū)分度。這說明主成分累計貢獻率與樣本分類靈敏度沒有必然關系。
本文利用FTIRI技術對正常和病變關節(jié)軟骨樣本進行成像,提取紅外吸收光譜后,采用不同方法對光譜進行預處理,而后利用PCA對數(shù)據(jù)進行降維,并對樣本進行分類分析。結果表明:不同預處理方法均對PCA二維散點圖中樣本區(qū)分度有非常顯著的提高,多種預處理方法的結合可以更好地增強樣本間的區(qū)分度。另外,針對關節(jié)軟骨樣本,MSC 比SNV具有更好的增強效果。綜上所述:預處理方法結合PCA可以更好地對正常和病變關節(jié)軟骨樣本進行分類。
致謝
本文FTIRI數(shù)據(jù)部分是在Oakland University (Rochester, MI)的Prof. Yang Xia實驗室獲得。期間,Prof. Yang Xia受到美國NIH基金R01-AR052353資助。
Reference
[1] Mauck R L,Soltz M A,Wang C C,etal.Functional tissue engineering of articular cartilage through dynamic loading of chondrocyte-seeded agarose gels [J].J Biomech Eng,2000,122(3):252-260.
[2] Ramakrishnan N,Xia Y,Bidthanapally A,etal.Determination of zonal boundaries in articular cartilage using infrared dichroism[J].Appl Spectrosc,2007,61(12):1404-1409.
[3] Buckwalter J A,Mankin H J.Articular cartilage:tissue design and chondrocyte-matrix interactions [J].Instr Course Lect,1997,47:477-486.
[4] Eyre D.Collagen of articular cartilage [J].Arthritis Res Ther,2002,4(1):30-35.
[5] Schmidt M B,Mow V C,Chun L E,etal.Effects of proteoglycan extraction on the tensile behavior of articular cartilage [J].J Orthop Res,1990,8(3):353-363.
[6] Jeffery A K,Blunn G W,Archer CW,etal.Three-dimensional collagen architecture in bovine articular cartilage [J].J Bone Joint Surg Br,1991,73(5):795-801.
[7] Bank R A,Bayliss M T,Lafeber F P,etal.Ageing and zonal variation in post-translational modification of collagen in normal human articular cartilage [J].Biochem J,1998,330(Pr1):345-351.
[8] Buckwalter J A,Martin J,Mankin H J.Synovial joint degeneration and the syndrome of osteoarthritis [J].Instr Course Lect,1999,49:481-489.
[9] Yin J,Xia Y,Lu M.Concentration profiles of collagen and proteoglycan in articular cartilage by Fourier transform infrared imaging and principal component regression [J].Spectrochim Acta A Mol Biomol Spectrosc,2012,88:90-96.
[10] 肖芝燕,張學喜,尹建華.關節(jié)軟骨和骨關節(jié)炎的傅里葉變換紅外光譜學顯微成像研究進展[J].科學通報,2014,59(27):2645-2651(Xiao Zhiyan,Zhang Xuexi,Yin Jianhua.Fourier transform infrared spectroscopic imaging on articular cartilage and osteoarthritis[J].Chin Sci Bull,2014,59(27):2645-2651).
[11] Potter K,Kidder L H,Levin I W,etal.Imaging of collagen and proteoglycan in cartilage sections using Fourier transform infrared spectral imaging [J].Arthritis Rheum,2001,44(4):846-855.
[12] Yin J,Xia Y.Proteoglycan concentrations in healthy and diseased articular cartilage by Fourier transform infrared imaging and principal component regression [J].Spectrochim Acta A Mol Biomol Spectrosc,2014,133:825-830.
[13] 褚小立.化學計量學方法與分子光譜分析技術[M].北京:化學工業(yè)出版社,2011:55-57(Chu Xiaoli.Molecular spectroscopy analytical technology combined with chemometrics and its applications[M].Beijing:Chemical industry press,2011:55-57).
[14] 徐永群,孫素琴,袁子民,等.紅外光譜結合主成分分析鑒別道地山藥[J].分析化學,2002,30(10):1231-1233(Xu Yongqun,Sun Suqin,Yuan Zimin,etal.Discrimination of trueborn tuber dioscoreae by fingerprint infrared spectra and principal component analysis[J].Chin J Anal Chem,2002,30(10):1231-1233).
[15] Goldring M B.The role of the chondrocyte in osteoarthritis[J].Arthritis Rheum,2000,43(9):1916-1926.
[16] Yamamoto K,Shishido T,Masaoka T,etal.Morphological studies on the ageing and osteoarthritis of the articular cartilage in C57 black mice[J].J Orthop Surg (Hong Kong),2005,13(1),8-18.
The Classification of Articular Cartilage with Different Preprocessing Methods Based on Principal Component Analysis
MAO Zhi-hua,GAO Hao,YIN Jian-hua*
(DepartmentofBiomedicalEngineering,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China)
In this study,different methods were used to preprocess the infrared spectra of healthy and osteoarthritic articular cartilage.Before the principal component analysis (PCA) was applied to classify the articular cartilage samples.First,FTIRI on articular cartilage specimens was achieved.After extracted from the FTIR images,the infrared spectra were preprocessed by baseline correction,normalization,multiplicative scatter correction and standardized normal variate.And then,the original and preprocessed spectra were imported into SPSS software for PCA and the cartilage samples were classified based on the score marix.It is indicated that preprocessing methods combined with the principal component analysis can classify the samples of healthy and osteoarthritic articular cartilage better.The combination of different preprocessing methods was helpful to differentiate the samples. In addition, the Multiple scatter correction was better than Standardized normal variate in articular cartilage classification.
articular cartilage;fourier transform infrared microscopy imaging;preprocessing;principal component analysis
2015-07-31; 修改稿日期:2015-11-25
國家自然科學基金(61378087);江蘇省自然科學基金(BK20151478)
毛之華(1992-),男,碩士,主要研究方向為生物醫(yī)學光譜學及成像分析.E-mail:mzh163161@163.com
尹建華.E-mail:yin@nuaa.edu.cn
1004-5929(2016)03-0264-06
O433;O657.3;Q-3
A
10.13883/j.issn1004-5929.201603012