薛建明 胡興凱
【摘要】實(shí)對稱矩陣實(shí)一類特殊的方陣,是線性代數(shù)或是高等代數(shù)課程教學(xué)過程中的重點(diǎn)和難點(diǎn)之一,本文梳理了實(shí)對稱矩陣的性質(zhì),給出了實(shí)對稱矩陣在主成分分析法中的應(yīng)用,最后給出了例子來展示主成分分析法的運(yùn)用,豐富了實(shí)對稱矩陣的教學(xué)內(nèi)容。
【關(guān)鍵詞】實(shí)對稱矩陣? 主成分分析? 綜合評價(jià)
【基金項(xiàng)目】2019年云南省教育廳科學(xué)研究基金項(xiàng)目“矩陣奇異值與酉不變范數(shù)不等式的研究”(項(xiàng)目編號:2019J0350)。
【中圖分類號】O178;O177.1? 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號】2095-3089(2021)40-0158-02
一、實(shí)對稱矩陣的定義及其性質(zhì)
在學(xué)習(xí)綜合評價(jià)和機(jī)器學(xué)習(xí)等課程的學(xué)習(xí)過程中,難免會(huì)與矩陣打交道,而實(shí)對稱矩陣更是其中常用的一類特殊矩陣。雖然實(shí)對稱矩陣的定義比較簡單:若實(shí)矩陣A滿足AT=A,則我們稱其為實(shí)對稱矩陣,但實(shí)對稱矩陣具有非常好的性質(zhì)[1-3]:
(1)實(shí)對稱矩陣A的特征值都是實(shí)數(shù),特征向量都是實(shí)向量。
(2)實(shí)對稱矩陣A的不同特征值對應(yīng)的特征向量是正交的。
(3)實(shí)對稱矩陣A可相似對角化且其特征值為相似對角化矩陣對角線的元素。
(4)設(shè)λ是A的重特征值,則其幾何重?cái)?shù)等于代數(shù)重?cái)?shù)。
(5)實(shí)對稱矩陣A一定可正交相似對角化。
(6)設(shè)A的特征值為λn≤…≤λ2≤λ1,則對于任意的x∈Rn,都有:
λnxTx≤xTAx≤λ1xTx
二、實(shí)對稱矩陣的應(yīng)用
主成分分析是一種降維方法,其思路是利用數(shù)學(xué)方法找出幾個(gè)新的變量來替代原來線性相關(guān)的變量,同時(shí)盡可能地代表原來變量的信息[4]。主成分分析的處理方法是將原來的變量做線性組合,作為新的綜合變量,首先將選取的第一個(gè)線性組合即第一個(gè)綜合變量記為F1,自然的我們希望它盡可能多的反映原來變量的信息,這里“信息”用方差來測量,即希望Var(F1)越大,表示F1包含的信息越多。如果第一主成分不足以代表原來n個(gè)變量的信息,再考慮選取第二主成分F2,為了有效的反映原來信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語言表達(dá)就是要求Cov(F1,F(xiàn)2)=0,依此類推可以構(gòu)造出第三、四……第p個(gè)主成分。
對于一個(gè)樣本資料,觀測n個(gè)變量x1,x2,…,xn,m個(gè)樣品的數(shù)據(jù)資料陣為:
X==(x1,x2,…xn)
其中:x=,j=1,2…n
主成分分析就是將n個(gè)觀測變量綜合成為n個(gè)新的變量(綜合變量),即
F1=a11x1+a12x2+…+a1nxn
F2=a21x1+a22x2+…+a2nxn
…
Fn=an1x1+an2x2+…+annxn
簡寫為:
Fj=αj1x1+αj2x2+…+αjnxn,j=1,2,…,n
要求成分之間滿足以下條件:
①Fi,F(xiàn)j互不相關(guān)(i≠j,i,j=1,2,…,n)
②F1的方差大于F2的方差大于F3的方差,依次類推
③ak12+ak22+…+akn2=1,k=1,2,…n.
利用矩陣乘法可記為:F=AX
其中
F=AXF=,A==,X=
主成分F=AX的協(xié)差陣為:
Var(F)=Var(AX)=(AX)·(AX)T=AXXTAT=Λ=
設(shè)原始數(shù)據(jù)的協(xié)方差陣為V=R=XXT,若能夠滿足條件③,最好要求A為正交矩陣,即:
AAT=I
將原始數(shù)據(jù)的協(xié)方差代入主成分的協(xié)差陣公式得
Var(F)=AXXTAT=ARAT=Λ
展開上式得:
=
注意到V=R=XXT是一個(gè)實(shí)對稱矩陣,由上面的等式,我們想到矩陣A可能是實(shí)對稱矩陣的正交相似變換矩陣,對角矩陣Λ是其特征值所按降序排列之后生成的矩陣。
于是,根據(jù)實(shí)對稱矩陣的性質(zhì)可知,主成分分析中的主成分協(xié)方差應(yīng)該是對角矩陣,其對角線上的元素恰好是原始數(shù)據(jù)相關(guān)矩陣的特征值,而主成分系數(shù)矩陣A的元素則是原始數(shù)據(jù)相關(guān)矩陣特征值相應(yīng)的特征向量。于是,解釋變量(x1,x2,…,xn)經(jīng)過變換后得到新的綜合變量:
F1=a11x1+a12x2+…+a1pxp
F2=a21x1+a22x2+…+a2pxp
…
Fp=ap1x1+ap2x2+…+appxp
新的隨機(jī)變量Fi間是彼此正交的,且方差依次遞減。
接下來,我們來看看主成分分析在綜合評價(jià)方面的應(yīng)用,表1 是某市人民醫(yī)院1995至1997年的醫(yī)療質(zhì)量數(shù)據(jù),采用主成分分析法對某市人民醫(yī)院1995至1997年的醫(yī)療質(zhì)量進(jìn)行綜合評價(jià)。
利用主成分分析法可得第一主成分:
F1=0.1656x1+0.9710x2+…+0.0543x4
第一主成分的貢獻(xiàn)比為98.25%,各年度第一主成分的得分分別為3.0186,5.3068,-8.325,由此可知1996年的醫(yī)療質(zhì)量最好。
參考文獻(xiàn):
[1]北京大學(xué)數(shù)學(xué)系前代數(shù)小組.王萼芳,石生明,修訂,高等代數(shù)(第五版)[M].北京:高等教育出版社,2019:153-154
[2]安軍,蔣婭.高等代數(shù) [M].北京:北京大學(xué)出版社,2016:348-350
[3]丘維聲.高等代數(shù)(下冊) [M].北京:北京大學(xué)出版社,2016:198-199
[4]楊虎,劉瓊蓀,鐘波.數(shù)理統(tǒng)計(jì) [M].北京:高等教育出版社,2004:199-206
作者簡介:
薛建明(1982年-),女,山東高唐人,碩士,副教授,研究方向:矩陣?yán)碚摗?/p>
胡興凱(1982年-),男,山東泰安人,博士,講師,研究方向:算子不等式。