魏登云, 陶李郁
(安徽師范大學 體育學院,安徽 蕪湖 241003)
隨著體育事業(yè)的發(fā)展,綜合評價在體育領域的地位和作用愈發(fā)突出,越來越多的綜合評價方法被運用到體育科研中。其中,基于主成分分析的一種綜合評價方法頗受青睞。該方法的思路是:對所有評價指標X1,X2,…,Xp(一般取標準化的評價指標)作主成分分析,根據(jù)方差貢獻率大小提取前若干個主成分Y1,Y2,…,Ym(方差分別為λ1,λ2,…,λm),以每個主成分Yi的方差貢獻率ki為權(quán)重系數(shù),構(gòu)建綜合評價函數(shù)
(1)
人們稱之為主成分綜合評價法[1]。該方法自上世紀90年代初被提出,很快被固化為一種常用的綜合評價方法,在國內(nèi)社會、經(jīng)濟、管理、衛(wèi)生等多個領域普遍使用,2000年以來,被廣泛用于體育綜合評價。與此同時,這種評價方法的合理性也頗受爭議,歸納起來有三種主要觀點:第一種觀點認為,主成分分析將多個評價指標壓縮成少數(shù)幾個不相關的綜合變量,一方面精簡了指標,另一方面消除了評價指標之間信息重疊所帶來的影響,從而認為主成分綜合評價法有獨特的優(yōu)勢[2];第二種觀點認為,主成分綜合評價法有其優(yōu)勢,但也存在一些問題,最突出的問題是以方差貢獻率為權(quán)重系數(shù),并提出相應的改進措施[3-6],但提出的改進方法被認為缺乏可行性[1],實際應用中也沒有普遍使用;第三種觀點則認為,主成分分析方法與綜合評價的目的不一致,對評價指標的少數(shù)幾個主成分進行“合并”,構(gòu)建綜合評價函數(shù),沒有依據(jù),從而質(zhì)疑主成分綜合評價法的合理性[7-8],但是并沒有全面論證這種方法的不合理性,也沒有具體說明使用的風險。在體育領域,也有學者通過具體案例分析發(fā)現(xiàn),主成分綜合評價結(jié)果與實際要求不符,評價失真[9-10]。迄今為止,關于主成分綜合評價法的合理性問題,學術(shù)界尚未達成共識,但該方法在體育、經(jīng)濟和社會等多個領域的使用卻在持續(xù),甚至越來越普遍。那么,這種主成分綜合評價法是否合理?體育綜合評價中究竟能否使用?是需要盡快解決的問題。
主成分綜合評價法包括兩部分:前一部分是對所有評價指標作主成分分析,以少數(shù)幾個主成分替代原有的評價指標;后一部分是基于主成分分析的結(jié)果,運用加法合成模型構(gòu)建綜合評價函數(shù)。很顯然,研究主成分綜合評價法的合理性,核心問題是能否運用主成分分析的結(jié)果構(gòu)建綜合評價函數(shù),或者說,評價指標的主成分分析結(jié)果能否滿足綜合評價的要求。因此,探討綜合評價有什么具體要求,而主成分分析又能提供什么,應該是研究主成分綜合評價法是否合理的基本思路。
由于主成分分析的結(jié)果不僅依賴于主成分分析的方法特點,還與評價指標體系的內(nèi)部結(jié)構(gòu)有關,意味著主成分分析結(jié)果能否滿足綜合評價的要求,與實際問題也有關系,可能對于有些評價指標,主成分分析的結(jié)果能滿足綜合評價的要求,而有些卻不能。所以,我們將研究的落腳點放在“運用主成分綜合評價法所存在的風險”上,通過分析風險,反觀該方法的合理性,至于能否運用,則不言自明。為此,本文針對主成分綜合評價法所采用的評價模型,討論構(gòu)建綜合評價函數(shù)的具體要求,并以此為參照標準,審視主成分分析的結(jié)果能否滿足這些要求,從而揭示運用主成分綜合評價法所面臨的風險,并評析這些風險能否規(guī)避。
按照某種評價模型構(gòu)建綜合評價函數(shù)是綜合評價的重要組成部分,綜合評價模型不同于綜合評價函數(shù),綜合評價函數(shù)是評價模型的具體化,是將價值具體到評價指標之后的函數(shù),而綜合評價模型本質(zhì)上是綜合價值的合成方法,體現(xiàn)綜合價值的結(jié)構(gòu)和分布,是構(gòu)建綜合評價函數(shù)的依據(jù)。構(gòu)建綜合評價函數(shù)要針對具體的綜合評價模型,符合綜合評價模型的結(jié)構(gòu)特點和要求。鑒于主成分綜合評價法是運用加法合成模型構(gòu)建綜合評價函數(shù)的,我們針對加法合成綜合評價模型,討論構(gòu)建綜合評價函數(shù)的具體要求。
從數(shù)學上看,加法合成模型是最簡單的線性函數(shù)模型
(2)
其中,X1,X2,…,Xm為模型自變量,a1,a2,…,am為模型參數(shù),T是因變量。
但作為綜合評價模型,模型(2)所表示的內(nèi)容就豐富得多。綜合評價是對評價對象多種價值的綜合度量,或者是從多個方面度量評價對象的某種價值,結(jié)果均為評價對象的綜合價值。作為綜合價值的一種度量方法,模型(2)中的因變量T代表綜合價值,模型自變量X1,X2,…,Xm代表客體的多種價值或某種價值的生成因素,是綜合價值T的形成因素,簡稱“價值因素”,模型參數(shù)a1,a2,…,am為各價值因素的權(quán)重系數(shù)。價值因素和權(quán)重系數(shù)是加法合成綜合評價模型的兩類要素,價值因素表明綜合價值是由什么形成的,權(quán)重系數(shù)反映各個價值因素的相對地位,說明綜合價值是如何形成的。基于加法模型構(gòu)建綜合評價函數(shù),包括三部分工作:價值因素的選擇、權(quán)重系數(shù)的確定和價值因素的度量,構(gòu)建綜合評價函數(shù)的基本要求體現(xiàn)在對價值因素、權(quán)重系數(shù)以及價值因素量的要求。
價值因素是需要評價的客體價值的載體,表現(xiàn)為客體的屬性,反映客體的價值。對于模型(2),客體價值的信息(簡稱“價值信息”)只能由價值因素提供,所以價值因素必須反映客體的價值信息,而且要求滿足全面性、純潔性和不重疊性。
全面性要求。價值因素必須反映客體的全部價值信息,尤其是相對重要的價值信息,不能遺漏。綜合評價中,對于特定的價值客體和價值主體,哪些是價值,是由價值主體的需要所決定的[11],評價客體的哪些價值,是根據(jù)評價目的確定的[12],體現(xiàn)客體價值的信息,必須相對全面地蘊含在價值因素中。如果遺漏了重要的價值信息,那么綜合價值T就會缺失相應的價值,導致綜合評價結(jié)果不符合評價目的。
純潔性要求。從構(gòu)建綜合評價函數(shù)的角度看,每個價值因素應該反映客體的一部分價值信息,而且不含“雜質(zhì)”,即不能含有價值無關信息。例如,評價人的運動能力,體現(xiàn)運動能力的信息是價值信息,而反映容貌特征的信息是價值無關信息,因為人的容貌特征與運動能力沒有關系。由模型(2)可知,客體綜合價值是通過各個價值因素的量經(jīng)加法合成得到,與每個價值因素的量成正比,如果某個價值因素含有價值無關信息,那么得到的綜合價值就會不純,從而影響綜合評價結(jié)果的合理性。
價值信息不重疊要求。不同的價值因素應該相對獨立地反映客體的不同價值信息,不能有價值信息的重疊。模型(2)顯示,如果不同的價值因素之間有信息重疊,就意味著某些價值信息被重復使用了,相應的價值量被加大,導致綜合評價結(jié)果不合理。實際上,如果價值因素之間信息重疊,會造成價值因素的權(quán)重系數(shù)難以確定,即使勉強確定了,也會失去意義。
權(quán)重系數(shù)是一組因素對某個目標因素的相對重要程度或貢獻度,可能由于目標因素在實際問題中經(jīng)常是默認的緣故,人們通常將權(quán)重系數(shù)簡述為“一組因素的相對重要程度”,而不再強調(diào)對誰的重要程度。但在確定權(quán)重系數(shù)的過程中,目標因素的作用是不可忽視的。從最本質(zhì)的意義上說,權(quán)重系數(shù)是關系范疇,表示一組因素與某個目標因素之間的權(quán)重關系,沒有目標因素就沒有權(quán)重系數(shù)可言。
模型(2)中,價值因素的權(quán)重系數(shù)a1,a2,…,am表示X1,X2,…,Xm與綜合價值量T(目標因素)之間的一種關系,反映各個價值因素對于綜合價值量的重要程度或者是對于形成綜合價值的貢獻度。所以,確定權(quán)重系數(shù)必須基于價值因素與綜合價值量之間的關系,各價值因素與綜合價值量之間關系的信息是確定權(quán)重系數(shù)的根本依據(jù)。價值因素的特征可能對權(quán)重系數(shù)有影響,但僅憑價值因素單方面的屬性是不能確定權(quán)重系數(shù)的。
綜合評價最終是要得到客體的綜合價值量,綜合評價模型表明綜合價值的合成要素和合成方式,但并不是計算公式。加法合成綜合評價模型(2)中,X1,X2,…,Xm是代表綜合價值的各個形成因素,要計算綜合價值,需要獲得各個價值因素的量(簡稱價值因素量)。價值因素量是客體關于某個價值因素的數(shù)量表示,反映客體某個方面的價值大小,有 “價值”的內(nèi)涵,不能簡單地視為評價指標的測量值。多數(shù)文獻中,價值因素量被認為是無量綱化的結(jié)果,但嚴格說來,價值因素量是對客體(關于某個價值因素)的評價結(jié)果,不僅僅是無量綱化,為此,蘇為華教授稱價值因素的量為“當量”[13]。各個價值因素量之間要有可比性,方可進行加法運算。綜合價值量是對各個價值因素量按線性函數(shù)(2)進行計算的。
對評價指標作主成分分析的目的是精簡指標,將數(shù)目眾多且內(nèi)部關系復雜的評價指標精簡為少數(shù)幾個不相關的綜合指標。一般來說,精簡指標肯定會有信息損失的,所以任何一種精簡方法通常都蘊含著某種準則,即精簡過程中保護原指標的什么信息。主成分分析精簡指標所依據(jù)的準則是保護評價指標的總方差信息,這從主成分分析的目的“以少數(shù)幾個綜合性的變量(主成分)解釋原變量的總方差”中就可以看出,在主成分的生成和取舍過程中也都體現(xiàn)著對方差信息的保護。主成分分析的最顯著特點就是,控制方差信息的損失,并且有可行的具體措施。
然而對于評價指標而言,人們更關注的是客體價值的信息,評價指標是價值信息的載體,綜合評價中客體的價值有哪些,或者說評價客體的哪些價值,都體現(xiàn)在評價指標中。所以,處理評價指標最根本的原則就是保護價值信息。評價指標所反映的價值信息與其方差信息是不同的概念,價值信息是由評價目的所決定的,表現(xiàn)為評價指標所描述的客體的屬性,方差信息是評價指標在特定的一類客體上的差異,反映不同客體之間的離散程度。例如,評價一類運動員的運動素質(zhì),100米跑作為評價指標之一,用來反映運動員的速度素質(zhì),100米跑所蘊含的“速度”這個屬性是價值信息,而100米跑的方差則反映這一類運動員之間的差異。主成分分析對評價指標的總方差信息有具體的保護方法,但對評價指標所蘊含的價值信息卻沒有明確的保護措施,主成分分析法本身不考慮價值信息的損失。
尋找主成分的過程顯示,變量的線性組合是生成主成分的基本工具,在所有可能的線性組合中選擇方差較大的線性組合作為主成分。對于一組給定的評價指標,尋找主成分實質(zhì)上是選擇構(gòu)成線性組合的系數(shù)(組合系數(shù)),選擇組合系數(shù)的唯一依據(jù)是“方差最大” 原則,什么樣的組合系數(shù)能使該線性組合的方差最大(或局部最大),就選擇該組合系數(shù),構(gòu)成的線性組合就作為主成分。
另一方面,組合系數(shù)的不同,評價指標的線性組合所描述的屬性大不一樣,有的描述了一部分原有的屬性,有的卻描述了一種新的屬性,有的意思明確,有的卻難以解釋。例如,反映不同屬性的兩個評價指標X1和X2的線性組合Y=aX1+bX2。如果組合系數(shù)a較大,而b較小,那么線性組合Y所描述的主要是X1的屬性;若a較小而b較大,則Y所描述的主要是X2的屬性;如果a與b大小相近,但符號相反,則Y所描述的既不是X1的屬性,也不是X2的屬性,更不是兩種屬性的綜合,而是一種新的屬性——兩種不同屬性的對比。說明線性組合所描述的屬性的多樣性,一組涵義明確的評價指標,我們也許很熟悉它們各自描述了客體的什么屬性,但經(jīng)過線性組合之后,可能無法解釋它描述了什么。
可見,在主成分分析過程中,不是按線性組合所描述的屬性來生成主成分的,而是根據(jù)方差大小來選擇線性組合,方差較大的線性組合生成主成分,也就是說,什么樣的組合系數(shù)能使線性組合的方差較大,就選擇什么樣的線性組合,不管該線性組合描述了什么,也不在乎該線性組合是否容易解釋。
主成分綜合評價法,基于對評價指標的主成分分析結(jié)果構(gòu)建綜合評價函數(shù),由于主成分分析方法的自身特點,給綜合評價函數(shù)的構(gòu)建埋下了隱患。我們以構(gòu)建綜合評價函數(shù)的要求為參照標準,討論評價指標的主成分分析結(jié)果能否滿足這些要求,揭示其中的風險。
主成分綜合評價法的第一步工作,就是對所有評價指標(標準化之后)作主成分分析,目的是精簡評價指標,以少數(shù)幾個主成分代替評價指標,作為價值因素,構(gòu)建綜合評價函數(shù)。按構(gòu)建綜合評價函數(shù)的要求,用作價值因素的少數(shù)幾個主成分必須蘊含全部價值信息,尤其是重要的價值信息是不能丟失的。但是主成分分析法只保護評價指標的總方差信息,沒有對蘊含在評價指標中的價值信息的保護措施,很可能造成重要價值信息的損失。事實上,由于在主成分生成過程中有優(yōu)勢效應[14],相互高度相關并且數(shù)量較多的一些評價指標容易生成方差較大的線性組合,使這些指標所反映的信息能夠保留在某個主成分中,而與其它指標相關程度較低的少數(shù)評價指標,由于“勢單力薄”,難以獨自生成主成分,在提取出來的主成分中要么不出現(xiàn),要么系數(shù)很小,所占的份量很輕,這些指標所反映的信息將難以保留。實際問題中,為數(shù)眾多的評價指標往往反映客體的多種價值,不同的價值信息通常蘊含在不同的且相關程度較低的評價指標中,如果反映某種重要價值的評價指標數(shù)量相對較少,那么這種價值信息很可能不被包含在提取出來的少數(shù)幾個主成分中,造成價值信息的損失。
主成分綜合評價法,以評價指標的少數(shù)幾個主成分為價值因素,構(gòu)建綜合評價函數(shù)。前面已經(jīng)討論,基于加法模型構(gòu)建綜合評價函數(shù),要求每個價值因素都要反映價值信息,不能含有價值無關信息,那么評價指標的主成分能否滿足這個要求呢?
由主成分分析方法的特點可以看出,主成分分析只關心方差較大的線性組合,并將其提取出來作為主成分,不在意提取的主成分描述了什么屬性,不負責解釋各個主成分,更不在乎保留的主成分是否反映價值信息。說明主成分分析法在主觀上沒有要求提取的主成分反映客體的價值信息,也沒有相應的措施。但在客觀上方差較大的線性組合是否自然地描述了客體重要的屬性?事實上,線性組合的方差大小與該線性組合是否描述了重要的屬性沒有必然聯(lián)系。根據(jù)主成分的生成原理,相關程度高并且數(shù)量多的變量容易生成方差較大的線性組合,如果一組評價指標中每個指標都反映同樣的屬性,那么第一個線性組合的方差占絕對優(yōu)勢,此時的第一主成分或許可以認為是對所有評價指標的綜合,描述了大家共同的屬性。但是如果一組評價指標中有若干個線性相關組,組內(nèi)高度相關,組間低度相關,說明該組評價指標反映了客體的多種不同屬性,這種情況下方差較大的線性組合往往是多種不同屬性的組合。由于線性組合所描述的屬性的多樣性,方差較大的線性組合描述了客體的什么屬性,通常是不確定的,可能難以解釋,即使有的可以解釋,也未必反映客體的價值??匆粋€例子。
例1:設X1,X2,X3,X4,X5,X6六個評價指標(假定已經(jīng)標準化,下文同)被用于評價運動素質(zhì),其中X1和X2代表速度指標,X3和X4作為力量指標,X5和X6代表耐力指標。假定6個指標的相關系數(shù)矩陣為
經(jīng)計算,前3個特征根分別是λ1=2.544,λ2=1.613,λ3=1.212,累積方差貢獻率達89.7%,根據(jù)相應的3個特征向量,提取前3個主成分
Y1=0.438X1+0.433X2+0.433X3+0.432X4+0.355X5+0.347X6
(3)
Y2=0.504X1+0.510X2-0.492X3-0.493X4
(4)
Y3=-0.229X1-0.233X2-0.266X3-0.264X4+0.607X5+0.620X6
(5)
先看第三個主成分,似乎主要描述了耐力素質(zhì),又像是考慮耐力素質(zhì)與速度和力量的對比,怎么解釋都比較牽強,在其描述了什么屬性都不清楚的情況下,我們更無法知曉該主成分是否反映客體的價值信息。再觀察第二個主成分,似乎容易解釋,是速度與力量兩種素質(zhì)的對比,可是本例的評價目的是衡量評價對象的運動素質(zhì),評價者關心的是評價對象的速度、力量和耐力素質(zhì)如何,而不是不同素質(zhì)的對比,速度、力量和耐力素質(zhì)是評價對象的價值所在,而速度與力量兩種素質(zhì)的對比情況與價值無關,說明第二主成分反映的是價值無關信息。
可見,主成分分析不能保證評價指標的各個主成分都能反映價值信息,直接以評價指標的主成分為價值因素構(gòu)建綜合評價函數(shù)是有風險的。
主成分綜合評價法,以提取出來的少數(shù)主成分為價值因素,按主成分的方差貢獻率對相應的價值因素進行賦權(quán)。已有不少文獻從不同角度闡明了以方差貢獻率為權(quán)重系數(shù)沒有依據(jù)[5-8,15]。為了從根本上分析問題所在,我們根據(jù)綜合評價的要求,討論以方差貢獻率賦權(quán)存在的隱患。
3.3.1 主成分的方差大小不表示權(quán)重關系 基于加法模型構(gòu)建綜合評價函數(shù),對權(quán)重系數(shù)的要求顯示,權(quán)重系數(shù)表示各個價值因素與綜合價值量之間的權(quán)重關系,反映價值因素對綜合價值的重要程度或貢獻度。主成分方差是反映主成分自身特征的指標,描述一個主成分在一類個體上的差異,不表示該主成分與其他因素的關系。如果將主成分視為價值因素,那么主成分方差大小并不表示價值因素與綜合價值之間的權(quán)重關系,甚至與綜合價值無關。例如,例1中的第二主成分方差為1.613,方差貢獻率達30%,但第二個主成分所描述的屬性與綜合價值無關,如果以三個主成分構(gòu)建綜合評價函數(shù),那么第二個主成分的權(quán)重系數(shù)只能是0。所以,以主成分的方差貢獻率作為權(quán)重系數(shù),根本上忽視了目標因素(綜合價值)對權(quán)重系數(shù)的決定作用,很可能導致權(quán)重系數(shù)不合理。
對評價指標作主成分分析,有一個認識上的誤區(qū),認為提取的主成分較好地綜合了評價指標的信息,方差較大的主成分綜合能力強,對綜合價值的貢獻自然就大。事實上,由主成分分析的方法特點可以看出,評價指標的總方差信息確實被綜合反映出來,但價值信息卻未必得到了較好的綜合和體現(xiàn),方差較大的主成分綜合了較多的方差信息,但未必反映較多的價值信息,甚至不含價值信息。所以,不能認為方差較大的主成分對綜合價值的貢獻大,只能說對總方差的貢獻較大,但總方差與綜合價值不是一回事。
3.3.2 區(qū)分度不是權(quán)重系數(shù)的主要確定依據(jù) 方差衡量個體之間差異的大小,反映相應指標對評價對象的區(qū)分度,而實際工作中綜合評價很多時候需要對評價對象進行排序,需要有一定的區(qū)分度。因此,有人認為,方差小的評價指標對客體的區(qū)分度低,從而對綜合評價的貢獻較小,以方差貢獻率為權(quán)重系數(shù)構(gòu)建的綜合評價函數(shù)對評價對象的區(qū)分度高,從而認為這是主成分綜合評價法的優(yōu)勢之一。這是對綜合評價的一種誤解,我們根據(jù)綜合評價的本質(zhì),對此進行具體分析。
3.3.2.1 區(qū)分度不是綜合評價的要求 綜合評價是對評價對象多種價值的綜合度量和判斷,度量評價對象的綜合價值大小是綜合評價的根本任務。價值是一個關系范疇,表示價值客體與價值主體之間的關系(價值關系),哪些屬于客體的價值,各種價值的重要程度如何,都取決于價值主體的需要,所以,價值因素的權(quán)重系數(shù)本質(zhì)上是根據(jù)價值主體的需要決定的。至于對客體的區(qū)分度,并不是價值主體的需要,有些因素如果對于價值主體來說不重要,那么即使區(qū)分度很高,也只能賦予很低的權(quán);相反,有些價值因素也許對客體的區(qū)分度并不高,但對于價值主體來說卻很重要,那么就要賦予較高的權(quán)重系數(shù),因為綜合評價要體現(xiàn)的是導向性和約束性。需要注意的是,方差較小(哪怕是很小)不代表所有個體都沒有差異,只要某些個體之間有差異,即使只有極少數(shù)個體(哪怕是個別)在重要的價值因素上有優(yōu)勢(或者劣勢),都應該通過價值量體現(xiàn)出來,否則評價就是不公正的,而此時只有給該價值因素賦予較高的權(quán)重系數(shù)才能達到目的。
3.3.2.2 評價主體的需要應服從價值主體的需要 從價值主體的需要來看,可以不考慮區(qū)分度,但評價主體卻往往很關心區(qū)分度的高低。實際工作中,評價者通常希望評價方法對評價對象的區(qū)分度高,從而有利于排序、遴選。但評價主體首先應該服從價值主體的需要,要根據(jù)價值主體的需要確定價值因素的權(quán)重系數(shù),不能為了片面追求區(qū)分度而犧牲權(quán)重系數(shù)的合理性。
只有在特定的情況下,才可以根據(jù)區(qū)分度的高低確定權(quán)重系數(shù),即:若干個評價指標都反映客體的同一種屬性,而且有效性相近。為了度量該屬性,人們有時根據(jù)區(qū)分度高低給這些評價指標賦權(quán)。嚴格來說,這種情況下的賦權(quán)是對高度相關的測量指標的賦權(quán),而不是給彼此不相關的價值因素賦權(quán)。至于評價者關心的區(qū)分度問題,可以在評價指標的量化或者無量綱化處理過程中加以考慮。確定價值因素的權(quán)重系數(shù),不需要考慮區(qū)分度的問題。
基于加法模型構(gòu)建綜合評價函數(shù),要求綜合價值量的計算基于價值因素量,而主成分綜合評價法直接以提取的少數(shù)主成分的加權(quán)代數(shù)和為綜合評價函數(shù),應該說風險很高。我們通過例子來說明主成分綜合評價法得到的綜合評價函數(shù)的不合理性。
3.4.1 綜合評價函數(shù)不符合評價目的 我們以例1中的評價指標及數(shù)據(jù)為例。按照主成分綜合評價,例1中前3個主成分的累積方差貢獻率達89.7%,所以提取前3個主成分,以方差貢獻率為相應主成分的權(quán)重系數(shù),計算3個主成分的加權(quán)代數(shù)和,得到綜合評價函數(shù)
T=0.307X1+0.306X2+0.007X3-0.003X4+0.305X5+0.305X6
(6)
易見,式(6)中X3和X4兩個力量指標的系數(shù)很小,甚至有一個是負數(shù)。觀察例1中的相關系數(shù)矩陣,6個評價指標描述3種不同的屬性,其中兩個力量指標X3和X4與其它四個指標相關系數(shù)都很小,不可能被其它指標所反映。所以可以肯定,力量素質(zhì)在綜合價值T中基本上不起作用。我們知道,力量素質(zhì)是評價運動素質(zhì)的重要組成部分,所以式(6)作為綜合評價函數(shù)不符合評價目的。究其原因,除了價值因素的選擇和權(quán)重系數(shù)的確定不合理之外,以主成分的加權(quán)代數(shù)和作為綜合評價函數(shù),也是不合適的。
3.4.2 綜合評價函數(shù)的不確定性 由主成分分析的原理可知,主成分的符號不是唯一的,也可以說是不確定的,如果Y代表某個主成分,那么-Y也是主成分[9],而且主成分分析方法對各個主成分的符號是不加區(qū)分的。所以,基于同樣的數(shù)據(jù)資料,使用不同的統(tǒng)計軟件,計算得到的主成分可能符號相反。這就意味著以主成分的加權(quán)代數(shù)和作為綜合評價函數(shù),其結(jié)果是不確定的。
例如,我們將例1中的Y3改變一下符號,以-Y3作為第三個主成分,計算前3個主成分的加權(quán)代數(shù)和,得到綜合評價函數(shù)
T=0.411X1+0.411X2+0.118X3+0.117X4+0.031X5+0.024X6
(7)
由式(7)可見,X5和X6兩個耐力素質(zhì)指標在綜合評價函數(shù)中幾乎起不了什么作用。
對比(6)和(7)兩個綜合評價函數(shù)表達式,可以發(fā)現(xiàn),改變一個主成分的符號,會得出完全不同的綜合評價函數(shù),如果改變其它兩個主成分的符號,又會得出另外的結(jié)果。
由上可見,在構(gòu)建綜合評價函數(shù)過程中,綜合價值量的計算應該基于各個價值因素量,不能針對價值因素的表達式,直接計算代數(shù)和。主成分綜合評價法以主成分的加權(quán)代數(shù)和為綜合評價函數(shù),難以體現(xiàn)綜合評價的目的,甚至會產(chǎn)生誤導。
按常規(guī)理解,風險就意味著不確定性,可能發(fā)生,也可能不發(fā)生。對于一種方法應用中存在的風險,人們關心的是,什么情況下會發(fā)生風險?風險發(fā)生的幾率如何?能否合理規(guī)避?為此,我們對主成分綜合評價法應用中存在的風險進行評析。
主成分綜合評價法基于對評價指標的主成分分析結(jié)果構(gòu)建綜合評價函數(shù),風險源于主成分分析結(jié)果能否滿足綜合評價的要求,而主成分分析的結(jié)果取決于評價指標體系的內(nèi)部結(jié)構(gòu),所以,討論風險發(fā)生的幾率,需要針對評價指標體系的結(jié)構(gòu),分析是在特殊情況下才會發(fā)生風險,還是一般情況下都存在風險。
實際工作中,評價指標體系往往數(shù)目眾多,評價指標之間的相關關系錯綜復雜。正因如此,人們才使用主成分分析。我們將彼此相關程度相對較高的評價指標構(gòu)成的集合稱為一個相關組,通常情況下,一個評價指標體系由若干個相關組構(gòu)成,組內(nèi)指標之間相關程度較高,組間相關程度相對較低。以下根據(jù)評價指標體系所包含的相關組的數(shù)量,分兩種情況討論。
第一種情況,評價指標體系只有一個相關組。如果評價指標之間高度相關,說明所有評價指標都基本反映客體的一種屬性,此時第一主成分對評價指標的代表性很強,反映了客體的價值信息,以第一主成分為綜合評價函數(shù)沒有風險。
第二種情況,評價指標體系由多個相關組構(gòu)成。由于實際工作中主成分分析總是基于樣本相關陣,即使兩個指標之間不相關,樣本相關系數(shù)也不為0,所以各組內(nèi)部指標之間相關程度較高,而組間總是低度相關。前面已經(jīng)討論過,此時以提取的少數(shù)主成分為價值因素,容易導致價值信息的遺漏。并且,由于主成分分析中對特征向量的正交性要求,從第二主成分開始,后面的每個主成分中都有評價指標的系數(shù)為負數(shù),這就給主成分的解釋帶來很大困難,更難以保證各個主成分都蘊含價值信息。除此之外,主成分的方差貢獻率也未必能代表權(quán)重系數(shù),除非各組的重要程度與組內(nèi)指標數(shù)量成正比,即在遴選評價指標的時候,相對重要的組,評價指標多選一些,這在實際工作中很難做到。
由此可見,只有在評價指標體系只有一個相關組,并且指標之間高度相關的特殊情況下,可以以評價指標的第一主成分為綜合評價函數(shù),而在一般情況下,以評價指標的主成分為價值因素都存在隱患。實際應用中,評價指標體系的這種特殊結(jié)構(gòu)畢竟很少,而且對其使用主成分分析的意義也不大。
對于評價者來說,要規(guī)避風險,首先必須了解具體的主成分分析結(jié)果能否滿足綜合評價的要求。但由于實際問題的復雜性,加之主成分分析的特點,多數(shù)情況下評價者不能很好地解釋各個主成分描述了什么,更難以判斷各主成分是否反映了價值信息,也就很難了解是否有價值信息的損失。說明在實際綜合評價活動中,評價者對風險的識別已經(jīng)很困難,規(guī)避風險更是難上加難。其實,即使評價者發(fā)現(xiàn)主成分分析的結(jié)果不符合綜合評價的要求,如何處理也是很困難的事。
考慮到有些主成分不易解釋,有學者提出,以評價指標的第一主成分作為綜合評價函數(shù)[6]。除了前面提到的最簡單的評價指標體系結(jié)構(gòu)之外,這種改進方法仍然難以規(guī)避風險,甚至出現(xiàn)的問題更嚴重。首先,如果所有評價指標(假定均為正向指標)之間沒有負相關系數(shù),那么第一主成分通常是所有評價指標的線性組合,并且組合系數(shù)沒有負數(shù),以第一主成分為綜合評價函數(shù)可能被認為沒有價值信息的損失,形式上看,每個評價指標都出現(xiàn)在第一主成分中,但此時主成分的內(nèi)部系數(shù)(稱主成分系數(shù))自然地成為各評價指標的權(quán)重系數(shù),由主成分的生成原理可知,相關程度高并且指標數(shù)量多的相關組在第一主成分中占優(yōu)勢,相應指標的主成分系數(shù)高,而相關程度較低且數(shù)量少的相關組在第一主成分中占劣勢[16],相應指標的主成分系數(shù)低,這就意味著各指標的權(quán)重系數(shù)取決于所在相關組的指標數(shù)量,而不是真正的重要程度。而且,一些數(shù)量少并且與其它指標相關程度低的評價指標,形式上出現(xiàn)在第一主成分中,但系數(shù)很小,反映的屬性對綜合價值的計算幾乎不起作用,實際上是價值信息的丟失。其次,如果評價指標之間存在負相關系數(shù),則第一主成分的內(nèi)部系數(shù)必有負數(shù),若以第一主成分為綜合評價函數(shù),那么正向指標的系數(shù)是負數(shù),顯然是不合理的。更為嚴重的是,如果兩個相關組之間是負相關的,那么第一主成分可能不反映價值信息,作為綜合評價函數(shù),根本達不到評價目的。
例2:X1,X2,X3,X4是反映籃球運動員身體素質(zhì)的4個指標,X1和X2是代表身體對抗能力的兩個指標,X3和X4反映身體靈敏性,假定相關系數(shù)矩陣為
經(jīng)計算,第一特征值λ1=2.802,方差貢獻率為70.03%,第一主成分為
Y1=0.520X1+0.493X2-0.488X3-0.498X4
(8)
不難看出,第一主成分描述的是身體對抗能力與靈敏性的對比,如果以其為綜合評價函數(shù),那么評價的是客體身體對抗能力與靈敏性之間的差距,而不是對籃球運動員身體素質(zhì)的綜合評價。
主成分綜合評價法,運用主成分分析方法精簡評價指標,以主成分分析的結(jié)果構(gòu)建綜合評價函數(shù),包括以評價指標的主成分為價值因素、以主成分的方差貢獻率為相應的權(quán)重系數(shù)、以各個主成分的加權(quán)代數(shù)和計算綜合價值量,其中每個環(huán)節(jié)都存在風險。并且,除了評價指標的結(jié)構(gòu)非常簡單這個特殊情況之外,一般情況下這些風險是難以規(guī)避的。更讓人擔心的是,由于綜合評價的特殊性,如果風險發(fā)生了,人們很難通過綜合評價的結(jié)果來發(fā)現(xiàn)它,甚至全然不知。說明這種主成分綜合評價法,在不知道評價指標的主成分分析結(jié)果是否滿足綜合評價要求的情況下構(gòu)建綜合評價函數(shù),是盲目的,也是不合理的。這種方法不適合作為一種固化的綜合評價方法,建議在體育綜合評價中不要使用。
當然,主成分綜合評價法與主成分分析法不是一回事,主成分分析法是一種常用的統(tǒng)計方法,用于變量的壓縮,而主成分綜合評價法卻是一種被固化的評價方法,本質(zhì)上是直接用主成分分析結(jié)果構(gòu)建綜合評價函數(shù)。我們建議不要使用主成分綜合評價法,并不是說主成分分析法不能用于綜合評價,人們運用主成分因子分析法分析調(diào)查問卷的效度,實際上就是運用主成分分析法驗證指標體系結(jié)構(gòu)的合理性。不能籠統(tǒng)地說一種統(tǒng)計方法能否用于綜合評價,某種具體方法是否可以用于綜合評價,取決于綜合評價的需要。綜合評價關注的是客體的價值,任何方法用于綜合評價,都必須有利于更好地提取價值信息,度量客體的價值。