陳洪海
(南京財(cái)經(jīng)大學(xué)金融學(xué)院,江蘇 南京 210023)
評(píng)價(jià)是人類最為常見的一種認(rèn)知活動(dòng),是科學(xué)決策的基礎(chǔ)。而評(píng)價(jià)一個(gè)事物所涉及因素通常較為繁多,這就需要在多個(gè)因素相互作用下對(duì)評(píng)價(jià)對(duì)象的水平或狀態(tài)做出一種綜合性的判斷[1]。這便是多指標(biāo)(多屬性)綜合評(píng)價(jià),簡(jiǎn)稱綜合評(píng)價(jià)。
評(píng)價(jià)指標(biāo)體系是進(jìn)行綜合評(píng)價(jià)的基礎(chǔ)。協(xié)同學(xué)理論認(rèn)為一個(gè)復(fù)雜系統(tǒng)的有序結(jié)構(gòu)僅僅通過(guò)少量的參量即可有效描述,所有子系統(tǒng)主要受少數(shù)指標(biāo)支配[2]。由此可見,一組評(píng)價(jià)指標(biāo)作為相互影響、相互作用的一個(gè)系統(tǒng),其內(nèi)部評(píng)價(jià)指標(biāo)的數(shù)量絕非多多益善。因此,評(píng)價(jià)指標(biāo)體系的建立離不開評(píng)價(jià)指標(biāo)的篩選。其內(nèi)在原因主要有二:一是眾多指標(biāo)中不可能每個(gè)指標(biāo)均對(duì)評(píng)價(jià)結(jié)果有顯著影響,即不可能每個(gè)指標(biāo)都重要。事實(shí)上,有些指標(biāo)對(duì)評(píng)價(jià)結(jié)果的影響是微弱的,僅是評(píng)價(jià)者經(jīng)驗(yàn)性地認(rèn)為這些指標(biāo)重要而已,而主觀經(jīng)驗(yàn)卻未必客觀可靠。二是即使被保留的指標(biāo)均對(duì)評(píng)價(jià)結(jié)果影響顯著,這些指標(biāo)間也極有可能存在較嚴(yán)重的相關(guān)性,即指標(biāo)間的信息重疊程度可能較高。這些重疊信息若不加處理,在綜合評(píng)價(jià)時(shí)會(huì)被反復(fù)強(qiáng)調(diào),進(jìn)而扭曲綜合評(píng)價(jià)結(jié)果[3]。盡管主成分分析、因子分析等降維方法在理論上回避了指標(biāo)間的信息重疊,但卻產(chǎn)生了主成分的經(jīng)濟(jì)含義難于確定及因子載荷矩陣不唯一等問題。因此,指標(biāo)間信息重疊的降低依然主要通過(guò)剔除指標(biāo)集中部分指標(biāo)的方式實(shí)現(xiàn)。而且,根據(jù)評(píng)價(jià)指標(biāo)篩選的內(nèi)在原因可知,綜合評(píng)價(jià)指標(biāo)定量篩選的兩大核心任務(wù)就是剔除重要性差的指標(biāo),及降低指標(biāo)集的信息重疊。
評(píng)價(jià)指標(biāo)體系及綜合評(píng)價(jià)方法是綜合評(píng)價(jià)理論最核心的兩部分內(nèi)容。其中,評(píng)價(jià)指標(biāo)體系是綜合評(píng)價(jià)的基礎(chǔ),直接影響綜合評(píng)價(jià)的科學(xué)合理性。但遺憾的是,目前已有研究在關(guān)注綜合評(píng)價(jià)方法的同時(shí),卻并未對(duì)用于建立評(píng)價(jià)指標(biāo)體系的指標(biāo)篩選方法予以足夠的重視。這直接導(dǎo)致評(píng)價(jià)指標(biāo)篩選方法研究的明顯滯后。目前,評(píng)價(jià)指標(biāo)的篩選主要以定性與定量?jī)煞N方式實(shí)現(xiàn)。定性篩選指標(biāo)的主觀性太強(qiáng),所以先利用專家經(jīng)驗(yàn)進(jìn)行評(píng)價(jià)指標(biāo)的海選,再對(duì)海選指標(biāo)進(jìn)行定量篩選的方法日益受到歡迎。根據(jù)指標(biāo)篩選目的的差異,通過(guò)指標(biāo)篩選建立評(píng)價(jià)指標(biāo)體系的定量方法主要分為兩類。
一是以剔除重要性較差指標(biāo)為目的的指標(biāo)篩選方法,這里稱之為關(guān)鍵指標(biāo)遴選方法。比如Changki等[4]通過(guò)剔除信息增益相對(duì)較小的指標(biāo),實(shí)現(xiàn)了指標(biāo)的篩選。Zhu Zexuan等[5]結(jié)合遺傳算法與馬爾可夫毯網(wǎng)絡(luò)算法篩選關(guān)鍵指標(biāo)。Inza等[6]基于貝葉斯網(wǎng)絡(luò)估計(jì)算法提出了一種隨機(jī)搜索指標(biāo)篩選方法。Zhang Yudong等[7]基于決策樹方法提出了一種帶變異算子的二進(jìn)制指標(biāo)篩選方法。Aytug[8]基于廣義的Benders分解法及支持向量機(jī)算法進(jìn)行了指標(biāo)的篩選。遲國(guó)泰等[9]通過(guò)比較信息敏感性的相對(duì)大小,剔除了解釋原始指標(biāo)集信息能力較弱的指標(biāo)。李鴻禧和遲國(guó)泰[10]通過(guò)DEA-t檢驗(yàn)遴選了對(duì)效率評(píng)價(jià)影響顯著的指標(biāo)。
二是以降低指標(biāo)間信息重疊為目的的指標(biāo)篩選方法,這里稱之為信息重疊指標(biāo)篩選方法。剔除重要性較差指標(biāo)的篩選方法并未考慮大量指標(biāo)彼此之間錯(cuò)綜復(fù)雜的相關(guān)性,即信息重疊。而指標(biāo)間的重疊信息在綜合評(píng)價(jià)時(shí)會(huì)被重復(fù)性地予以強(qiáng)調(diào),導(dǎo)致綜合評(píng)價(jià)結(jié)果的失真。因此,已有研究在剔除了重要性較差的冗余指標(biāo)后,通常會(huì)以剔除部分指標(biāo)的方式降低評(píng)價(jià)指標(biāo)間的信息重疊,以保證評(píng)價(jià)指標(biāo)體系的科學(xué)合理。遺憾的是,目前降低指標(biāo)集信息重疊的指標(biāo)篩選方法較為少見。根據(jù)降低指標(biāo)間信息重疊方式上的差異,已有信息重疊指標(biāo)篩選方法的研究可分為兩類。
(1)通過(guò)剔除相關(guān)程度高的兩個(gè)指標(biāo)中相對(duì)不重要的一個(gè)指標(biāo),降低指標(biāo)集的信息重疊。范柏乃[11]、張昆等[12]、遲國(guó)泰等[13]、陳洪海等[14]及趙志沖等[15]通過(guò)剔除Person相關(guān)系數(shù)絕對(duì)值大的任意兩個(gè)指標(biāo)中相對(duì)不重要的一個(gè)指標(biāo),降低了指標(biāo)集的信息重疊。這是目前應(yīng)用得最為廣泛的信息重疊指標(biāo)篩選方法,稱之為Person相關(guān)分析法。而韓伯棠等[16]、Destrero等[17]則分別通過(guò)剔除偏相關(guān)系數(shù)絕對(duì)值、互信息大的任意兩個(gè)指標(biāo)中相對(duì)不重要的一個(gè)指標(biāo),實(shí)現(xiàn)了指標(biāo)集信息重疊程度的降低。
(2)僅保留通過(guò)R型聚類分析確定的每個(gè)子類內(nèi)最重要的一個(gè)指標(biāo),實(shí)現(xiàn)指標(biāo)集信息重疊程度的降低。具體而言,這類方法首先通過(guò)R型聚類分析將指標(biāo)集劃分為若干個(gè)不同的子類,屬于不同子類的指標(biāo)間相關(guān)程度比較低,而同一子類內(nèi)的指標(biāo)間相關(guān)程度比較高。在此基礎(chǔ)上,僅保留每個(gè)子類內(nèi)最重要的一個(gè)指標(biāo),剔除子類內(nèi)其余全部指標(biāo),從而實(shí)現(xiàn)評(píng)價(jià)指標(biāo)集信息重疊程度的降低。如顧雪松等[18]通過(guò)剔除R型聚類后各子類內(nèi)因子載荷最小的指標(biāo),對(duì)科技評(píng)價(jià)指標(biāo)進(jìn)行了篩選。周立斌等[19]、趙宇哲等[20]通過(guò)僅保留R型聚類后各子類內(nèi)變異系數(shù)最大的指標(biāo),分別建立了人的全面發(fā)展及生態(tài)港口評(píng)價(jià)指標(biāo)體系。而Chen Honghai等[21]通過(guò)剔除R型聚類后各子類內(nèi)近似分類質(zhì)量系數(shù)小的指標(biāo),對(duì)城市綠色發(fā)展指標(biāo)進(jìn)行了篩選。
現(xiàn)有信息重疊指標(biāo)篩選方法在降低指標(biāo)集信息重疊方面雖進(jìn)行了有益的探索,但仍然存在著一些亟待解決的問題。這些問題主要體現(xiàn)在以下四個(gè)方面。
已有研究存在的問題一:已有研究[11-17]僅僅剔除相關(guān)程度高的任意兩個(gè)指標(biāo)中相對(duì)不重要的一個(gè)指標(biāo),難以保證被刪除的指標(biāo)恰是對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)大的指標(biāo),極易誤刪對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)小的指標(biāo),或錯(cuò)誤地保留對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)大的指標(biāo)。評(píng)價(jià)指標(biāo)集作為一個(gè)系統(tǒng),指標(biāo)集內(nèi)各指標(biāo)彼此之間的相互影響、相互作用是錯(cuò)綜復(fù)雜的。一個(gè)指標(biāo)與指標(biāo)集內(nèi)某個(gè)指標(biāo)間的相關(guān)程度高,不意味著該指標(biāo)與其余全部指標(biāo)整體間的信息重疊程度也高;同樣地,一個(gè)指標(biāo)與指標(biāo)集內(nèi)某個(gè)指標(biāo)間的相關(guān)程度低,也并不意味著該指標(biāo)與其余全部指標(biāo)整體間的信息重疊程度也低。因此,已有研究[11-17]降低指標(biāo)集信息重疊的方式并不合理。
已有研究存在的問題二:已有研究[18-21]通過(guò)保留每個(gè)子類內(nèi)最重要的一個(gè)指標(biāo)降低指標(biāo)集的整體信息重疊,僅能保證被保留的指標(biāo)與不同子類內(nèi)指標(biāo)間的相關(guān)性低,卻無(wú)法保證保留的指標(biāo)與指標(biāo)集內(nèi)其余全部指標(biāo)間的整體相關(guān)性也低。同時(shí),一個(gè)指標(biāo)與同一子類內(nèi)其余指標(biāo)相關(guān)性較高,也不意味著該指標(biāo)與指標(biāo)集內(nèi)其余全部指標(biāo)間的相關(guān)程度也高。顯然,在降低指標(biāo)集信息重疊時(shí)應(yīng)該優(yōu)先剔除與指標(biāo)集內(nèi)其余全部指標(biāo)相關(guān)程度高,即應(yīng)該優(yōu)先剔除對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)大的指標(biāo)。顯而易見,已有研究[18-21]這種指標(biāo)篩選方法并不能有效地降低指標(biāo)集的整體信息重疊。
已有研究存在的問題三:已有研究[11-21]雖然能夠在一定程度上降低指標(biāo)集的信息重疊,但是卻無(wú)法判斷剩余評(píng)價(jià)指標(biāo)間的整體信息重疊程度是否已經(jīng)較低,是否還有必要進(jìn)一步遴選指標(biāo)。相對(duì)而言,剔除指標(biāo)集內(nèi)指標(biāo)的數(shù)量越多,剩余指標(biāo)間整體信息重疊程度也會(huì)越低,但評(píng)價(jià)信息的全面性也會(huì)相對(duì)越差;相應(yīng)地,指標(biāo)集內(nèi)指標(biāo)剔除得越少,剩余指標(biāo)間整體信息重疊程度越高,但綜合評(píng)價(jià)時(shí)反映信息的全面性也會(huì)越好。因此,指標(biāo)遴選應(yīng)適可而止,否則極易造成指標(biāo)篩選的過(guò)度或不足。但顯然已有研究[11-21]并不能做到這一點(diǎn)。
已有研究存在的問題四:已有研究[11-21]雖然能夠降低指標(biāo)集的信息重疊水平,但卻無(wú)法檢驗(yàn)其合理性,亦無(wú)法比較不同信息重疊指標(biāo)篩選方法的優(yōu)劣。
針對(duì)上述問題,本研究聚焦于指標(biāo)集整體信息重疊程度的有效降低,提出了一種基于病態(tài)指數(shù)循環(huán)分析的信息重疊指標(biāo)篩選方法。首先,以剔除一個(gè)指標(biāo)后指標(biāo)集病態(tài)指數(shù)的減小幅度表示該指標(biāo)對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)的大小,循環(huán)剔除對(duì)剩余指標(biāo)整體信息重疊貢獻(xiàn)最大的指標(biāo),實(shí)現(xiàn)指標(biāo)集整體信息重疊的高效降低,克服上述已有研究的前3項(xiàng)不足。之后,通過(guò)剔除相關(guān)程度高的任意兩個(gè)指標(biāo)中相對(duì)不重要的一個(gè)指標(biāo),避免評(píng)價(jià)指標(biāo)間整體信息重疊程度不高但少部分指標(biāo)間信息重疊依然較高。此外,提出指標(biāo)集整體信息重疊降低效率的概念,通過(guò)對(duì)比本文方法與已有研究方法的整體信息重疊降低效率,檢驗(yàn)本研究所提出的信息重疊指標(biāo)篩選方法的合理性。最后,以一組科技評(píng)價(jià)指標(biāo)的篩選為例,說(shuō)明本研究所提出的信息重疊指標(biāo)篩選方法的可行性及有效性。
如上文所述,信息重疊指標(biāo)的篩選是在剔除重要性差的指標(biāo)后進(jìn)行的。因此,這里假設(shè)在利用本文方法篩選指標(biāo)前已經(jīng)剔除了重要性較差的指標(biāo)。
通過(guò)上文的分析不難得出信息重疊指標(biāo)篩選的難點(diǎn)主要有三。
一是如何測(cè)度一組指標(biāo)的整體信息重疊水平?目前,已有信息重疊指標(biāo)篩選方法均未能實(shí)現(xiàn)指標(biāo)集整體信息重疊水平的測(cè)度。這樣,在指標(biāo)篩選過(guò)程中無(wú)法確定剩余指標(biāo)的整體信息重疊水平,極易導(dǎo)致指標(biāo)篩選的過(guò)度或不足。
二是如何高效率地降低一組指標(biāo)間的整體信息重疊水平?已有研究在降低指標(biāo)集整體信息重疊時(shí)僅僅局限于部分指標(biāo)之間,必然難以高效率地降低指標(biāo)集整體上的信息重疊。因此,如何在剔除指標(biāo)數(shù)量較少(即評(píng)價(jià)信息損失較少)的情況下,快速降低指標(biāo)集的整體信息重疊水平,是一個(gè)亟待解決的難題。
三是如何衡量一種信息重疊指標(biāo)遴選方法的優(yōu)劣?如果有衡量信息重疊指標(biāo)遴選方法優(yōu)劣的標(biāo)準(zhǔn),就可以實(shí)現(xiàn)不同信息重疊指標(biāo)篩選方法的擇優(yōu)。但遺憾的是,目前已有研究中尚沒有此類標(biāo)準(zhǔn)。
(1)以病態(tài)指數(shù)表示指標(biāo)集整體的信息重疊
在計(jì)量經(jīng)濟(jì)學(xué)理論中,測(cè)度變量間多重共線性水平的病態(tài)指數(shù)越大,越說(shuō)明該組變量的多重共線性水平越高。不難理解,綜合評(píng)價(jià)中常被提及的“信息重疊”與多元回歸模型中的“共線性”意義相同,僅是應(yīng)用背景不同而已。據(jù)此,本文以評(píng)價(jià)指標(biāo)集病態(tài)指數(shù)的大小表示指標(biāo)集整體的信息重疊程度,解決已有信息重疊指標(biāo)篩選方法無(wú)法測(cè)度指標(biāo)集整體信息重疊程度的不足。顯然,指標(biāo)集的病態(tài)指數(shù)越小,指標(biāo)集的整體信息重疊水平越低。從而,難點(diǎn)一得以解決。
(2)確定指標(biāo)對(duì)指標(biāo)集整體信息重疊的貢獻(xiàn)
據(jù)上文可知,病態(tài)指數(shù)可以表示指標(biāo)集的整體信息重疊程度。而一個(gè)指標(biāo)Xi與指標(biāo)集內(nèi)其余指標(biāo)間存在著一定的信息重疊。自然,從指標(biāo)集內(nèi)剔除指標(biāo)Xi后,指標(biāo)Xi與原指標(biāo)集內(nèi)其余指標(biāo)間存在的信息重疊在新指標(biāo)集中便不復(fù)存在。從而,不難理解從指標(biāo)集內(nèi)剔除一個(gè)指標(biāo)Xi后,該指標(biāo)集病態(tài)指數(shù)必然減小,即指標(biāo)集的整體信息重疊水平必然降低。同時(shí),顯然從指標(biāo)集內(nèi)剔除一個(gè)指標(biāo)Xi后指標(biāo)集病態(tài)指數(shù)減小的幅度,就是指標(biāo)Xi與指標(biāo)集內(nèi)其余全部指標(biāo)間的整體信息重疊程度。它反映了指標(biāo)Xi對(duì)原指標(biāo)集整體信息重疊貢獻(xiàn)的大小,這里稱其為指標(biāo)Xi的整體信息重疊貢獻(xiàn)度。
(3)信息重疊指標(biāo)的篩選標(biāo)準(zhǔn)
根據(jù)整體信息重疊貢獻(xiàn)度的定義,不難理解一個(gè)指標(biāo)的整體信息重疊貢獻(xiàn)度越大,該指標(biāo)與指標(biāo)集內(nèi)其余全部指標(biāo)間的整體信息重疊程度越高,該指標(biāo)對(duì)其所在指標(biāo)集整體信息重疊的貢獻(xiàn)越大,剔除該指標(biāo)后指標(biāo)集整體信息重疊下降得就越快,該指標(biāo)越應(yīng)予以剔除;反之,一個(gè)指標(biāo)的整體信息重疊貢獻(xiàn)度越小,該指標(biāo)對(duì)其所在指標(biāo)集整體信息重疊的貢獻(xiàn)越小,剔除該指標(biāo)后指標(biāo)集的整體信息重疊下降得越慢,該指標(biāo)越應(yīng)予以保留。這便是基于整體信息重疊貢獻(xiàn)度的信息重疊指標(biāo)篩選標(biāo)準(zhǔn)。
(4)基于病態(tài)指數(shù)循環(huán)分析篩選信息重疊指標(biāo)
假設(shè)初始指標(biāo)集共有n個(gè)指標(biāo)X1,X2,…,Xn,且對(duì)綜合評(píng)價(jià)結(jié)果而言均比較重要。將這n個(gè)指標(biāo)的病態(tài)指數(shù)CIn與剔除指標(biāo)Xi(1≤i≤n)后剩余n-1個(gè)指標(biāo)的病態(tài)指數(shù)CI(n-1)i的差值CIn-CI(n-1)i,稱為指標(biāo)Xi的整體信息重疊貢獻(xiàn)度。
假設(shè)在n個(gè)指標(biāo)X1,X2,…,Xn中指標(biāo)Xi的整體信息重疊貢獻(xiàn)度最大,則說(shuō)明如果從初始的n個(gè)指標(biāo)中剔除指標(biāo)Xi,則指標(biāo)集整體信息重疊程度下降的幅度最大。因此,根據(jù)基于整體信息重疊貢獻(xiàn)度的信息重疊指標(biāo)篩選標(biāo)準(zhǔn),應(yīng)首先剔除指標(biāo)Xi。我們稱這一過(guò)程為信息重疊指標(biāo)的第1輪篩選。這樣,指標(biāo)集內(nèi)就剩余了n-1個(gè)指標(biāo)。類似地,再剔除剩余的這n-1個(gè)指標(biāo)中信息重疊貢獻(xiàn)度最大的一個(gè)指標(biāo)。稱這一過(guò)程為信息重疊指標(biāo)的第2輪篩選。依此類推,循環(huán)往復(fù),直至剩余指標(biāo)集的信息重疊程度已經(jīng)不高為止,解決難點(diǎn)二。計(jì)量經(jīng)濟(jì)學(xué)理論通常認(rèn)為,如果一組指標(biāo)的病態(tài)指數(shù)不大于10,則該組指標(biāo)的多重共線性就已不高[22]。因此,這里就以剩余全部指標(biāo)的病態(tài)指數(shù)不大于10,作為信息重疊指標(biāo)循環(huán)篩選的停止條件。
由于逐輪次地篩選指標(biāo)的過(guò)程中指標(biāo)集內(nèi)指標(biāo)的數(shù)量是在遞減的,因此不同指標(biāo)的整體信息重疊貢獻(xiàn)度僅在同一輪次內(nèi)的指標(biāo)集內(nèi)可以比較,而不同輪次互異指標(biāo)的整體信息重疊貢獻(xiàn)度不具比較意義。
(5)基于相關(guān)性分析進(jìn)一步篩選信息重疊指標(biāo)
基于相關(guān)性分析進(jìn)一步篩選信息重疊指標(biāo)的原因。就指標(biāo)集整體信息重疊而言,通過(guò)上述逐輪剔除整體信息重疊貢獻(xiàn)度最大的指標(biāo)就已經(jīng)基本完成了降低指標(biāo)集信息重疊的任務(wù)。這與計(jì)量經(jīng)濟(jì)學(xué)中主要著眼于解釋變量整體去考慮多重共線性本質(zhì)上是一致的。但指標(biāo)集整體信息重疊水平低,并不意味著個(gè)別指標(biāo)間信息重疊也都會(huì)低,個(gè)別指標(biāo)間可能存在的較高的信息重疊亦會(huì)對(duì)綜合評(píng)價(jià)結(jié)果造成負(fù)面影響。因此,有必要進(jìn)一步降低個(gè)別指標(biāo)間較高的信息重疊。
基于相關(guān)性分析進(jìn)一步篩選信息重疊指標(biāo)的思路。這里,借鑒已有研究最常采用的降低個(gè)別指標(biāo)間信息重疊的思路,即剔除任意兩個(gè)相關(guān)性高的指標(biāo)中相對(duì)不重要的一個(gè)指標(biāo)。那么如何衡量指標(biāo)的相對(duì)重要性呢?這里的重要性是指指標(biāo)對(duì)綜合評(píng)價(jià)結(jié)果影響的相對(duì)大小。眾所周知,變異系數(shù)(Coefficient of Variance)是衡量指標(biāo)觀測(cè)值變異程度的一個(gè)統(tǒng)計(jì)量。與其它衡量指標(biāo)觀測(cè)值變異程度相比,變異系數(shù)不受不同指標(biāo)單位或均值差異的影響,更能簡(jiǎn)便客觀地反映不同指標(biāo)間相對(duì)變異程度的差異。而綜合評(píng)價(jià)理論認(rèn)為如果一個(gè)指標(biāo)的變異程度不大,則該指標(biāo)對(duì)綜合評(píng)價(jià)結(jié)果的影響也不大[23]。正因?yàn)榇耍儺愊禂?shù)成為目前最為常用的一種表示指標(biāo)相對(duì)重要性的統(tǒng)計(jì)量。有鑒于此,我們就通過(guò)剔除Person相關(guān)系數(shù)絕對(duì)值大的任意兩個(gè)指標(biāo)中變異系數(shù)相對(duì)較小的一個(gè)指標(biāo),實(shí)現(xiàn)個(gè)別指標(biāo)間信息重疊水平的降低。
需要說(shuō)明的是,剔除整體信息重疊貢獻(xiàn)度大的指標(biāo)應(yīng)優(yōu)先于基于相關(guān)分析剔除信息重疊指標(biāo)。信息重疊指標(biāo)剔除的主要目的在于降低指標(biāo)集的整體信息重疊水平,避免指標(biāo)間的重疊信息扭曲綜合評(píng)價(jià)結(jié)果。而一個(gè)指標(biāo)的信息重疊貢獻(xiàn)度反映的是該指標(biāo)與指標(biāo)集內(nèi)其余全部指標(biāo)間的整體信息重疊程度,但Person相關(guān)系數(shù)卻僅能反映某兩個(gè)指標(biāo)間的信息重疊水平。顯然,將指標(biāo)集的整體信息重疊降低到同一較低的水平,基于相關(guān)性分析比基于整體信息重疊貢獻(xiàn)度需要?jiǎng)h除更多的評(píng)價(jià)指標(biāo)才能實(shí)現(xiàn),而這卻不利于保持評(píng)價(jià)信息的全面性。因此,為了保留更豐富的評(píng)價(jià)信息,應(yīng)該選擇先基于整體信息重疊貢獻(xiàn)度快速降低指標(biāo)集的整體信息重疊水平,再利用相關(guān)性分析降低個(gè)別指標(biāo)間的信息重疊水平。下文應(yīng)用實(shí)例通過(guò)對(duì)比兩者信息重疊降低效率(表5),進(jìn)一步驗(yàn)證了優(yōu)先剔除整體信息重疊貢獻(xiàn)度大的指標(biāo)更能快速實(shí)現(xiàn)指標(biāo)集整體信息重疊水平的降低這一結(jié)論。同時(shí),通過(guò)信息重疊指標(biāo)的篩選雖能降低評(píng)價(jià)指標(biāo)間的信息重疊,但同時(shí)也會(huì)因評(píng)價(jià)指標(biāo)的減少導(dǎo)致評(píng)價(jià)信息全面性的減弱。因此,在篩選信息重疊指標(biāo)時(shí)應(yīng)注意權(quán)衡指標(biāo)剔除的數(shù)量與評(píng)價(jià)信息全面性間的關(guān)系,避免信息重疊指標(biāo)遴選的過(guò)度或不足。
(6)信息重疊指標(biāo)篩選方法合理性的檢驗(yàn)
為了檢驗(yàn)本研究所提出信息重疊指標(biāo)遴選方法的合理性,我們以指標(biāo)集病態(tài)指數(shù)的減小比例與剔除指標(biāo)數(shù)量的比值,即以平均每剔除一個(gè)指標(biāo)后指標(biāo)集病態(tài)指數(shù)減小的比例,表示信息重疊指標(biāo)篩選方法降低指標(biāo)集整體信息重疊的效率,簡(jiǎn)稱為整體信息重疊降低效率。顯然,指標(biāo)集的整體信息重疊降低效率越大,平均每剔除一個(gè)指標(biāo)后指標(biāo)集的整體信息重疊下降的幅度越大,這個(gè)信息重疊指標(biāo)篩選方法越合理。這便是基于整體信息重疊降低效率的信息重疊指標(biāo)篩選方法合理性檢驗(yàn)標(biāo)準(zhǔn)。從而,難點(diǎn)三亦得以解決。據(jù)此,通過(guò)橫向比較本文方法與已有方法的整體信息重疊降低效率,體現(xiàn)本研究方法的優(yōu)勢(shì),進(jìn)而實(shí)現(xiàn)本研究方法合理性的檢驗(yàn)。當(dāng)然,這種合理性是一種相對(duì)的合理性。
確定整體信息重疊降低效率時(shí)除以剔除指標(biāo)數(shù)量的原因:如果確定整體信息重疊降低效率時(shí)不除以剔除指標(biāo)的數(shù)量,則僅能在剔除指標(biāo)數(shù)量相同情況下比較不同信息重疊指標(biāo)篩選方法的整體信息重疊降低效率。而如果確定整體信息重疊降低效率時(shí)除以剔除指標(biāo)的數(shù)量,則即使剔除指標(biāo)數(shù)量不相同,仍可比較不同信息重疊指標(biāo)篩選方法的整體信息重疊降低效率。
綜上,本文方法可廣泛應(yīng)用于一般綜合評(píng)價(jià)問題,以降低評(píng)價(jià)指標(biāo)間的信息重疊,減弱指標(biāo)間信息重疊對(duì)綜合評(píng)價(jià)結(jié)果產(chǎn)生的負(fù)面作用,進(jìn)而構(gòu)建更加科學(xué)合理的評(píng)價(jià)指標(biāo)體系。為便于描述,稱上述方法為基于病態(tài)指數(shù)循環(huán)分析的信息重疊指標(biāo)篩選方法,其原理如圖1所示。
圖1 基于病態(tài)指數(shù)循環(huán)分析的指標(biāo)篩選原理
為了避免不重要的評(píng)價(jià)指標(biāo)在信息重疊指標(biāo)篩選過(guò)程中被保留,假設(shè)一組指標(biāo)X1,X2,…,Xn均是剔除重要性較差的指標(biāo)后保留下來(lái)的。基于病態(tài)指數(shù)循環(huán)分析降低該組指標(biāo)信息重疊的步驟如下。
(1)基于整體信息重疊降低的指標(biāo)篩選
步驟1:通過(guò)以下特征方程計(jì)算矩陣XTX的特征值λ1,λ2,…,λn。
XTX-λjEn=0
(1)
特征方程式(1)中,矩陣XT為指標(biāo)集對(duì)應(yīng)的樣本數(shù)據(jù)矩陣X的轉(zhuǎn)置矩陣[22];En為單位矩陣。
步驟2:計(jì)算n個(gè)評(píng)價(jià)指標(biāo)的病態(tài)指數(shù)CIn[22]。
(2)
病態(tài)指數(shù)CIn的經(jīng)濟(jì)含義:病態(tài)指數(shù)CIn反映的是指標(biāo)集X1,X2,…,Xn整體的信息重疊程度,其值越大,越說(shuō)明這n個(gè)指標(biāo)的整體信息重疊程度越高,對(duì)綜合評(píng)價(jià)結(jié)果客觀性的負(fù)面影響也越顯著,這n個(gè)指標(biāo)的信息重疊越應(yīng)予以降低。
步驟3:計(jì)算剔除單個(gè)指標(biāo)Xi(i=1, 2, …,n)后剩余n-1個(gè)評(píng)價(jià)指標(biāo)的病態(tài)指數(shù)CI(n-1)i。按照上述步驟1-步驟2計(jì)算剩余n-1個(gè)指標(biāo)的病態(tài)指數(shù)CI(n-1)i,不贅述。
步驟4:計(jì)算指標(biāo)Xi(i=1, 2, …,n)的整體信息重疊貢獻(xiàn)度Ci1(i=1, 2, …,n)。
Ci1=CIn-CI(n-1)i
(3)
整體信息重疊貢獻(xiàn)度Ci1的經(jīng)濟(jì)含義:Ci1表示剔除指標(biāo)Xi后剩余n-1個(gè)評(píng)價(jià)指標(biāo)的病態(tài)指數(shù)CI(n-1)i,較之剔除Xi前全部n個(gè)評(píng)價(jià)指標(biāo)病態(tài)指數(shù)CIn減小的幅度。其值越大,指標(biāo)Xi對(duì)n個(gè)指標(biāo)的整體信息重疊貢獻(xiàn)越大,指標(biāo)Xi越應(yīng)被剔除;反之,其值越小,指標(biāo)Xi對(duì)n個(gè)指標(biāo)的整體信息重疊貢獻(xiàn)越小,指標(biāo)Xi越應(yīng)予以保留。
步驟5:剔除n個(gè)指標(biāo)中整體信息重疊貢獻(xiàn)度最大的指標(biāo)。若
Cj1=max{Ci11≤i≤n}
(4)
則說(shuō)明在n個(gè)指標(biāo)X1,X2,…,Xn中指標(biāo)Xj對(duì)指標(biāo)集的整體信息重疊貢獻(xiàn)最大,剔除之。
為了描述方便,稱上述過(guò)程為信息重疊指標(biāo)的第1輪篩選。類似地,再剔除剩余n-1個(gè)指標(biāo)中整體信息重疊貢獻(xiàn)度最大的一個(gè)指標(biāo)。如此循環(huán)往復(fù),每輪都剔除剩余指標(biāo)中整體信息重疊貢獻(xiàn)度最大的一個(gè)指標(biāo),直至滿足如下的信息重疊指標(biāo)篩選的停止條件。
步驟6:信息重疊指標(biāo)篩選的停止條件。若剩余全部指標(biāo)的病態(tài)指數(shù)不大于10,則停止信息重疊指標(biāo)的篩選。否則,依照上述步驟對(duì)剩余指標(biāo)繼續(xù)進(jìn)行信息重疊指標(biāo)的篩選,循環(huán)往復(fù),直至剩余指標(biāo)集的病態(tài)指數(shù)已不大于10為止。
(2)基于個(gè)別指標(biāo)間信息重疊降低的指標(biāo)篩選
(5)
步驟8:計(jì)算指標(biāo)Xi的變異系數(shù)[20]CVi(i=1, 2,…,n)。其計(jì)算公式為
cvi=
(6)
變異系數(shù)cvi的經(jīng)濟(jì)含義:變異系數(shù)cvi是指標(biāo)Xi取值的標(biāo)準(zhǔn)差與均值的比值,反映了指標(biāo)Xi取值的離散程度。而且,變異系數(shù)cvi越大,指標(biāo)Xi相對(duì)越重要[20]。
步驟9:基于Person相關(guān)分析降低個(gè)別指標(biāo)間較高的信息重疊。即若:
rij>r0
(7)
則剔除指標(biāo)Xi和Xj中變異系數(shù)較小的一個(gè)指標(biāo),以避免指標(biāo)集整體信息重疊不高但個(gè)別指標(biāo)間信息重疊程度卻依然較高。
式(7)中,r0是信息重疊指標(biāo)篩選的閾值,通常取一個(gè)介于0與1之間較大的值。顯然,閾值r0越大,個(gè)別指標(biāo)間的信息重疊降低得越徹底。但與此同時(shí),剔除指標(biāo)的數(shù)量也會(huì)越多,損失的評(píng)價(jià)信息也越多,越不利于綜合評(píng)價(jià)的全面性。因此,閾值r0的大小并無(wú)絕對(duì)標(biāo)準(zhǔn),需要權(quán)衡確定。這里,取r0=0.7[20]。
(3)信息重疊指標(biāo)篩選方法合理性檢驗(yàn)
步驟10:確定指標(biāo)集整體信息重疊降低效率ESk。
(8)
整體信息重疊降低效率ESk的經(jīng)濟(jì)含義:整體信息重疊降低效率ESk是平均每剔除一個(gè)指標(biāo)后指標(biāo)集病態(tài)指數(shù)減小的比例,反映了信息重疊指標(biāo)篩選后指標(biāo)集整體信息重疊程度降低的效率。顯然,整體信息重疊降低效率ESk越大,信息重疊指標(biāo)篩選方法越顯相對(duì)合理。
步驟11:信息重疊指標(biāo)篩選方法的合理性檢驗(yàn)。若
ESk1>ESk2
(9)
則就指標(biāo)集整體信息重疊降低效率而言,本文方法較之另一種信息重疊指標(biāo)篩選方法更為合理。
式(9)中,ESk1為本文提出方法的整體信息重疊降低效率,ESk2為另一種信息重疊指標(biāo)篩選方法的整體信息重疊降低效率。
綜上,通過(guò)分別降低指標(biāo)集整體及個(gè)別指標(biāo)間的信息重疊,評(píng)價(jià)指標(biāo)間的信息重疊得以系統(tǒng)地降低,以最大限度地減弱信息重疊對(duì)綜合評(píng)價(jià)結(jié)果產(chǎn)生的負(fù)面影響。
本文以“R&D人員折合全時(shí)當(dāng)量”、“高新技術(shù)增加值占GDP比重”等體現(xiàn)城市科學(xué)技術(shù)發(fā)展水平的10個(gè)指標(biāo)為例,說(shuō)明本文所提出信息重疊指標(biāo)篩選方法的可行性及有效性。這10個(gè)科技評(píng)價(jià)指標(biāo)列于表1第2,4列。這10個(gè)指標(biāo)2000-2013年的統(tǒng)計(jì)數(shù)據(jù)均來(lái)源于《大連統(tǒng)計(jì)年鑒》,列于表2第2-11列。
表1 實(shí)例指標(biāo)
表2 指標(biāo)數(shù)據(jù)
(1)信息重疊指標(biāo)的第1輪篩選
步驟1:計(jì)算由全部10個(gè)科技評(píng)價(jià)指標(biāo)所構(gòu)成指標(biāo)集的病態(tài)指數(shù)CI10。將表2第2-11列中的數(shù)據(jù)代入式(1),得到矩陣XTX的全部10個(gè)特征值。再將矩陣XTX的最大特征值5.591及最小特征值0.003代入式(2),得到10個(gè)科技評(píng)價(jià)指標(biāo)的病態(tài)指數(shù)CI10=44.538,列于表3第2列。病態(tài)指數(shù)CI10遠(yuǎn)大于10,從而說(shuō)明這10個(gè)科技評(píng)價(jià)指標(biāo)整體上存在比較嚴(yán)重的信息重疊,理應(yīng)予以降低。特征值的計(jì)算結(jié)果通過(guò)基本的線性代數(shù)知識(shí)即可獲得,因此這里不予贅述。
步驟2:計(jì)算剔除指標(biāo)Xi(i=1, 2, …, 10)后剩余9個(gè)指標(biāo)的病態(tài)指數(shù)CI9i(i=1, 2, …, 10)。將剔除單個(gè)指標(biāo)Xi(i=1, 2, …, 10)后剩余的9個(gè)指標(biāo)作為一個(gè)新的指標(biāo)集,按照步驟1中的計(jì)算方式可以分別得到剔除指標(biāo)Xi(i=1, 2, …, 10)后剩余的9個(gè)指標(biāo)的病態(tài)指數(shù)CI9i(i=1, 2, …, 10),依次列于表3第3列。
步驟3:計(jì)算指標(biāo)Xi(i=1, 2, …, 10)的整體信息重疊貢獻(xiàn)度Ci1(i=1, 2, …, 10)。將表3第2、3列的CI10及CI9i(i=1, 2, …, 10)的取值分別代入式(3),得到10個(gè)指標(biāo)各自的整體信息重疊貢獻(xiàn)度Ci1(i=1, 2, …, 10),分別列于表3第4列。
表3 指標(biāo)的第1輪篩選
步驟4:整體信息重疊貢獻(xiàn)度大的指標(biāo)的剔除。由表3第4列不難發(fā)現(xiàn),指標(biāo)X3的整體信息重疊貢獻(xiàn)度最大,為29.356。即,剔除指標(biāo)X3后指標(biāo)集整體信息重疊下降的幅度最大,達(dá)到了29.356。因此,應(yīng)優(yōu)先剔除指標(biāo)X3。
步驟5:指標(biāo)篩選停止條件的符合性檢查。據(jù)表3第3列第3行可知,剔除指標(biāo)X3后剩余的9個(gè)指標(biāo)的病態(tài)指數(shù)為15.182,仍大于10。這說(shuō)明剔除指標(biāo)X3后剩余的9個(gè)指標(biāo)間的整體信息重疊水平依然較高,指標(biāo)集的整體信息重疊水平還需進(jìn)一步降低。至此,信息重疊指標(biāo)的第1輪篩選結(jié)束。將第1輪指標(biāo)篩選結(jié)果列于表3第5列。
(2)信息重疊指標(biāo)的第2輪篩選
步驟6:計(jì)算剔除剩余9個(gè)指標(biāo)中某個(gè)指標(biāo)后剩余8個(gè)指標(biāo)的病態(tài)指數(shù)。依第1輪的指標(biāo)篩選方式,可以類似地得到剔除剩余9個(gè)指標(biāo)中的一個(gè)指標(biāo)后剩余8個(gè)指標(biāo)的病態(tài)指數(shù),列于表4第3列。由于第1輪已經(jīng)將指標(biāo)X3剔除了,所以表4第3列第3行處以“—”標(biāo)示。
表4 指標(biāo)的第2輪篩選
步驟7:計(jì)算剔除指標(biāo)X3后剩余的9個(gè)指標(biāo)各自的整體信息重疊貢獻(xiàn)度。再將表4第2、3列的數(shù)值分別代入式(3),得到9個(gè)指標(biāo)各自的整體信息重疊貢獻(xiàn)度Ci2(i=1, 2, 4, …, 10),分別列于表4第4列。
步驟8:第2輪指標(biāo)篩選中整體信息重疊貢獻(xiàn)度最大指標(biāo)的剔除。由表4第4列不難發(fā)現(xiàn),指標(biāo)X9的整體信息重疊貢獻(xiàn)度是最大的,其值為4.197。因此,剔除指標(biāo)X9。至此,指標(biāo)的第2輪篩選結(jié)束。
步驟9:再次檢查指標(biāo)篩選停止條件的符合性。據(jù)表4第3列第9行可知,累計(jì)2輪分別剔除指標(biāo)X3和X9后剩余8個(gè)指標(biāo)的病態(tài)指數(shù)為10.985,大于10。這說(shuō)明剩余的8個(gè)指標(biāo)還存在較為明顯的信息重疊,仍然需要通過(guò)指標(biāo)篩選繼續(xù)降低這8個(gè)指標(biāo)的整體信息重疊。
(3)信息重疊指標(biāo)的第3輪篩選
步驟10:剔除剩余8個(gè)指標(biāo)中整體信息重疊貢獻(xiàn)度最大的指標(biāo)。類似地,通過(guò)第3輪的指標(biāo)篩選發(fā)現(xiàn)在剩余的8個(gè)指標(biāo)中,指標(biāo)X2的整體信息重疊貢獻(xiàn)度最大,為2.000。因此,第3輪的指標(biāo)篩選應(yīng)剔除指標(biāo)X2。而剔除指標(biāo)X2后剩余7個(gè)指標(biāo)的病態(tài)指數(shù)為10.985-2.000=8.985,小于10。因此,剩余7個(gè)指標(biāo)的整體信息重疊水平已經(jīng)不高,指標(biāo)篩選暫且結(jié)束。
綜上,通過(guò)信息重疊指標(biāo)的遴選剔除了10個(gè)科技評(píng)價(jià)指標(biāo)中3個(gè)對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)最大的指標(biāo),即指標(biāo)X3、X9和X2,暫時(shí)保留了其余7個(gè)整體信息重疊貢獻(xiàn)較小的指標(biāo)。
(4)降低個(gè)別指標(biāo)間的信息重疊
步驟11:降低相關(guān)程度高的兩兩指標(biāo)間的信息重疊。將列于表2中被暫時(shí)保留的7個(gè)指標(biāo)的數(shù)據(jù)代入式(5),容易得到7個(gè)指標(biāo)的Person相關(guān)系數(shù)矩陣。據(jù)式(7)發(fā)現(xiàn),不存在某兩個(gè)指標(biāo)間Person相關(guān)系數(shù)絕對(duì)值大于0.7的情況。因此,已無(wú)需再降低個(gè)別指標(biāo)間的信息重疊。由此可見,利用病態(tài)指數(shù)循環(huán)分析法篩選信息重疊指標(biāo)后,指標(biāo)集不僅整體信息重疊已經(jīng)較低,而且個(gè)別指標(biāo)間的信息重疊也較低。
綜上,本文方法剔除了全部10個(gè)科技評(píng)價(jià)指標(biāo)中的3個(gè)。指標(biāo)剔除似乎較少,其原因主要有三。一是如上文所述信息重疊指標(biāo)的篩選是發(fā)生在剔除重要性較差的指標(biāo)后的,因此兩種指標(biāo)篩選方式累計(jì)剔除的指標(biāo)數(shù)量自然就會(huì)比較多。二是本文方法是在剩余全部指標(biāo)的信息重疊不高,即剩余全部指標(biāo)的病態(tài)指數(shù)不大于閾值10的條件下停止剔除信息重疊程度較高指標(biāo)的。而決策者若希望評(píng)價(jià)指標(biāo)集信息重疊程度更低,或希望評(píng)價(jià)指標(biāo)集中指標(biāo)數(shù)量更少一點(diǎn),則可將本文指標(biāo)篩選的停止條件中的閾值適度調(diào)低一些。因此,即使不結(jié)合其它指標(biāo)篩選方法,僅利用本文方法也可解決待篩指標(biāo)數(shù)量較多的問題。三是信息重疊指標(biāo)剔除較多會(huì)降低評(píng)價(jià)信息的全面性,不利于綜合評(píng)價(jià)結(jié)果的客觀合理。因此,信息重疊指標(biāo)的遴選也應(yīng)盡量避免評(píng)價(jià)指標(biāo)的過(guò)度剔除。
通過(guò)與目前應(yīng)用最為廣泛的Person相關(guān)分析法的整體信息重疊降低效率進(jìn)行對(duì)比,驗(yàn)證本文方法的相對(duì)合理性。
4.3.1 基于現(xiàn)有相關(guān)性分析法的指標(biāo)篩選
由上文可知,本文方法剔除了3個(gè)指標(biāo)。因此,為了客觀對(duì)比指標(biāo)篩選結(jié)果,在基于現(xiàn)有的相關(guān)分析法(上文模型中的步驟7至步驟9)篩選指標(biāo)時(shí)亦剔除了3個(gè)指標(biāo),即先后剔除了指標(biāo)“X9科技進(jìn)步貢獻(xiàn)率”、“X4地方財(cái)政科技支出占地方財(cái)政一般預(yù)算支出比重”和“X2R&D經(jīng)費(fèi)支出占GDP比重”等3個(gè)指標(biāo)。
4.3.2 指標(biāo)集整體信息重疊降低效率的對(duì)比
根據(jù)上文病態(tài)指數(shù)的計(jì)算方法可以得到全部10個(gè)指標(biāo)的病態(tài)指數(shù)為44.538,基于Person相關(guān)分析法分別剔除1、2、3個(gè)指標(biāo)后剩余指標(biāo)的病態(tài)指數(shù):32.112、23.441及18.238,以及基于相關(guān)分析法分別剔除1、2、3個(gè)指標(biāo)后指標(biāo)集整體信息重疊(病態(tài)指數(shù))降低的比例,列于表5第5列。再據(jù)式(8),以表5第5列的數(shù)值分別除以表5第2列相對(duì)應(yīng)的剔除指標(biāo)的數(shù)量,得到基于相關(guān)性分析法分別剔除1、2、3個(gè)指標(biāo)后指標(biāo)集整體信息重疊降低的效率,列于表5第6列。
表5 信息重疊降低效率的比較
類似地,根據(jù)上文實(shí)證數(shù)據(jù)得到本文方法分別剔除1、2、3個(gè)指標(biāo)后的指標(biāo)集整體信息重疊降低的比例及效率,依次列于表5第3-4列。再將表5第4列與表5第6列同行數(shù)據(jù)的差值,分別除以表5第6列同行的數(shù)據(jù),得到兩種方法指標(biāo)集整體信息重疊降低效率的相對(duì)差距,列于表5第7列。以表5第7列第2行的“73.67%”為例,它是表5第2行中第4列的“37.67%”與第6列的“21.69%”的差值,再除以表5第6列的“21.69%”得到的。它表示同樣是剔除2個(gè)指標(biāo),本文方法的指標(biāo)集整體信息重疊降低效率,比現(xiàn)有相關(guān)性分析法相對(duì)地高73.67%。
綜上,不難發(fā)現(xiàn)本文方法比現(xiàn)有基于Person相關(guān)分析的指標(biāo)篩選方法,在降低指標(biāo)集信息重疊方面優(yōu)勢(shì)十分顯著。具體而言,優(yōu)勢(shì)有三:
(1)本文方法降低指標(biāo)集信息重疊的效率更高
據(jù)表5第7列可知,就指標(biāo)集整體信息重疊降低效率而言,在剔除指標(biāo)個(gè)數(shù)均分別為1、2、3的情況下,本文方法比已有最常用的Person相關(guān)分析法分別高136.24%、73.67%和35.21%。因此,與現(xiàn)有最常用的相關(guān)性信息重疊指標(biāo)篩選方法相比,本文方法降低指標(biāo)集整體信息重疊的效率要高的多。
(2)現(xiàn)有方法易誤刪對(duì)信息重疊貢獻(xiàn)小的指標(biāo)
據(jù)上文指標(biāo)篩選過(guò)程可知,指標(biāo)X4并不是對(duì)指標(biāo)集信息重疊貢獻(xiàn)最大的3個(gè)指標(biāo)之一。而現(xiàn)有Person相關(guān)分析法卻在剔除第2個(gè)指標(biāo)時(shí)就剔除了指標(biāo)X4。這意味著基于Person相關(guān)分析的信息重疊指標(biāo)篩選方法誤刪了對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)較小的指標(biāo)X4。而對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)較小的指標(biāo)是應(yīng)該予以保留的。
(3)現(xiàn)有方法易保留對(duì)信息重疊貢獻(xiàn)大的指標(biāo)
據(jù)表3第3列可知,指標(biāo)X3是初始的10個(gè)指標(biāo)中整體信息重疊貢獻(xiàn)度最大的指標(biāo)。而對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)越大的指標(biāo),越應(yīng)予以剔除。顯然,在指標(biāo)篩選過(guò)程中指標(biāo)X3理應(yīng)被第1個(gè)剔除。但現(xiàn)有Person相關(guān)分析法保留了指標(biāo)X3。因此,Person相關(guān)分析法容易錯(cuò)誤保留對(duì)指標(biāo)集整體信息重疊貢獻(xiàn)大的指標(biāo)。
綜上,不難理解的是,正是由于現(xiàn)有Person相關(guān)分析法容易誤刪整體信息重疊貢獻(xiàn)小的指標(biāo),及容易錯(cuò)誤保留整體信息重疊貢獻(xiàn)大的指標(biāo),才導(dǎo)致了該方法降低指標(biāo)集整體信息重疊的效率明顯偏低。而本文方法總是優(yōu)先剔除指標(biāo)集中整體信息重疊貢獻(xiàn)最大的指標(biāo),并不存在容易誤刪對(duì)整體信息重疊貢獻(xiàn)小的指標(biāo)或容易錯(cuò)誤保留對(duì)整體信息重疊貢獻(xiàn)大的指標(biāo)的弊端。
本研究聚焦于評(píng)價(jià)指標(biāo)間信息重疊程度的有效降低,提出了一種基于病態(tài)指數(shù)循環(huán)分析的信息重疊指標(biāo)篩選方法。通過(guò)逐輪剔除指標(biāo)集中整體信息重疊貢獻(xiàn)度最大的指標(biāo),直至指標(biāo)集整體信息重疊較低為止,實(shí)現(xiàn)了指標(biāo)集整體信息重疊程度的快速降低。在此基礎(chǔ)上,通過(guò)剔除Person相關(guān)系數(shù)較高的任意兩個(gè)指標(biāo)中變異系數(shù)較小的一個(gè)指標(biāo),避免指標(biāo)集整體信息重疊不高但個(gè)別指標(biāo)間的信息重疊卻依然較高。從而較為系統(tǒng)地實(shí)現(xiàn)了評(píng)價(jià)指標(biāo)間信息重疊水平的降低,最大限度地降低了指標(biāo)間的信息重疊對(duì)綜合評(píng)價(jià)的負(fù)面影響。最后,提出通過(guò)指標(biāo)集整體信息重疊降低效率檢驗(yàn)信息重疊指標(biāo)篩選合理性的方法,實(shí)現(xiàn)了即使在剔除指標(biāo)數(shù)量不同的條件下亦可比較不同方法降低指標(biāo)集整體信息重疊效率的高低。
本研究提出的信息重疊指標(biāo)遴選方法適用于評(píng)價(jià)指標(biāo)體系的構(gòu)建,即適用于在剔除重要性較差的指標(biāo)后,進(jìn)一步系統(tǒng)地降低剩余指標(biāo)間的信息重疊水平。特別是,對(duì)于個(gè)別或部分指標(biāo)間的相關(guān)程度較低而指標(biāo)間整體信息重疊水平卻較高這一情形,尤為適用。
本研究?jī)H聚焦于指標(biāo)集信息重疊的降低,因此同其它信息重疊指標(biāo)篩選方法一樣,還需要與以剔除重要性差的指標(biāo)為目的的指標(biāo)篩選方法結(jié)合使用,才能系統(tǒng)實(shí)現(xiàn)綜合評(píng)價(jià)指標(biāo)的篩選。此外,本研究雖通過(guò)指標(biāo)集整體信息重疊降低效率實(shí)現(xiàn)了信息重疊指標(biāo)篩選方法的合理性檢驗(yàn),但卻需要與現(xiàn)有方法橫向比較整體信息重疊降低效率才可實(shí)現(xiàn)信息重疊指標(biāo)篩選方法的合理性檢驗(yàn)。這些都是需要在今后的研究中進(jìn)一步加以完善的。