陳洪海,遲國(guó)泰(.大連理工大學(xué)管理與經(jīng)濟(jì)學(xué)部,遼寧大連6024;2.黑龍江科技大學(xué)理學(xué)院,黑龍江哈爾濱50022)
基于主要信息含量的指標(biāo)篩選方法
陳洪海1,2,遲國(guó)泰1
(1.大連理工大學(xué)管理與經(jīng)濟(jì)學(xué)部,遼寧大連116024;
2.黑龍江科技大學(xué)理學(xué)院,黑龍江哈爾濱150022)
針對(duì)指標(biāo)篩選問(wèn)題,提出了一種基于指標(biāo)主要信息含量的指標(biāo)篩選方法.以方差貢獻(xiàn)率為權(quán)重對(duì)因子載荷的絕對(duì)值進(jìn)行加權(quán),取加權(quán)結(jié)果的最大值作為指標(biāo)的信息含量;依據(jù)最大加權(quán)因子載荷標(biāo)準(zhǔn)確定累積信息含量比率,進(jìn)而通過(guò)累積信息含量比率的大小進(jìn)行指標(biāo)的篩選.最后,通過(guò)一個(gè)實(shí)例將提出的指標(biāo)篩選方法與現(xiàn)有因子分析指標(biāo)篩選方法進(jìn)行了對(duì)比分析,以此說(shuō)明所提出的指標(biāo)篩選方法的可行性及有效性.
指標(biāo)體系;指標(biāo)篩選;加權(quán)因子載荷;信息含量;因子分析
大量的評(píng)價(jià)指標(biāo)令決策者在科學(xué)評(píng)價(jià)及決策中常常無(wú)所適從,抓不到重點(diǎn).因此對(duì)原始指標(biāo)體系降維,提煉出少量評(píng)價(jià)指標(biāo)具有十分重要的現(xiàn)實(shí)意義.目前指標(biāo)降維方法雖然得到了較大的發(fā)展,但是因子分析依然是最常為使用的一種降維方法[1].通過(guò)因子分析實(shí)現(xiàn)指標(biāo)體系降維的方法主要有兩種:1)用少量公因子代替原始指標(biāo)的因子分析法.傳統(tǒng)的因子分析是通過(guò)把大量原始指標(biāo)綜合為少數(shù)幾個(gè)公因子來(lái)代表原始指標(biāo)信息,以實(shí)現(xiàn)指標(biāo)降維的目標(biāo).Anthony等[2]通過(guò)比較保留因子下因子載荷絕對(duì)值的大小,將兒童發(fā)展的諸多影響要素降維為3個(gè)因子.李培[3]通過(guò)因子分析將影響城市經(jīng)濟(jì)增長(zhǎng)的10個(gè)指標(biāo)降維為地理位置等3個(gè)因子.Helitze等[4]通過(guò)對(duì)保留因子下指標(biāo)因子載荷大小的比較,將大量節(jié)欲教育指標(biāo)降維為態(tài)度禁欲等4個(gè)因子.Becker等[5]利用因子分析對(duì)9種精神疾病因素進(jìn)行了降維.張兵等[6]利用因子分析研究了通貨膨脹周期對(duì)各國(guó)的影響.Jung[7]通過(guò)因子分析將反映感官屬性的全部指標(biāo)約減至4個(gè)公因子.這類(lèi)方法存在的問(wèn)題主要包括兩個(gè)方面.首先,傳統(tǒng)的因子分析法沒(méi)有刪除任何一個(gè)對(duì)評(píng)價(jià)結(jié)果影響較弱的原始指標(biāo).其次,公因子含義的確定主觀(guān)性太強(qiáng),而且公因子的數(shù)據(jù)亦不能直接獲取.2)剔除部分原始指標(biāo)而實(shí)現(xiàn)降維的因子分析法.為了克服傳統(tǒng)因子分析理論的上述弊端,部分學(xué)者進(jìn)行了有益的探索.通過(guò)因子載荷相對(duì)大小的對(duì)比,剔除因子載荷小、解釋原始指標(biāo)集信息能力差的指標(biāo),將原始指標(biāo)體系中其余指標(biāo)作為評(píng)價(jià)指標(biāo).陸寧等[8]通過(guò)刪除各因子下因子載荷的絕對(duì)值最小的指標(biāo),提出了西安市房地產(chǎn)市場(chǎng)危機(jī)預(yù)警指標(biāo)體系.廖海江[9]主要通過(guò)保留因子載荷絕對(duì)值相對(duì)較大的指標(biāo),提出了職業(yè)危害評(píng)價(jià)指標(biāo)體系的構(gòu)建方法.劉宏等[10]主要通過(guò)刪除因子載荷相對(duì)較小的指標(biāo),提出了水環(huán)境安全評(píng)價(jià)的指標(biāo)體系.顧雪松等[11]在對(duì)原始指標(biāo)進(jìn)行了聚類(lèi)分析的基礎(chǔ)上通過(guò)僅保留每個(gè)子類(lèi)中因子載荷絕對(duì)值最大的指標(biāo),構(gòu)建了評(píng)價(jià)指標(biāo)體系篩選模型.遲國(guó)泰等[12]通過(guò)剔除因子載荷小的指標(biāo),實(shí)現(xiàn)對(duì)評(píng)價(jià)結(jié)果影響小的指標(biāo)的刪除.應(yīng)桂英等[13]通過(guò)保留因子載荷絕對(duì)值較大的指標(biāo)保證保留下來(lái)的指標(biāo)可以較全面地反映原始指標(biāo)集的信息含量.薄湘平等[14]通過(guò)剔除不同因子下同一指標(biāo)的因子載荷都大于或等于0.5的指標(biāo)進(jìn)行指標(biāo)篩選.這類(lèi)方法存在的主要問(wèn)題是將因子載荷絕對(duì)值的最大值作為指標(biāo)的信息含量.但事實(shí)上因子載荷僅僅反映了指標(biāo)對(duì)公因子信息的解釋能力,并不反映指標(biāo)對(duì)原始指標(biāo)集信息的解釋能力.
針對(duì)上述問(wèn)題,本文提出了基于主要信息含量的指標(biāo)篩選方法.
2.1基于主要信息含量的指標(biāo)篩選原理
因子分析理論中因子載荷aij是指標(biāo)Xi與因子Fj間的相關(guān)系數(shù),原始指標(biāo)集絕大多數(shù)信息可由少數(shù)幾個(gè)信息量最大的因子解釋.因子Fj的方差貢獻(xiàn)率ωj是因子Fj的信息占原始指標(biāo)集信息的比例.因子載荷aij僅能反映指標(biāo)Xi解釋因子Fj信息的多少,并不能反映指標(biāo)Xi解釋原始指標(biāo)集信息的多少.由于最大方差正交旋轉(zhuǎn)后每個(gè)指標(biāo)僅與一個(gè)因子相關(guān)程度高,從而每個(gè)指標(biāo)僅通過(guò)一個(gè)因子載荷就可反映指標(biāo)解釋因子信息的多少.因此以因子Fj的方差貢獻(xiàn)率ωj對(duì)因子載荷aij的絕對(duì)值加權(quán),并利用加權(quán)結(jié)果的最大值表示指標(biāo)Xi解釋原始指標(biāo)集信息的多少.這就是基于主要信息含量的指標(biāo)篩選方法原理.
2.2基于主要信息含量的指標(biāo)篩選
下面闡述基于主要信息含量的指標(biāo)篩選核心過(guò)程.
1)計(jì)算最大方差正交旋轉(zhuǎn)后加權(quán)因子載荷的絕對(duì)值
其中ωj及aij分別是最大方差正交旋轉(zhuǎn)后因子Fj的方差貢獻(xiàn)率和因子Fj下指標(biāo)Xi的因子載荷.進(jìn)行最大方差正交旋轉(zhuǎn)的目的在于增加指標(biāo)通過(guò)絕對(duì)值最大的因子載荷解釋因子信息的能力.限于篇幅,最大方差正交旋轉(zhuǎn)后因子的方差貢獻(xiàn)率及載荷等的確定可參見(jiàn)文獻(xiàn)[15]給出的方法,這里不再贅述.
加權(quán)因子載荷μij反映指標(biāo)Xi解釋原始指標(biāo)集信息比例當(dāng)中,僅僅由因子Fj反映的那一部分.其中i=1,2,...,m,m為篩選前的原始指標(biāo)的個(gè)數(shù);j=1,2,...,k,k為保留因子的個(gè)數(shù);
2)確定指標(biāo)Xi的信息含量SIi
SIi反映了指標(biāo)Xi解釋原始指標(biāo)集信息比率的主要部分,稱(chēng)其為指標(biāo)Xi的主要信息含量(簡(jiǎn)稱(chēng)信息含量).以表1為例,若第2行中第一列的加權(quán)因子載荷絕對(duì)值|ω1a21|最大,則指標(biāo)X2的信息含量SI2=|ω1a21|.依此類(lèi)推可得全部指標(biāo)的信息含量SIi(i=1,2,...,m).信息含量SIi越大,指標(biāo)Xi解釋原始指標(biāo)集信息的比率越大,相應(yīng)地該指標(biāo)對(duì)評(píng)價(jià)結(jié)果影響越顯著,越應(yīng)予以保留;反之,則越應(yīng)剔除.這就是最大加權(quán)因子載荷標(biāo)準(zhǔn);
表1 指標(biāo)的真實(shí)信息含量Tab 1 Real information contentof index
3)信息含量SIi遞減排序序列的構(gòu)造.假設(shè)SIm1≥SIm2≥···≥SImm.這個(gè)序列實(shí)際上是步驟2)計(jì)算結(jié)果SIi由大至小的排序;
4)利用累積信息含量比率IRu篩選指標(biāo).信息含量SIi最大的前u個(gè)指標(biāo)的信息含量占整個(gè)原始指標(biāo)集信息含量的比例為
若滿(mǎn)足IRu-1<IR0≤IRu,保留信息含量最大的u個(gè)指標(biāo).其中IR0為決策者滿(mǎn)意的遴選后的指標(biāo)占全部指標(biāo)信息含量的比率.這個(gè)比率越大,遴選后的指標(biāo)占全部指標(biāo)信息含量的比率越大,但相應(yīng)地保留的指標(biāo)也會(huì)越多.下文的這個(gè)比率取80%,即在IRu-1<80%≤IRu的情況下求得所遴選指標(biāo)的個(gè)數(shù).
目前在篩選出信息量較大的指標(biāo)的情況下有時(shí)還利用相關(guān)分析等方法[16]做指標(biāo)的進(jìn)一步篩選,以獲得數(shù)目更少的評(píng)價(jià)指標(biāo).若決策者覺(jué)得遴選出的指標(biāo)數(shù)量還需更少,除可結(jié)合文獻(xiàn)[16]中的相關(guān)分析法做指標(biāo)的進(jìn)一步篩選外,亦可將累積信息含量比率的閾值IR0設(shè)定得更小一些.
3.1數(shù)據(jù)來(lái)源
以10個(gè)大連市綠色發(fā)展指標(biāo)的篩選為例說(shuō)明本文方法的運(yùn)用.10個(gè)指標(biāo)分別是X1規(guī)模以上工業(yè)綜合能源消費(fèi)量(104tce),X2能源消費(fèi)彈性系數(shù),X3人均公共綠地面積(m2),X4單位工業(yè)增加值用水量(m3/萬(wàn)元),X5規(guī)模以上工業(yè)原細(xì)消費(fèi)量(104t),X6規(guī)模以上工業(yè)萬(wàn)元GDP綜合能耗(tce/萬(wàn)元),X7城市生活垃圾無(wú)害化處理率,X8市區(qū)空氣質(zhì)量?jī)?yōu)良天數(shù),X9工業(yè)固體廢棄物綜合利用(104t),X10化學(xué)需氧量排放量(104t).這10個(gè)指標(biāo)的原始數(shù)據(jù)均來(lái)源于《大連統(tǒng)計(jì)年鑒》(2001—2014)[17],列于表2第3~12列.據(jù)文獻(xiàn)[15]的Z標(biāo)準(zhǔn)化公式得到標(biāo)準(zhǔn)化后的指標(biāo)數(shù)據(jù),列于表3第3~12列.
表2 原始數(shù)據(jù)Table2 Raw data
3.2基于主要信息含量的綠色發(fā)展指標(biāo)篩選
1)方法適用性的檢驗(yàn).求出表3中全部指標(biāo)數(shù)據(jù)的相關(guān)系數(shù)矩陣R=(rij)10×10.由于絕大多數(shù)指標(biāo)間的相關(guān)系數(shù)rij較0.3大,因此適于進(jìn)行因子分析[18];
2)累積方差貢獻(xiàn)率ωk的計(jì)算.求出矩陣R的特征值λj,列于表4第2列.將特征值λj依次累加后除以指標(biāo)數(shù)目10得因子旋轉(zhuǎn)前因子的累積方差貢獻(xiàn)率,列于表4第3列.進(jìn)而可知前2個(gè)因子的累積方差貢獻(xiàn)率為84.899%,已經(jīng)超過(guò)80%,所以保留信息量最大的前兩個(gè)因子F1與F2;
表3 標(biāo)準(zhǔn)化的數(shù)據(jù)Tab 3 Standardized data
3)載荷矩陣(aij)10×2的計(jì)算.求出相關(guān)系數(shù)矩陣R=(rij)10×10與特征值λ1及λ2對(duì)應(yīng)的標(biāo)準(zhǔn)正交化的特征向量
再將λ1與λ2這兩個(gè)特征值的算術(shù)平方根,分別乘上特征向量ξ1及ξ2,得到未經(jīng)正交旋轉(zhuǎn)的因子載荷矩陣(bij)10×2.進(jìn)而據(jù)文獻(xiàn)[15]最大方差正交旋轉(zhuǎn)公式得到最大方差正交旋轉(zhuǎn)后的因子載荷矩陣(aij)10×2,取絕對(duì)值后列于表5第3~4列.
表4 方差貢獻(xiàn)率Tab 4 Proportion of variance
表5 指標(biāo)篩選Tab 5 Indicators screening
4)最大方差正交旋轉(zhuǎn)后因子方差貢獻(xiàn)率及累積方差貢獻(xiàn)率的計(jì)算.將表5第3、4列的數(shù)據(jù)的平方和分別除以指標(biāo)數(shù)目10,得前2個(gè)因子的方差貢獻(xiàn)率ωj,列于表4第4列.將方差貢獻(xiàn)率ωj依次累加,可得最大方差正交旋轉(zhuǎn)后因子的累積方差貢獻(xiàn)率,列于表4第5列;
5)指標(biāo)信息含量SIi的計(jì)算.將表4第4列的ωj及表5第3、4列的aij的絕對(duì)值代入式(2),得到了指標(biāo)信息含量SIi(i=1,2,...,10),列于表5第6列;
6)累積信息含量比率IRi的計(jì)算.將表5第6列的指標(biāo)信息含量SIi按照由大至小的順序排列,列于表5第7列.將與表5第7列各信息含量一一對(duì)應(yīng)的指標(biāo)列于表5第8列.將表5第7列由大至小排列的指標(biāo)信息含量SIi代入式(3),得到信息含量最大的指標(biāo)的累積信息含量比率,列于表5第9列;
7)根據(jù)累積信息含量比率篩選指標(biāo).設(shè)決策者滿(mǎn)意的IR0=80%.據(jù)表5第9列累積信息含量比率可知IR6=72.88%<80%≤IR7=82.76%.因此保留信息含量SIi最大的前7個(gè)指標(biāo):X6,X3,X1,X5,X4,X10,X9,剔除信息含量小的指標(biāo)X2,X8,X7.篩選結(jié)果列于表5第10列.若決策者覺(jué)得保留的指標(biāo)較多,可以通過(guò)適當(dāng)減小IR0值來(lái)實(shí)現(xiàn)指標(biāo)的進(jìn)一步篩選.
3.3基于現(xiàn)有因子分析法的綠色發(fā)展指標(biāo)篩選
設(shè)評(píng)價(jià)決策者滿(mǎn)意的指標(biāo)篩選閾值為0.9.若指標(biāo)的各因子載荷的絕對(duì)值中有一個(gè)不小于0.9,則保留該指標(biāo);反之,則刪除該指標(biāo).在表5的第3、4列中,只有X1,X3,X5,X6,X7,X8等6行有|aij|≥0.9.因此,現(xiàn)有因子分析法最終保留X1,X3,X5,X6,X7,X8等6個(gè)指標(biāo),具體篩選結(jié)果列于表5第5列.
3.4兩種方法實(shí)例結(jié)果優(yōu)劣的對(duì)比分析
1)現(xiàn)有研究保留了信息含量最小的指標(biāo).據(jù)表5第8列可知X8和X7是信息含量最小的兩個(gè)指標(biāo).而且據(jù)表5第7列可知這兩個(gè)指標(biāo)的信息含量均顯著小于其它指標(biāo).但是現(xiàn)有方法卻保留了這兩個(gè)指標(biāo);
2)現(xiàn)有研究刪除了信息含量較大的指標(biāo).現(xiàn)有研究共計(jì)保留了6個(gè)指標(biāo).據(jù)表5第8列可知X4和X10是信息含量第5及第6大的兩個(gè)指標(biāo),理應(yīng)予以保留.但是現(xiàn)有研究卻刪除了這兩個(gè)信息含量較大的指標(biāo);
3)本文遴選出的評(píng)價(jià)指標(biāo)的累積信息含量比率更大.據(jù)式(3)可得現(xiàn)有研究保留的6個(gè)指標(biāo)X1,X3,X5, X6,X7,X8的累積信息含量比率為為便于對(duì)比,取本研究保留下來(lái)的指標(biāo)中信息含量最大的6個(gè)指標(biāo)X1,X3,X4,X5,X6,X10與現(xiàn)有研究對(duì)比.據(jù)表5第9列可知本研究前6個(gè)被保留的指標(biāo)的累積信息含量比率為IR6=72.88%.因此,同樣是保留的6個(gè)最重要的指標(biāo),本文保留的評(píng)價(jià)指標(biāo)的信息含量比現(xiàn)有方法多出(72.88%-59.94%)/(59.94%)=21.59%的信息含量.
本文根據(jù)信息含量從大到小的排序保留指標(biāo),避免了保留信息含量較小的指標(biāo)或刪除信息含量較大的指標(biāo).
指標(biāo)的信息含量反映了指標(biāo)的重要程度.其大小不僅取決于指標(biāo)因子載荷絕對(duì)值的最大值,還取決于因子的方差貢獻(xiàn)率.因子載荷絕對(duì)值的最大值大,指標(biāo)解釋原始指標(biāo)集信息的比率卻并不一定大.因此,現(xiàn)有研究依據(jù)因子載荷絕對(duì)值的最大值遴選指標(biāo)并不能反映指標(biāo)的信息含量.而且實(shí)例結(jié)果表明現(xiàn)有研究往往會(huì)保留信息含量較小的指標(biāo),誤刪信息含量較大的指標(biāo).最大方差正交旋轉(zhuǎn)后,以因子方差貢獻(xiàn)率對(duì)指標(biāo)的各因子載荷絕對(duì)值加權(quán),取其最大值作為指標(biāo)的信息含量.由此克服了現(xiàn)有研究?jī)H僅考慮因子載荷對(duì)指標(biāo)遴選的影響,忽略方差貢獻(xiàn)率體現(xiàn)因子解釋原始指標(biāo)集信息比例的不足.最終以各指標(biāo)信息含量為基礎(chǔ)確定累積信息含量比率進(jìn)行指標(biāo)的遴選,避免了現(xiàn)有研究誤刪信息含量大或保留信息含量小的指標(biāo)的弊端.
[1]張煜東,霍元鎧,吳樂(lè)南,等.降維技術(shù)與方法綜述.四川兵工學(xué)報(bào),2010,31(10):1–7. Zhang Y D,Huo Y K,Wu L N,etal.A review of dimension reductionmethods.Journal of Sichuan Ordnance,2010,31(10):1–7. (in Chinese)
[2]Anthony JL,AsselPA,Williams JP.Exploratory and confirmatory factoranalysesof theDIAL–3:Whatdoes this“developmental screener”reallymeasure.Journalof SchoolPsychology,2007,45(4):423–438.
[3]李培.中國(guó)城市經(jīng)濟(jì)增長(zhǎng)的效率與差異.數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2007(7):97–106.LiP.Theefficiency and disparity ofurban economic grow th in China.The JournalofQuantitative&TechnicalEconom ics,2007(7): 97–106.(in Chinese)
[4]HelitzerD,HollisC,DeHernandez BU,etal.Evaluation forcommunity-based programs:The integration of logicmodelsand factor analysis.Evaluation and Program Planning,2010,33(3):223–233.
[5]Becker D F,M iguel L A,Paris M,et al.Exploratory factor analysis of borderline personality disorder criteria in monolingual Hispanic outpatientswith substanceuse disorders.Psychiatry Research,2010,178(2):305–308.
[6]張兵,李翠蓮.“金磚國(guó)家”通貨膨脹周期的協(xié)動(dòng)性.經(jīng)濟(jì)研究,2011(9):29–40. Zhang B,LiC L.The inflation cycle co-movementsof BRICS:Based on SPSS factor analysis and cluster analysismethods.Econom ic Research Journal,2011(9):29–40.(in Chinese)
[7]Jung SH.Exploratory factor analysiswith smallsample sizes:A comparison of three approaches.Behavioural Processes,2013(97): 90–95.
[8]陸寧,姜麗寧,俞允凱,等.西安市房地產(chǎn)市場(chǎng)景氣指標(biāo)篩選研究.長(zhǎng)安大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2007,9(3):57–60. Lu N,Jiang LN,Yu Y K,etal.On the prosperity index selection in realestate Market in Xi’an.Journalof Chang’an University: SocialScience Edition,2007,9(3):57–60.(in Chinese)
[9]廖海江.作業(yè)場(chǎng)所職業(yè)危害統(tǒng)計(jì)指標(biāo)篩選研究.中國(guó)安全生產(chǎn)科學(xué)技術(shù),2009,5(6):138–141. Liao H J.Screening research on statistical indicatorsofoccupationalhazard inworkplace.Journalof Safety Scienceand Technology, 2009,5(6):138–141.(in Chinese)
[10]劉宏,李琳.鎮(zhèn)江市水環(huán)境安全評(píng)價(jià)指標(biāo)體系的建立與篩選.安徽農(nóng)業(yè)科學(xué),2010,38(11):5813–5816. Liu H,Li L.Establishmentand screening of evaluation index system forwater environment safety in Zhenjiang.Journalof Anhui Agricultural Sciences,2010,38(11):5813–5816.(in Chinese)
[11]顧雪松,遲國(guó)泰,程鶴.基于聚類(lèi)-因子分析的科技評(píng)價(jià)指標(biāo)體系構(gòu)建.科學(xué)學(xué)研究,2010,28(4):508–514. Gu X S,Chi G T,Cheng H.The establishment of science and technology evaluation indicators system based on cluster–factor analysis.Studies in Science of Science,2010,28(4):508–514.(in Chinese)
[12]遲國(guó)泰,曹婷婷,張昆.基于相關(guān)-主成分分析的人的全面發(fā)展評(píng)價(jià)指標(biāo)體系構(gòu)建.系統(tǒng)工程理論與實(shí)踐,2012,32(1): 111–119. ChiG T,Cao T T,Zhang K.The establishmentof human all-around developmentevaluation indicator system based on correlationprinciple componentanalysis.Systems Engineering:Theory&Practice,2012,32(1):111–119.(in Chinese)
[13]應(yīng)桂英,李恒,段占祺,等.衛(wèi)生統(tǒng)計(jì)指標(biāo)篩選方法評(píng)價(jià).中國(guó)衛(wèi)生事業(yè)管理,2012(6):465–467. YingGY,LiH,Duan ZQ,etal.Evaluating themethodsto screen health statistical indexes.TheChineseHealth ServiceManagepent, 2012(6):465–467.(in Chinese)
[14]薄湘平,馬煉,付凈.酒店內(nèi)部服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系研究.湖南大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012,26(3):38–41. Bo X P,Pa L,Fu J.Study on the evaluation index system for the internal service quality of hotels.Journal of Hunan University: SocialSciences Edition,2012,26(3):38–41.(in Chinese)
[15]王斌會(huì).多元統(tǒng)計(jì)分析及R語(yǔ)言建模.廣州:暨南大學(xué)出版社,2010:157–180. Wang BH.Multivariate Statistical AnalysisandMathematicalModelingwith R.Guangzhou:Jinan University Press,2010:157–180. (in Chinese)
[16]張昆,遲國(guó)泰.基于相關(guān)分析–粗糙集理論的生態(tài)評(píng)價(jià)指標(biāo)體系構(gòu)建.系統(tǒng)工程學(xué)報(bào),2012,27(1):119–127. Zhang K,ChiG T.Establishmentof ecological evaluation indicators system based on correlation analysis-rough theory.Journal of Systems Engineering,2012,27(1):119–127.(in Chinese)
[17]大連市統(tǒng)計(jì)局,國(guó)家統(tǒng)計(jì)局大連調(diào)查隊(duì).大連統(tǒng)計(jì)年鑒.北京:中國(guó)統(tǒng)計(jì)出版社,2001–2014. Dalian Municipal Bureau of Statistics,The National Bureau of Statistics Dalian Team.Dalian Statistics Yearbook.Beijing:China Statistics Press,2001–2014.(in Chinese)
[18]何曉群.多元統(tǒng)計(jì)分析.第3版.北京:中國(guó)人民大學(xué)出版社,2011:154–155. He X Q.Multivariate Statistical Analysis.3rd Edition.Beijing:China Renm in University Press,2011:154–155.(in Chinese)
Indices screeningmethod based onmain information content
Chen Honghai1,2,ChiGuotai1
(1.Faculty ofManagementand Econom ics,Dalian University of Technology,Dalian 116024,China;
2.College of Science,Heilongjiang University of Science and Technology,Harbin 150022,China)
Thispaperproposesan indices’screeningmethod based on each index’smain information contentto solve their reduction problem.First,ituses the proportion of variance to weight the absolute value of loading, and defines itsmaximum as the information contentofan index.Second,bymeansof themaximum weighted loading standard,it calculates the proportions of the indices’accumulated information contents,whose size is used as the criteria to screen the indices.Finally,using a numerical illustration,the proposed method and the existing factor analysismethod are contrastively analyzed,and the feasibility and validity of the proposed method are illustrated.
index system;indicesscreening;weighted factor loading;information content;factoranalysis
N945.16/N94-0
A
1000-5781(2016)02-0268-06
10.13383/j.cnki.jse.2016.02.012
2014-05-30;
2015-01-29.
國(guó)家自然科學(xué)基金資助項(xiàng)目(71171031;71471027);遼寧經(jīng)濟(jì)社會(huì)發(fā)展重點(diǎn)課題資助項(xiàng)目(2015lslktzdian-05).
陳洪海(1978—),男,遼寧遼中人,博士生,研究方向:復(fù)雜系統(tǒng)評(píng)價(jià),Email:adams2009@163.com;
遲國(guó)泰(1955—),男,黑龍江海倫人,博士,教授,博士生導(dǎo)師,研究方向:復(fù)雜系統(tǒng)評(píng)價(jià),Email:chigt@dlut.edu.cn.