俞立平 劉駿
〔摘 要〕針對主成分分析和因子分析廣泛應(yīng)用于科技評價,但是對評價方法選用缺乏檢驗問題。本文建立了主成分分析與因子分析評價方法適用性的檢驗框架與檢驗體系,從評價前檢驗、評價中檢驗、評價后檢驗3個角度進(jìn)行檢驗。評價前檢驗包括KMO檢驗、Bartlett檢驗、正態(tài)分布檢驗;評價中檢驗主要是評價指標(biāo)信息損失檢驗;評價后檢驗主要包括主成分或公共因子的解釋力檢驗、代表性檢驗、指標(biāo)單調(diào)性檢驗和權(quán)重合理性檢驗。并以JCR 2015經(jīng)濟學(xué)期刊為例進(jìn)行了實證分析,研究認(rèn)為,采用主成分分析和因子分析評價必須進(jìn)行方法適用性檢驗;因子分析在信息損失較大時不適用于科技評價;主成分分析并不適合評價對象較多的情況。
〔關(guān)鍵詞〕主成分分析;因子分析;方法檢驗;科技評價;學(xué)術(shù)期刊
DOI:10.3969/j.issn.1008-0821.2018.06.011
〔中圖分類號〕G302 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2018)06-0073-07
〔Abstract〕Principal component analysis and factor analysis were widely used in science and technology evaluation,however,the selection of evaluation methods was lack of inspection.In this paper,the test framework and test system for the applicability of principal component analysis and factor analysis were established.It had three perspectives:pre evaluation,test in evaluation,and post evaluation test.The pre test includes KMO test,Bartlett test and normal distribution test;Test in evaluation included information loss test of evaluation index;The post test includes the explanatory power test,the representativeness test,the index monotonicity test and the weight rationality test.This paper suggested that the method suitability test should be carried out by principal component analysis and factor analysis;Factor analysis was not generally applicable to science and technology evaluation;Principal component analysis was not suitable for the evaluation with more objects.
〔Key words〕principal component analysis;factor analysis;method test;science and technology evaluation;academic Journal
主成分分析與因子分析是兩種性質(zhì)相近的多屬性評價方法,由于兩種方法均具有降維和不需要主觀賦權(quán)的特點,在科技評價中得到了廣泛的應(yīng)用,但是對于評價方法的適用性,目前學(xué)術(shù)界基本采用KMO檢驗與Bartlett檢驗,這也是這兩種方法自帶的檢驗方法,很少有從其他角度對這兩種方法的適用性進(jìn)行思考的研究。對這個問題進(jìn)行深入研究不僅能夠從理論上豐富多屬性評價理論,對于科技評價實踐也具有重要意義,可以減少評價方法的誤用,從技術(shù)層面保證評價的公平公正。
在科技評價中,主成分分析得到了廣泛的應(yīng)用。在宏觀研究層面,譚開明等(2013)[1]構(gòu)建了西部地區(qū)創(chuàng)新能力評價指標(biāo)體系,運用主成分分析方法對西部地區(qū)各省、區(qū)創(chuàng)新能力進(jìn)行綜合評價。楊武等(2014)[2]以創(chuàng)新周期為理論依據(jù),利用主成分分析方法,構(gòu)建了中國科技創(chuàng)新景氣指數(shù)。史曉燕等(2009)[3]利用主成分分析法對包括陜西在內(nèi)的全國內(nèi)地30個省、市、自治區(qū)科技競爭力進(jìn)行排序,分析陜西在科技發(fā)展水平方面與全國整體水平及與其它發(fā)達(dá)省市的差距。徐頑強等(2016)[4]根據(jù)波特鉆石模型從科技資源市場需求外部環(huán)境和政府行為兩個維度構(gòu)建科技服務(wù)業(yè)集聚化發(fā)展分析框架。
在微觀主成分分析科技評價領(lǐng)域,李敬鎖等(2015)[5]采用主成分分析對國家科技支撐計劃農(nóng)業(yè)領(lǐng)域項目績效的影響因素進(jìn)行分析評價。吳巖(2013)[6]基于主成分分析法對科技型中小企業(yè)技術(shù)創(chuàng)新能力的影響因素進(jìn)行評價與分析。韓曉明等(2015)[7]結(jié)合主成分分析和熵值法,以省部共建的高校為研究對象,構(gòu)建了高校科技創(chuàng)新能力評價指標(biāo)體系。辛督強(2012)[8]采用主成分分析法對13種力學(xué)類中文期刊進(jìn)行分析和排名,認(rèn)為主成分分析法不僅可以解決期刊綜合評價中指標(biāo)的相關(guān)性和權(quán)重選取問題,還可以有效消除自引過高導(dǎo)致的影響力評價失真問題。何先剛等(2014)[9]按照分層分類分級思想,給出了網(wǎng)絡(luò)電子期刊的綜合評價指標(biāo)體系,提出了基于主成分分析的網(wǎng)絡(luò)電子期刊模糊綜合評價方法。
科技評價中因子分析的應(yīng)用也比較廣泛。顧雪松等(2010)[10]從科技投入、科技產(chǎn)出、科技對經(jīng)濟與社會影響3個方面選取指標(biāo),利用因子分析構(gòu)建了科技綜合評價指標(biāo)體系。李子倫(2014)[11]建立了包括資源利用效率水平、人力資本積累水平以及科技創(chuàng)新能力的產(chǎn)業(yè)結(jié)構(gòu)指標(biāo)體系,基于因子分析對金磚國家產(chǎn)業(yè)結(jié)構(gòu)升級水平進(jìn)行測度。董曄璐(2015)[12]運用因子分析法評價了全國31個省市的高??萍紕?chuàng)新能力。黃斌等(2013)[13]運用因子分析方法測度了江蘇省13個地級市的科技服務(wù)業(yè)競爭力。翁媛媛等(2009)[14]采用因子分析法對上海市的科技創(chuàng)新環(huán)境進(jìn)行了評價與分析。鄭麗霞(2014)[15]以2014年湯森路透社JCR中SCI收錄的20種期刊數(shù)據(jù)為樣本,選取8個指標(biāo)采用因子分析法進(jìn)行綜合評價。柴玉婷等(2016)[16]選取2015版中國科技期刊引證報告(擴刊版)中的14個文獻(xiàn)計量指標(biāo),利用因子分析法對42所師范大學(xué)理科學(xué)報進(jìn)行評價。何莉等(2014)[17]運用因子分析法,采用11個文獻(xiàn)計量指標(biāo),評價了安徽省高校自然科學(xué)學(xué)報。
關(guān)于主成分分析在評價中的適用性研究,Edward(1992)[18]認(rèn)為主成分或因子分析的前提條件是評價指標(biāo)數(shù)據(jù)必須服從正態(tài)分布。俞立平等(2009)[19]認(rèn)為采用主成分分析進(jìn)行學(xué)術(shù)期刊評價,必須增加主成分分析回歸系數(shù)為正這一條件。樓文高等(2010)[20]認(rèn)為采用主成分分析進(jìn)行評價,評價對象數(shù)量越多,效果越好。
關(guān)于因子分析在評價中的適用性研究,MacCallum等(1999)[21]探討了不同變量公共方差和不同樣本大小情況下,因子載荷的精確程度問題,提出在大樣本下應(yīng)用因子分析較好。Fabrigar等(1999)[22]認(rèn)為每個公共因子至少應(yīng)包含4個或是更多的指標(biāo)才能確保因子能被有效識別。傅德印(2007)[23]提出建立因子分析適用性以及提取公共因子數(shù)目多少的檢驗方法。俞立平等(2014)[24]根據(jù)因子分析隱含的假設(shè)是評價指標(biāo)必須服從正態(tài)分布的原理,認(rèn)為在期刊評價指標(biāo)普遍呈冪律分布的情況下,最好將評價指標(biāo)取對數(shù)后再進(jìn)行評價,否則會擴大系統(tǒng)誤差。
從目前的研究現(xiàn)狀看,無論是主成分分析還是因子分析,在科技評價中應(yīng)用均比較廣泛,既涉及到宏觀與微觀層面的評價,也涉及到采用這兩種方法進(jìn)行降維,然后進(jìn)行探索性分析。關(guān)于主成分分析與因子分析的適用性檢驗,除了這兩種方法自身提出的檢驗方法外,學(xué)術(shù)界還提出數(shù)據(jù)分布、評價對象數(shù)量、指標(biāo)數(shù)量、指標(biāo)單調(diào)性等方面,但是在實證研究中,很少有學(xué)者注意到這些問題。此外,關(guān)于主成分分析與因子分析評價的適用性檢驗方法,總體上還不夠系統(tǒng),在理論上需要進(jìn)一步深化。本文首先建立主成分分析與因子分析的適用性檢驗框架,然后進(jìn)行理論分析,并以JCR 2015經(jīng)濟學(xué)期刊評價為例,進(jìn)一步分析討論主成分分析與因子分析的適用性檢驗相關(guān)問題。
1 主成分分析與因子分析的適用性檢驗分析
1.1 主成分分析與因子分析檢驗框架
主成分分析與因子分析的檢驗框架如圖1所示,通過這個檢驗框架,可以全面檢驗主成分分析與因子分析兩種方法在科技評價中的適用性。根據(jù)評價過程,分為評價前檢驗、評價中檢驗與評價后檢驗3個部分。評價前檢驗包括主成分分析與因子分析自帶的KMO與Bartlett檢驗,此外還增加了指標(biāo)數(shù)據(jù)分布檢驗。評價中分析主要指主成分分析與因子分析本質(zhì)上都是降維技術(shù),那么必然存在著信息損失,從而影響評價結(jié)果,所以要評估信息損失的大小。評價后檢驗包括主成分(因子)解釋力檢驗、即每個主成分(因子)的含義是否明確;代表性檢驗,即每個主成分(因子)涉及相關(guān)指標(biāo)數(shù)量多少,以及是否具有代表性;指標(biāo)單調(diào)性檢驗,即是主成分分析和因子分析的評價結(jié)果與評價指標(biāo)是否正相關(guān);權(quán)重合理性檢驗就是指每個主成分(因子)涉及的指標(biāo)權(quán)重之和是否合理,體現(xiàn)評價目的,是否具有管理意義。
1.2 主成分分析與因子分析的評價前檢驗
1.2.1 KMO檢驗與Bartlett檢驗
這是主成分分析與因子分析檢驗的第一步,也是所有實證研究均比較重視的檢驗,KMO檢驗重點檢驗指標(biāo)之間的相關(guān)度,以決定是否能夠進(jìn)行主成分或因子分析,這兩種方法的檢驗結(jié)果相同。關(guān)于KMO檢驗的大小問題,目前并沒有嚴(yán)格的說法,大致大于0.5就可以,當(dāng)然越大越好,KMO越大,意味著評價指標(biāo)之間的相關(guān)度越高。從評價的角度,KMO越小,意味著評價時數(shù)據(jù)的信息損失會越大,所以本文認(rèn)為,無論是主成分還是因子分析評價,KMO檢驗值不宜低于0.8,當(dāng)然,從數(shù)據(jù)探索的角度,這個要求可以低一些,大于0.5即可。
1.2.2 指標(biāo)數(shù)據(jù)分布檢驗
根據(jù)主成分分析的原理,主成分分析不需要對評價指標(biāo)數(shù)據(jù)的先驗分布有任何假設(shè)。
2)因子分析的原理與指標(biāo)數(shù)據(jù)分布
采用因子分析評價的關(guān)鍵是找出公共因子,并且解釋每個公共因子的實際含義,以便對實際問題進(jìn)行分析。為得增強公共因子的解釋效應(yīng),往往要對因子載荷矩陣進(jìn)行正交旋轉(zhuǎn)或斜交旋轉(zhuǎn)。公共因子用到的算法包括主因子法、加權(quán)最小二乘法、不加權(quán)最小二乘法、重心法等等。
從因子分析的原理看,采用因子分析需要用到回歸分析,那么回歸分析的前提之一數(shù)據(jù)必需服從正態(tài)分布因子分析也必需具備,所以因子分析要進(jìn)行評價指標(biāo)的正態(tài)分布檢驗。
1.3 主成分分析與因子分析的評價中檢驗
評價中檢驗主要是主成分分析與因子分析對原始評價指標(biāo)的信息損失檢驗,由于主成分分析與因子分析均進(jìn)行降維,因此難免有信息損失。對于主成分分析而言,其信息損失主要表現(xiàn)在只選取有限的幾個主成分進(jìn)行評價,即特征根大于1的主成分,舍棄的主成分就是損失的信息,其信息損失可以用1減去累計方差貢獻(xiàn)率來衡量。由于指標(biāo)信息損失的存在,必然會影響評價結(jié)果的排序,這難免會得不到評價對象的認(rèn)可,尤其是信息損失使得其排序下降時。
因子分析的信息損失包括兩部分,第一部分是每個原始指標(biāo)的特殊因子,因子分析將每個原始指標(biāo)信息用公共因子與特殊因子兩部分進(jìn)行衡量,在具體評價時只采用公共因子進(jìn)行評價,而特殊因子信息被省略了,這部分信息損失就是1減去共同度。第二部分就是舍棄的特征根小于1的公共因子,與主成分分析類似,其信息損失就是1減去特征根大于1的公共因子的累計方差貢獻(xiàn)率。
根據(jù)以上分析,因子分析信息損失大于主成分分析,從評價的角度,主成分分析更合適。
1.4 主成分分析與因子分析的評價后檢驗
1.4.1 主成分與公共因子的解釋力檢驗
主成分或公共因子的解釋能力,就是每個主成分或公共因子是否具有明確的含義。從主成分分析與因子分析的原理看,因子分析由于進(jìn)行了矩陣旋轉(zhuǎn),因此公共因子的內(nèi)涵往往比較明顯,而主成分分析采用的原始指標(biāo)矩陣,其解釋力相對弱一些。在科技評價中,采用有限的公共因子或主成分進(jìn)行評價,在賦權(quán)時如果經(jīng)濟含義不明顯,解釋力較差,這是不利于評價的,所以從這個角度分析,采用因子分析更好一些。
1.4.2 主成分與公共因子的代表性檢驗
所謂代表性就是主成分或公共因子涉及的指標(biāo)數(shù)量,以及其是否具有代表性。Fabrigar等(1999)[22]認(rèn)為每個公共因子至少應(yīng)包含4個或是更多的指標(biāo)才能確保因子能被有效識別,但并沒有給出嚴(yán)格的證明。但是如果主成分或公共因子涉及的指標(biāo)太少,比如1個,那也說明代表性不夠,所以主成分或公共因子涉及的指標(biāo)數(shù)量最好為3個以上,最低不能低于2個。
1.4.3 評價指標(biāo)的單調(diào)性檢驗
所謂單調(diào)性檢驗,就是檢驗主成分分析和因子分析的評價得分與評價指標(biāo)之間是否正相關(guān),當(dāng)然前提條件是所有的評價指標(biāo)必須都是正向指標(biāo),事先要進(jìn)行標(biāo)準(zhǔn)化處理。但是由于評價指標(biāo)之間往往相關(guān),存在多重共線性,因此難以采用傳統(tǒng)的回歸分析法進(jìn)行評價指標(biāo)的單調(diào)性檢驗。但是可以采用嶺回歸來降低多重共線性的影響,如果絕大多數(shù)指標(biāo)的回歸系數(shù)為正,說明單調(diào)性較好。
1.4.4 主成分分析與因子分析的權(quán)重合理性檢驗
無論是主成分分析還是因子分析,在評價中是不需要權(quán)重的,其實默認(rèn)的是等權(quán)重。在評價中往往選取特征根大于1的前幾個主成分或公共因子進(jìn)行評價,基于方差貢獻(xiàn)率進(jìn)行加權(quán)匯總。那么這些主成分或公共因子是否真的重要呢?能否真正為管理服務(wù)?方差貢獻(xiàn)率能否體現(xiàn)權(quán)重呢?所有這些還需要進(jìn)行人工專家判斷,這就是權(quán)重合理性檢驗的本質(zhì)所在。俞立平等(2009)[25]提出模擬權(quán)重的概念,就是將評價結(jié)果作為因變量,評價指標(biāo)作為自變量進(jìn)行回歸,將回歸系數(shù)標(biāo)準(zhǔn)化后就是模擬權(quán)重。這樣將每個主成分或公共因子涉及的指標(biāo)模擬權(quán)重相加,就得到了主成分或公共因子的模擬權(quán)重,進(jìn)而進(jìn)行進(jìn)一步的分析判斷。
因子分析對公共因子經(jīng)濟含義的解釋能力往往較好,而主成分分析對主成分所代表的經(jīng)濟含義的解釋能力相對較低,所以從權(quán)重解釋力的角度,因子分析評價更容易進(jìn)行權(quán)重合理性檢驗,而主成分分析相對弱一些。
1.5 主成分分析與因子分析檢驗對比
2 研究數(shù)據(jù)
為了對比主成分分析與因子分析的檢驗,本文以JCR 2015經(jīng)濟學(xué)期刊為例進(jìn)行研究。JCR 2015經(jīng)濟學(xué)期刊共有333種,2015版JCR公布的評價指標(biāo)共有11個,包括:總被引頻次、影響因子、他引影響因子、5年影響因子、即年指標(biāo)、特征因子分值、論文影響分值、標(biāo)準(zhǔn)化特征因子、被引半衰期、引用半衰期、影響因子百分位。由于存在數(shù)據(jù)缺失,需要進(jìn)行清洗,經(jīng)處理后還有278種期刊。另外被引半率期和引用半率期是反向指標(biāo),在標(biāo)準(zhǔn)化時必須進(jìn)行正向處理。
3 實證結(jié)果
3.1 評價前檢驗
3.1.1 KMO檢驗與Bartlett檢驗
主成分分析與因子分析在評價前均必須進(jìn)行KMO檢驗和Bartlett檢驗,而且兩者的檢驗結(jié)果相同。經(jīng)檢驗,KMO值為0.839,遠(yuǎn)遠(yuǎn)大于0.5的底線水平;Bartlett檢驗值為7 933.244,相伴概率為0.000,通過了統(tǒng)計檢驗,所以從KMO檢驗和Bartlett檢驗角度,JCR 2015經(jīng)濟學(xué)期刊評價可以采用主成分分析或因子分析。
3.1.2 指標(biāo)數(shù)據(jù)分布檢驗
主成分分析不需要評價指標(biāo)服從正態(tài)分布,因子分析需要評價指標(biāo)服從正態(tài)分布。從正態(tài)分布檢驗結(jié)果看,全部11個指標(biāo)均不服從正態(tài)分布,如表2所示。Price(1965)[26]最早發(fā)現(xiàn)引文網(wǎng)絡(luò)的入度和出度均服從冪律分布特征,并指出冪指數(shù)介于2.5~3.0之間。Redner(1998)[27]也發(fā)現(xiàn)了引文網(wǎng)絡(luò)的冪律分布規(guī)律,并指出出度冪指數(shù)為3.0。Seglen(1992)[28]發(fā)現(xiàn)引文指標(biāo)數(shù)據(jù)呈典型的偏態(tài)分布,并不服從正態(tài)分布。由于JCR 2015數(shù)據(jù)庫中,經(jīng)濟學(xué)期刊數(shù)量位居前三,對于期刊數(shù)量較少的學(xué)科而言,服從正態(tài)分布的機率更小。所以從數(shù)據(jù)分布看,JCR2015經(jīng)濟學(xué)期刊評價并不適合采用因子分析。
3.2 評價中檢驗
3.2.1 主成分分析評價的信息損失分析
采用主成分分析進(jìn)行評價共提取特征根大于1的兩個主成分,如表3所示,第一主成分方差貢獻(xiàn)率為58.39%,第二主成分的方差貢獻(xiàn)率為15.93%,累計方差貢獻(xiàn)率為74.32%,信息損失為25.68%,應(yīng)該說,這個比例還是比較高的,用主成分分析進(jìn)行評價要慎重。
3.2.2 因子分析評價的信息損失度分析
因子分析的信息損失包括兩部分,一是提取公共因子造成的信息損失;二是原始指標(biāo)的特殊因子信息損失。因子分析同樣提取特征根大于1的兩個公共因子,如表4所示,第一公共因子的方差貢獻(xiàn)率為56.96%,第二公共因子的方差貢獻(xiàn)率為17.37%,累計方差貢獻(xiàn)率為74.32%,因子分析第一部分的信息損失為25.68%,和主成分分析的信息損失一致。
因子分析評價的第二個信息損失是每個原始指標(biāo)提取公共因子后的特殊因子信息,如表5所示,每個指標(biāo)的信息損失可以用1減去共同度表示,不同指標(biāo)的信息損失程度是不一樣的,影響因子、他引影響因子的信息損失要小一些,只有9%左右,但是即年指標(biāo)的信息損失很大,為58%。
3.3 評價后檢驗
3.3.1 主成分分析與因子分析的解釋力與代表性檢驗
1)主成分分析的解釋力與代表性檢驗
主成分載荷矩陣如表6所示。第一主成分載荷較大的指標(biāo)包括總被引頻次、影響因子、他引影響因子、5年影響因子、特征因子、論文影響分值、標(biāo)準(zhǔn)特征因子、影響因子百分位,代表了期刊影響力指標(biāo);第二主成分載荷較大的指標(biāo)包括即年指標(biāo)、被引半衰期、引用半衰期,代表了期刊時效性指標(biāo)。第一主成分涉及8個指標(biāo),第二主成分涉及3個指標(biāo),總體上主成分分析的代表性較好。
2)因子分析的解釋力與代表性檢驗
因子旋轉(zhuǎn)矩陣如表7所示,其結(jié)果與主成分分析類似,雖然從理論上講,因子分析的解釋能力要大于主成分分析,但本例中,兩者均具有較好的解釋力。
從公共因子涉及指標(biāo)數(shù)量看,第一公共因子同樣涉及8個指標(biāo),第二公共因子涉及3個指標(biāo),代表性也較好。
3.3.2 主成分分析與因子分析的單調(diào)性檢驗
首先將主成分分析的評價結(jié)果作為因變量,兩個主成分作為自變量進(jìn)行嶺回歸,然后將因子分析的評價結(jié)果作為因變量,兩個公共因子作為自變量進(jìn)行嶺回歸,結(jié)果如表8所示。
從嶺回歸結(jié)果看,無論是主成分分析還是因子分析,所有的回歸系數(shù)均為正數(shù),回歸擬合優(yōu)度R2均較高,所以單調(diào)性檢驗結(jié)果良好。
3.3.3 主成分分析與因子分析的權(quán)重合理性檢驗
由于主成分分析與因子分析兩種評價方法中,第一主成分與第一公共因子的含義一致,第二主成分與第二公共因子的含義也一致,主成分分析中,第一主成分方差貢獻(xiàn)率大于第二主成分的方差貢獻(xiàn)率,因子分析中,第一公共因子的方差貢獻(xiàn)率也大于第二公共因子的方差貢獻(xiàn)率,因此無法從主成分或公共因子方差貢獻(xiàn)率(權(quán)重)角度比較兩種方法。
但是可以從模擬權(quán)重角度進(jìn)行主成分分析與因子分析的比較,單調(diào)性檢驗中采用嶺回歸得到的回歸系數(shù),本質(zhì)上就說明了不同指標(biāo)的重要性,將其標(biāo)準(zhǔn)化處理后就是權(quán)重。將主成分或公共因子涉及的指標(biāo)權(quán)重相加,就得到了各個主成分或公共因子的模擬權(quán)重,然后就可以進(jìn)行對比分析。
從主成分分析與因子分析模擬權(quán)重的比較看,主成分分析期刊影響力指標(biāo)的模擬權(quán)重為0.697,時效性指標(biāo)的模擬權(quán)重為0.307;因子分析期刊影響力指標(biāo)的模擬權(quán)重0.805,時效性指標(biāo)的權(quán)重為0.195。考慮到在經(jīng)濟學(xué)期刊評價中,影響力畢竟是比較重要的,因此采用因子分析更為合理,當(dāng)然,也可以根據(jù)評價目的來進(jìn)行選擇。
3.4 主成分分析與因子分析檢驗結(jié)果比較
根據(jù)實證研究的全部檢驗過程,結(jié)果總結(jié)如表10所示。主成分分析評價通過了KMO檢驗和Bartlett檢驗,不需要評價指標(biāo)服從正態(tài)分布,主成分的含義清晰,指標(biāo)單調(diào)性檢驗較好,但是信息損失高達(dá)25.68%,權(quán)重合理性也一般,因此并不適合采用該方法對經(jīng)濟學(xué)期刊進(jìn)行評價。因子分析通過了KMO檢驗和Bartlett檢驗,公共因子含義清晰,指標(biāo)單調(diào)性較好,但是評價指標(biāo)均不服從正態(tài)分布,除了公共因子信息損失較大外,每個指標(biāo)中也存在特殊因子損失,因此不適合采用該方法對經(jīng)濟學(xué)期刊進(jìn)行評價。
4 結(jié)論與討論
4.1 采用主成分分析與因子分析進(jìn)行科技評價必須方法適用性檢驗
本文建立了主成分分析與因子分析評價方法適用性的檢驗框架與檢驗體系,從評價前檢驗、評價中檢驗、評價后檢驗3個角度進(jìn)行檢驗。評價前檢驗包括KMO檢驗與Bartlett檢驗,對于因子分析,還需要進(jìn)行評價指標(biāo)的正態(tài)分布檢驗,如果有數(shù)個指標(biāo)不服從正態(tài)分布,就不能選用因子分析。評價中檢驗主要是信息損失檢驗,由于指標(biāo)信息損失對評價結(jié)果影響較大,要求累計方差貢獻(xiàn)率不宜低于85%;對于因子分析,由于還存在指標(biāo)特殊因子信息損失,累計方差貢獻(xiàn)率應(yīng)該更高一些。評價后檢驗主要包括主成分或公共因子的解釋力檢驗、涉及指標(biāo)數(shù)量檢驗(不宜低于2個)、指標(biāo)單調(diào)性檢驗和權(quán)重合理性檢驗。
4.2 因子分析在信息損失較大時一般不適用于科技評價
由于因子分析的信息損失往往較大,既包括遺棄特征根小于1的公共因子信息損失,還包括遺棄指標(biāo)特殊因子的信息損失,因此在檢驗中,如果累計方差貢獻(xiàn)率低于90%就要慎重選用。在實際評價中,累計方法貢獻(xiàn)率達(dá)到90%的情況并不多。此外,因子分析還需要評價指標(biāo)服從正態(tài)分布,這也是一個比較重要的硬性條件,至少在學(xué)術(shù)期刊評價中,評價指標(biāo)服從正態(tài)分布的情況比較罕見,所以在科技評價中因子分析要慎重選用。
4.3 主成分分析并不適合評價對象較多的情況
由于主成分分析也存在信息損失,這在評價對象較多,區(qū)分度較低的情況下,信息損失會嚴(yán)重影響評價結(jié)果的排序,會導(dǎo)致評價方法選取不當(dāng)而產(chǎn)生的不公平。當(dāng)評價對象較少時,即使存在信息損失,但是由于區(qū)分度較大,對評價結(jié)果排序的影響也不大,所以主成分分析適合較少評價對象的科技評價。
參考文獻(xiàn)
[1]譚開明,魏世紅.基于主成分分析的西部地區(qū)創(chuàng)新能力評價研究[J].西安財經(jīng)學(xué)院學(xué)報,2013,(1):73-77.
[2]楊武,解時宇,宋盼.基于主成分分析的中國科技創(chuàng)新景氣指數(shù)研究[J].中國科技論壇,2014,(12):18-22.
[3]史曉燕,張優(yōu)智.基于主成分分析法的科技進(jìn)步測評實證研究[J].科技進(jìn)步與對策,2009,(22):147-151.
[4]徐頑強,孫正翠,周麗娟.基于主成分分析法的科技服務(wù)業(yè)集聚化發(fā)展影響因子研究[J].科技進(jìn)步與對策,2016,(1):59-63.
[5]李敬鎖,趙芝俊.國家科技支撐計劃農(nóng)業(yè)領(lǐng)域項目績效的影響因素分析[J].科技管理研究,2015,(20):28-31.
[6]吳巖.基于主成分分析法的科技型中小企業(yè)技術(shù)創(chuàng)新能力的影響因素研究[J].科技管理研究,2013,(14):108-112.
[7]韓曉明,王金國,石照耀.基于主成分分析和熵值法的高??萍紕?chuàng)新能力評價[J].河海大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2015,(2):83-88.
[8]辛督強.基于主成分分析的13種力學(xué)類中文期刊綜合評價[J]。 中國科技期刊研究,2012,(2):224-227.
[9]何先剛,馬躍,鮮思東.基于主成分分析的網(wǎng)絡(luò)電子期刊模糊綜合評價[J].重慶郵電大學(xué)學(xué)報:自然科學(xué)版,2014,(6):861-865.
[10]顧雪松,遲國泰,程鶴.基于聚類一因子分析的科技評價指標(biāo)體系構(gòu)建[J].科學(xué)學(xué)研究,2010,(4):508-516.
[11]李子倫.產(chǎn)業(yè)結(jié)構(gòu)升級含義及指數(shù)構(gòu)建研究——基于因子分析法的國際比較[J]當(dāng)代經(jīng)濟科學(xué),2014,(1):89-98.
[12]董曄璐.基于因子分析的我國高??萍紕?chuàng)新能力評價[J].科學(xué)管理研究,2015,(6):32-34.
[13]黃斌,汪長柳,馬麗.基于因子分析的江蘇省科技服務(wù)業(yè)競爭力綜合評價[J].科技管理研究,2013,(22):59-62.
[14]翁媛媛,高汝熹.科技創(chuàng)新環(huán)境的評價指標(biāo)體系研究——基于上海市創(chuàng)新環(huán)境的因子分析[J].中國科技論壇,2009,(2):31-35.
[15]鄭麗霞.因子分析在SCI期刊綜合評價中的應(yīng)用[J].農(nóng)業(yè)圖書情報學(xué)刊,2016,(7):53-56.
[16]柴玉婷,溫學(xué)兵.師范大學(xué)理科學(xué)報學(xué)術(shù)影響力評價研究[J].渤海大學(xué)學(xué)報:自然科學(xué)版,2016,(1):24-29,34.
[17]何莉,董梅生,丁吉海,等.安徽省高校自然科學(xué)學(xué)報學(xué)術(shù)影響力綜合評價分析——基于因子分析法[J].中國科技期刊研究,2014,(3):427-431.
[18]Edward Jackson J.A Users Guide To Principal Components[M]. Newyork:A Wiley Inter Science Publication,1992.
[19]俞立平,潘云濤,武夷山.學(xué)術(shù)期刊評價中主成分分析法應(yīng)用悖論研究[J].情報理論與實踐,2009,(9):84-87.
[20]樓文高,吳雷鳴.科技期刊質(zhì)量綜合評價的主成分分析法及其改進(jìn)[J].統(tǒng)計教育,2010,(5):57-62.
[21]MacCallum R C,Widaman K F,Zhang S,Hong S.Sample Size in Factor Analysis[J].Psycholical Methods,1999,4(1):84-99.
[22]Fabrigar L R,Wegener D T,MacCallum R C,Strahan E J.Evaluating the Use of Exploratory Factor Analysis in Psychological Research[J].Psychological Methods,1999,4(3):272-299.
[23]傅德印.因子分析統(tǒng)計檢驗體系的探討[J].統(tǒng)計研究,2007,(6):86-90.
[24]俞立平,劉愛軍.主成分分析與因子分析在期刊評價中的改進(jìn)研究[J].情報雜志,2014,(12):94-98.
[25]俞立平,潘云濤,武夷山.科技評價中不同客觀評價方法權(quán)重的比較研究[J].科技管理研究,2009,(7):148-150.
[26]Price D J S.Networks of Scientific Papers[J].Science,1965,149(368):510-515.
[27]Redner S.How Popular is your Paper an Empirical Study of the Citation Distribution[J].Eur Phys.J.B 4,1998:131-134.
[28]Seglen P O.The Skewness of Science[J].Journal of the American Society for Information Science,1992,43(9):628-638.
(責(zé)任編輯:郭沫含)