溫學(xué)兵, 劉 洋, 柴玉婷(1. 沈陽師范大學(xué) 學(xué)報編輯部, 沈陽 11004; . 沈陽師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽 11004;. 中國石化銷售有限公司 黑龍江石油分公司, 哈爾濱 150000)
對科技期刊的學(xué)術(shù)影響力進(jìn)行定量評價,無論對于期刊本身還是學(xué)者來說都是十分有意義的。期刊質(zhì)量的提升需要對學(xué)術(shù)期刊進(jìn)行客觀合理的評價,在評價的過程中還可以對發(fā)行服務(wù)質(zhì)量和編輯出版過程進(jìn)行系統(tǒng)檢查,從而使各類期刊互相學(xué)習(xí),取長補短,以期達(dá)到不斷提高期刊質(zhì)量的目的[1]。目前學(xué)術(shù)期刊的定量評價分為2種,一種是單一指標(biāo)評價[2-4],另一種是多指標(biāo)綜合評價[5],前者因指標(biāo)單一顯然不能全面地評價學(xué)術(shù)期刊的影響力,因此學(xué)界更喜歡綜合評價的多指標(biāo)體系[6]??萍荚u價往往是復(fù)雜的過程,學(xué)術(shù)期刊指標(biāo)間存在相關(guān)關(guān)系的影響, 如總被引頻次、影響因子、即年指標(biāo)這3個指標(biāo)明顯存在相關(guān)關(guān)系, 導(dǎo)致評價時重復(fù)計算,影響評價精度和效果[7]。此外,各指標(biāo)的權(quán)重如何避免人為因素帶來的偏差,從而客觀地確定也是大家關(guān)心的問題。這些對評價的準(zhǔn)確和公正性都是至關(guān)重要的[8]。
主成分分析法作為多元統(tǒng)計分析的一種,又被稱為主分量分析[9],其基本思想的核心就是降維,將存在一定相關(guān)關(guān)系的原始數(shù)據(jù)重新組合成新變量(即主成分)。具體來說,就是對p個相關(guān)指標(biāo)變量作線性變換,將其轉(zhuǎn)換成另一組不相關(guān)的變量Zi。然后根據(jù)線性組合后的各綜合指標(biāo)的方差大小,按照從大到小的順序來確定第一主成分、第二主成分、第三主成分……。以此類推。VAR(Zi)越大,表示Zi所包含的信息就越多,且各主成分間不相關(guān),信息不再重疊,即COV(Zi,Zj)=0。基于此,在實際應(yīng)用中,按照需要可選取前幾個較大主成分作代表,來反映原來指標(biāo)的信息。這種做法盡管可能會造成少量的信息損失,但抓住了問題的主要矛盾,并從原始指標(biāo)數(shù)據(jù)中提取了一些新的信息,所帶來的好處遠(yuǎn)遠(yuǎn)大于損失。這種抓住問題重點又降低變量維數(shù)的方式對問題的分析和處理有很大幫助[10-11]。
在主成分分析中,為了消除數(shù)量級和量綱的影響,通常會將原始數(shù)據(jù)標(biāo)準(zhǔn)化處理。本文采用的數(shù)據(jù)存在量綱影響,故將數(shù)據(jù)標(biāo)準(zhǔn)化為均值為0,方差為1的無量綱數(shù)據(jù)。即設(shè)有n個樣本,p個指標(biāo),
可得標(biāo)準(zhǔn)化后的樣本矩陣為
Z=(Zij)n×p=(ZX1,…,ZXP)
考慮到量綱的影響,將數(shù)據(jù)標(biāo)準(zhǔn)化后,利用相關(guān)系數(shù)矩陣求解主成分
而m個特征根對應(yīng)的單位特征向量為
Fi=d1iZ1+d2iZ2+…+dpiZp,i=1,2,…,m
以每個主成分的方差貢獻(xiàn)率為權(quán)重,求出第j個樣本的綜合評價值
本文以2014版北大核心期刊中的17個數(shù)學(xué)類中文期刊作為研究對象[12],依托2010、2011、2012版中國期刊引證報告(擴(kuò)刊版)數(shù)據(jù)[12-15],并在這些期刊的評價指標(biāo)中初步選取了10個較具有代表性的指標(biāo)數(shù)據(jù)進(jìn)行分析,2010版原始數(shù)據(jù)見表1。
表1 2010版CSTPCD中17個數(shù)學(xué)期刊的10個指標(biāo)數(shù)據(jù)Tab.1 10 kinds of data of 17 Math journals inCSTPCD(2010)
“KMO and Bartlett's Test”中顯示KMO值為0.626,大于0.5;Bartlett值為283.231,P<0.000,檢驗結(jié)果說明樣本的選取足夠充分,且具備了主成分分析的全部條件。利用Matlab對其進(jìn)行主成分分析,結(jié)果見表2~表4。
表2 樣本相關(guān)系數(shù)矩陣Tab.2 Correlation coefficient matrix
表3 相關(guān)矩陣的特征值及貢獻(xiàn)率Tab.3 Eigenvalues and contribution rate of correlation matrix
表4 特征值對應(yīng)的特征向量Tab.4 Corresponding eigenvectors to eigenvalues
表中前4個主成分的累計方差貢獻(xiàn)率已達(dá)到90%以上,所以選取4.683,2.161,1.398,0.793這4個變量來代替原來的10個變量。各特征向量對應(yīng)的主成分的表達(dá)式為
綜合主成分表達(dá)式為
Z=0.468 35×Z1+0.216 12×Z2+0.139 82×Z3+0.079 31×Z4
排名結(jié)果見表5。
表5 利用2010版CSTPCD 數(shù)據(jù)的17個數(shù)學(xué)期刊綜合排名Tab.5 PCA analysis ranking results of 17 math journals by CSTPCD(2010)
2011、2012版中國期刊引證報告(擴(kuò)刊版)中的17種數(shù)學(xué)類中文期刊原始數(shù)據(jù)對應(yīng)的主成分分析結(jié)果見表6和表7。
表6 利用2011版CSTPCD 數(shù)據(jù)的17個數(shù)學(xué)期刊綜合排名Tab.6 PCA analysis ranking results of 17 math journals by CSTPCD(2011)
表7 利用2012版CSTPCD 數(shù)據(jù)的17個數(shù)學(xué)期刊綜合排名Tab.7 PCA analysis ranking results of 17 math journals by CSTPCD(2012)
由表3可以看出: 第一主成分在總被引頻次、影響因子、即年指標(biāo)、引用刊數(shù)、權(quán)威因子這幾個評價指標(biāo)上有較高正載荷, 說明第一主成分主要反映期刊被引情況及受重視程度等影響力方面的信息; 第二主成分在他引率、平均引文數(shù)、基金論文比這3個評價指標(biāo)上有較高正載荷, 說明第二主成分主要反映排除期刊自引后的引用情況以及期刊自身學(xué)術(shù)能力和編輯狀況等方面的信息; 第三主成分在擴(kuò)散因子這一指標(biāo)上有較高正載荷, 說明其反映了期刊影響力方面的信息。 這3個主成分基本涵蓋了所有原始指標(biāo)所反映的信息,并且第一主成分中, 核心他引率的負(fù)載荷較大, 可避免期刊自引情況, 消除干擾, 使其他影響力方面的指標(biāo)評價更加真實, 同時也證明了主成分分析多指標(biāo)綜合評價的合理性。
從表5的排名結(jié)果可以看出,數(shù)學(xué)的實踐與認(rèn)識在總被引頻次、來源文獻(xiàn)量、引用期刊數(shù)這幾個指標(biāo)上都遠(yuǎn)高于其他期刊,除影響因子外,其他指標(biāo)都不低,綜合得分高于其他期刊,理應(yīng)排名第一;運籌學(xué)學(xué)報在總被引頻次、影響因子、來源文獻(xiàn)量、平均引文數(shù)、學(xué)科擴(kuò)散指標(biāo)、H指標(biāo)這6項指標(biāo)上都處于最后一名或后幾名,理應(yīng)排在最后,也說明單純影響因子的排名不太合理。
與2014版北大中文核心期刊中的數(shù)學(xué)類排名相比較,數(shù)學(xué)的實踐與認(rèn)識在主成分分析的排名中位列第1位,而在北大核心排名中位列第12,差別較大,一方面說明定量評價與更多看重海量專家同行評議意見的定性評價還是有偏差的,另一方面可能也源于采用的數(shù)據(jù)庫不同;而在多數(shù)期刊的排名上,這2種方法的差別不大也說明了基于主成分分析方法還是可取的。
本文依托中國科技期刊引證報告(擴(kuò)刊版)數(shù)據(jù)庫,采用2010—2012版的10個計量指標(biāo)數(shù)據(jù),基于主成分分析方法,對2014版北大中文核心期刊中的17種數(shù)學(xué)類期刊進(jìn)行了分析和排名,排名結(jié)果證明了方法的有效性,選取數(shù)據(jù)的合理性,期望對于數(shù)學(xué)期刊的發(fā)展和綜合質(zhì)量的提高能起到一點幫助。
[ 1 ]龐景安,張玉華,馬崢. 中國科技期刊綜合評價指標(biāo)體系的研究[J]. 中國科技期刊究, 2000,9(4):217-219.
[ 2 ]GARFIELD E. Citation analysis as a tool in journal evaluation: Journals can be ranked by frequency and impact of citations for science policy studies[J]. Science, 1972,178:471-479.
[ 3 ]MOED H F. Measuring contextual citation impact of scientific journals[J]. Journal of Informetrics, 2010,4(3):265-277.
[ 4 ]SCImago Research Group. SCImago Journal & Country Rank[EB/OL]. [2015-11-18]. http:∥www. scimagojr.com/index.php.
[ 5 ]YUE Weiping,WILSON C S. Measuring the citation impact of research journals in clinical neurology: a structural equation modeling analysis[J]. Scientometrics, 2004,60(3):317-334.
[ 6 ]柴玉婷. 中文科技期刊學(xué)術(shù)影響力定量評價研究[D]. 沈陽:沈陽師范大學(xué), 2016.
[ 7 ]張弘,趙惠祥,劉燕萍,等. 基于主成分分析法的科技期刊評價方法[J]. 編輯學(xué)報, 2008,20(1):87-90.
[ 8 ]溫學(xué)兵,劉洋. 結(jié)構(gòu)方程模型在科技期刊量化指標(biāo)研究中的應(yīng)用[J]. 沈陽師范大學(xué)學(xué)報(自然科學(xué)版), 2017,35(3):319-325.
[ 9 ]王引斌. 測定核心期刊的新方法----主成分分析法[J]. 情報學(xué)報, 1998,17(5):77-80.
[10]陳漢忠. 主成分分析在科技期刊評價中的應(yīng)用[C]∥中國科技期刊青年編輯學(xué)術(shù)研討會, 2004:658-660.
[11]俞立平,潘云濤,武夷山. 科技評價中不同客觀評價方法權(quán)重的比較研究[J]. 科技管理研究, 2009,29(7):148-150.
[12]北京大學(xué)圖書館,北京高校圖書館期刊工作研究會. 中文核心期刊要目總覽[M]. 7版. 北京:北京大學(xué)出版社, 2015.
[13]中國科學(xué)技術(shù)信息研究所. 2010年版中國科技期刊引證報告(擴(kuò)刊版)[M]. 北京:科學(xué)技術(shù)文獻(xiàn)出版社, 2010.
[14]中國科學(xué)技術(shù)信息研究所. 2011年版中國科技期刊引證報告(擴(kuò)刊版)[M]. 北京:科學(xué)技術(shù)文獻(xiàn)出版社, 2011.
[15]中國科學(xué)技術(shù)信息研究所. 2012年版中國科技期刊引證報告(擴(kuò)刊版)[M]. 北京:科學(xué)技術(shù)文獻(xiàn)出版社, 2012.