■劉雪立 任勝利 程維紅 鄭成銘
1) 新鄉(xiāng)醫(yī)學(xué)院期刊社,河南省科技期刊研究中心,河南省新鄉(xiāng)市金穗大道601號 4530032) 國家自然科學(xué)基金委員會科學(xué)基金雜志社,北京市海淀區(qū)雙清路83號 1000853) 中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所《作物學(xué)報》編輯部,北京市中關(guān)村南大街12號 100081
2004年11月,全球著名的Elsevier出版集團(tuán)在全文數(shù)據(jù)庫的基礎(chǔ)上,推出了Scopus引文數(shù)據(jù)庫[1]。該數(shù)據(jù)庫迅速崛起,成為全球最大的引文數(shù)據(jù)庫[2],打破了Web of Science(WoS)在引文數(shù)據(jù)庫建設(shè)領(lǐng)域的壟斷地位。近年來,關(guān)于Scopus數(shù)據(jù)庫的研究[3-5]和以Scopus數(shù)據(jù)庫為數(shù)據(jù)來源的文獻(xiàn)計量學(xué)[6-8]、科學(xué)計量學(xué)研究[9-10]越來越普遍。2016年12月8日,Elsevier依托Journal Metrics(JM)平臺公布了衡量期刊影響力的重要指標(biāo)CiteScore(CS),涵蓋期刊數(shù)量為22256種,是《期刊引證報告》(JCR)中有影響因子期刊的2倍[11],受到學(xué)術(shù)界的廣泛關(guān)注,部分雜志已經(jīng)開始撰文報告其CS[12]。JCR的核心指標(biāo)是期刊影響因子(IF)[13],然而Scopus數(shù)據(jù)庫的核心指標(biāo)是CS。CS定義為:某期刊前3年發(fā)表文獻(xiàn)在統(tǒng)計當(dāng)年的被引用次數(shù)除以該刊前3年發(fā)表的文獻(xiàn)數(shù)[14],CS的計算見圖1:
(1)
式中y為統(tǒng)計當(dāng)年,Cy-1為某期刊y-1年的文獻(xiàn)在y年的被引頻次,Cy-2、Cy-3以此類推;Dy-1為某期刊在第y-1年的所有文獻(xiàn)數(shù)量,Dy-2、Dy-3以此類推。
CS和IF為同類指標(biāo),都是某期刊一定引證時間窗口內(nèi)論文的篇均被引頻次。二者的主要區(qū)別有3個方面[11]:(1)引證數(shù)據(jù)來源不同,計算IF所用的被引頻次來源于WoS,而計算CS所用被引頻次來源于Scopus;(2)引證時間窗口不同,IF的引證時間窗口為2年[15],而CS為3年;(3)IF和CS的計算公式中分子和分母所包含的文獻(xiàn)類型不同,IF分子為期刊所有類型文獻(xiàn)被引頻次,分母僅包含可被引文獻(xiàn),即論文和綜述[16-17],而CS分母為期刊所有類型文獻(xiàn)。
圖1 CS計算示意圖
因為CS發(fā)布的時間較短,WoS和中國知網(wǎng)(CNKI)數(shù)據(jù)庫尚未檢索到相關(guān)研究。本研究全方位比較了不同學(xué)科期刊的CS和IF,探討CS的文獻(xiàn)計量學(xué)特征以及在期刊評價中的作用。
(1) 學(xué)科選擇
依據(jù)JCR數(shù)據(jù)庫中的學(xué)科分類,選取自然科學(xué)和社會科學(xué)各4個學(xué)科,選擇標(biāo)準(zhǔn)包括:第一,集合半衰期差異明顯;第二,學(xué)科規(guī)模較大,期刊數(shù)量較多,最終確定的4個自然科學(xué)學(xué)科為納米與納米技術(shù)、能源與燃料、統(tǒng)計與概率論、地球化學(xué)與地球物理學(xué),4個社會科學(xué)學(xué)科為倫理學(xué)、傳播學(xué)、政治學(xué)、歷史學(xué)。此外,本研究還選取了2個特殊學(xué)科,即發(fā)表非可被引文獻(xiàn)(觀點(diǎn)、消息、動態(tài)等文章)較多的學(xué)科,主要包括醫(yī)學(xué)(以綜合性醫(yī)學(xué)為代表)和多學(xué)科。
(2) 期刊選擇
期刊選擇的標(biāo)準(zhǔn)包括:第一,JCR和JM均收錄期刊,保證期刊既有IF又有CS;第二,JCR數(shù)據(jù)庫中期刊自引率小于10%。
(1) 獲取IF和CS
從JCR下載2015年選定學(xué)科期刊的IF,從JM下載所有期刊的CS,并整理成電子表格;剔除JCR數(shù)據(jù)庫中自引率大于10%的期刊,將各期刊國際標(biāo)準(zhǔn)連續(xù)出版物編號(ISSN)在整理的JM電子表格中進(jìn)行比對,獲取相應(yīng)期刊的CS。
(2) 數(shù)據(jù)處理
采用Excel 2003進(jìn)行一般的數(shù)據(jù)運(yùn)算和處理,采用SPSS18進(jìn)行統(tǒng)計學(xué)處理。采用非參數(shù)檢驗中的2個相關(guān)樣本秩檢驗(Wilcoxon檢驗)比較各學(xué)科期刊的CS與IF,采用Spearman等級相關(guān)檢驗確定二者相關(guān)度。檢驗水準(zhǔn)α=0.05。
納入研究對象的8個學(xué)科期刊總數(shù)為380種,CS和IF的平均值分別為2.080和1.894,標(biāo)準(zhǔn)差分別為3.003和3.217;最大值分別為23.85和35.27,中位數(shù)分別為1.200和1.066。這些數(shù)據(jù)表明,IF離散程度較大。Wilcoxon檢驗結(jié)果表明274種期刊的CS大于IF,104種期刊的CS小于IF,2種期刊的CS等于IF,Z=8.821,P=0.000,說明380種期刊總體上CS大于IF,差異有統(tǒng)計學(xué)意義。Spearman相關(guān)檢驗結(jié)果中,相關(guān)系數(shù)r=0.922,P=0.000,二者呈現(xiàn)高度正相關(guān)。
選取的4個自然科學(xué)學(xué)科中,納米與納米技術(shù)、能源與燃料2個學(xué)科集合被引半衰期較短,屬于老化速度較快的學(xué)科;統(tǒng)計與概率論、地球化學(xué)與地球物理學(xué)2個學(xué)科集合被引半衰期均大于10年,屬于老化速度較慢的學(xué)科。社會科學(xué)學(xué)科集合被引半衰期普遍較長,倫理學(xué)集合被引半衰期相對較短,在社會科學(xué)中屬于老化較快的學(xué)科,歷史學(xué)科老化速度較慢。
各學(xué)科期刊CS中位數(shù)均大于IF,Wilcoxon檢驗結(jié)果顯示,8個學(xué)科中均為CS大于IF的期刊居多,總體趨勢為學(xué)科老化速度越慢,CS大于IF表現(xiàn)越突出,比如統(tǒng)計學(xué)與概率、傳播學(xué)、政治學(xué)、歷史學(xué),CS和IF的差異有統(tǒng)計學(xué)意義(表1)。8個學(xué)科中CS和IF均表現(xiàn)為高度正相關(guān),納米與納米技術(shù)相關(guān)系數(shù)最高,達(dá)到了0.982,倫理學(xué)相關(guān)系數(shù)最低,但是也達(dá)到了0.767。因此,無論CS和IF絕對值大小,二者用于評價期刊影響力呈現(xiàn)高度一致性。
由于CS采用3年引證時間窗口,多數(shù)期刊被引頻次在更長的時間窗口內(nèi)得到充分釋放,因此多數(shù)期刊CS大于IF,尤其是被引高峰較為緩慢的學(xué)科表現(xiàn)更加明顯,而被引高峰較為緩慢的學(xué)科稱為長半衰期學(xué)科[18-19],即老化速度較慢的學(xué)科。與IF相比,CS更加有利于評價較長半衰期的學(xué)科期刊。
筆者研究了科學(xué)引文索引(SCI)來源期刊非可被引文獻(xiàn)對IF的貢獻(xiàn),結(jié)果顯示,發(fā)表非可被引文獻(xiàn)較多的,且非可被引文獻(xiàn)對IF貢獻(xiàn)較大的期刊多集中于多學(xué)科和醫(yī)學(xué)學(xué)科[16]。由于非可被引文獻(xiàn)在計算IF時不計入分母,導(dǎo)致IF不同程度膨脹。所以,這2個學(xué)科多數(shù)期刊表現(xiàn)為CS小于IF(表2)。
表1 8個學(xué)科期刊CS與IF的比較
表2 多學(xué)科和綜合性醫(yī)學(xué)期刊CS和IF的比較
WoS和JCR學(xué)科分類中的多學(xué)科期刊是指涵蓋所有學(xué)科(也包括社會科學(xué))內(nèi)容的高度綜合性期刊,這些期刊往往被SCI和SSCI同時收錄。進(jìn)一步研究多學(xué)科和綜合性醫(yī)學(xué)期刊發(fā)現(xiàn),在多學(xué)科領(lǐng)域,7種期刊的IF是CS的2倍以上,其中Scientist的IF比CS大17倍以上,Nature和Science這2種國際權(quán)威期刊的IF比CS大1.6倍。在綜合醫(yī)學(xué)學(xué)科,IF是CS 2倍以上的期刊共13種,多數(shù)為全球著名的醫(yī)學(xué)期刊,《加拿大醫(yī)學(xué)會雜志》(CMAJ)、《柳葉刀》(Lancet)、《美國醫(yī)學(xué)會雜志》(JAMA)和《新英格蘭雜志》(NEJM)4種醫(yī)學(xué)期刊分列前4位,見表3。這些期刊都是發(fā)表非可被引文獻(xiàn)較多的期刊。值得注意的是,多學(xué)科和綜合性醫(yī)學(xué)期刊中,IF過度膨脹的期刊絕大多數(shù)來自美國和英國。其實(shí),早在1999年,著名科學(xué)計量學(xué)家Moed等[20]已經(jīng)研究了Nature、Science和Lancet等期刊IF的膨脹問題。Liu等[21]提出應(yīng)當(dāng)矯正醫(yī)學(xué)期刊和多學(xué)科期刊IF的分子和分母,將IF的分子設(shè)定為可被引文獻(xiàn)(研究論文和綜述)在統(tǒng)計當(dāng)年的被引頻次,分母為可被引文獻(xiàn)數(shù)量。
表3 多學(xué)科和綜合性醫(yī)學(xué)中CS和IF差異較大的期刊
注:差異幅度為2015年IF與CS的差值除以2015年的CS。
不區(qū)分學(xué)科的情況下,380種期刊整體的CS和IF的相關(guān)系數(shù)為0.922;區(qū)分學(xué)科的情況下,分別分析8個學(xué)科期刊的CS和IF,相關(guān)系數(shù)多數(shù)大于0.900。由于CS和IF分母計數(shù)不同,多學(xué)科和綜合性醫(yī)學(xué)多數(shù)期刊的IF大于CS,但是二者的相關(guān)系數(shù)依然達(dá)到了0.871。因此,無論CS和IF絕對值高低,二者在期刊影響力評價和排序方面呈現(xiàn)極高的相關(guān)度。
盡管CS和IF所用引證時間窗口不同,同一期刊CS和IF差異明顯,但是由于二者屬性相同,均為某期刊一定時間段內(nèi)論文在統(tǒng)計年度的篇均被引頻次,因此,CS和IF在期刊影響力評價和排序的高度相關(guān)是正?,F(xiàn)象。
在選取的8個學(xué)科中,大多數(shù)期刊均表現(xiàn)為CS大于IF,長半衰期學(xué)科尤其突出,如社會科學(xué)中的傳播學(xué)、政治學(xué)和歷史學(xué),自然科學(xué)中的統(tǒng)計與概率論,以上學(xué)科集合被引半衰期均大于10年。94種期刊中CS大于IF的期刊共65種,CS小于IF的期刊僅27種,另外2種期刊CS與IF相等。由于CS采用3年引證時間窗口,論文被引頻次在較長的時間段內(nèi)得到充分釋放,因此,CS非常適合于評價老化速度較慢的學(xué)科,尤其是多數(shù)社會科學(xué)學(xué)科期刊。
多學(xué)科期刊和綜合性醫(yī)學(xué)(不排除還有個別學(xué)科)期刊多數(shù)表現(xiàn)為IF大于CS,個別期刊,如著名的綜合性期刊Science、Nature,綜合性醫(yī)學(xué)期刊CanadianMedicalAssociationJournal、Lancet、JournaloftheAmericanMedicalAssociation、NewEnglandJournalofMedicine等CS和IF差異極為顯著。差異的主要原因是,CS的計算公式中分母采用的是各期刊發(fā)表的所有類型的文獻(xiàn)數(shù),而IF的分母僅為研究論文和綜述2類可被引文獻(xiàn)數(shù)。
總之,CS和IF是基于2個不同的數(shù)據(jù)庫建立的相同屬性的期刊影響力評價指標(biāo),二者存在明顯差異,主要原因是數(shù)據(jù)來源、引證時間窗口不同,文獻(xiàn)類型基數(shù)不統(tǒng)一等。由于CS發(fā)布時間太短,對其認(rèn)識還不夠深入,本研究還存在一定的局限性,如對Scopus和WoS數(shù)據(jù)庫以及基于二者建立的CS和IF兩個指標(biāo)中的文獻(xiàn)類型的認(rèn)識還遠(yuǎn)遠(yuǎn)不夠,有待于今后進(jìn)一步研究。
[1] de Moya-Anegon F,Chinchilla-Rodriguez Z,Vargas-Quesada B,etal. Coverage analysis of Scopus: A journal metric approach[J].Scientometrics,2007,73(1):53-78.
[2] Andalia R C,Labrada R R,Castells M M. Scopus: The largest database of peer-reviewed scientific literature available to underdeveloped countries[J].RevistaCubanadeACIMED,2010,21(3):270-282.
[3] Vendemiale G. Indexed in Embase,excerpta medica database and Scopus Elsevier database[J].GiornalediGerontologia,2016,64(1):1.
[4] Moed H F,Bar-Ilan J,Halevi G. A new methodology for comparing Google scholar and Scopus[J].JournalofInformetrics,2016,10(2):533-551.
[5] Noblejas C J,Rodríguez A P. Information retrieval and visualization in Web of Science and Scopus: A practical approach[J].InvestigaciónBibliotecológica,2014,28:15-31.
[6] Sánchez A D,Del Río M C,García J. Bibliometric analysis of publications on wine tourism in the databases Scopus and WoS[J].EuropeanResearchonManagementandBusinessEconomics,2017,23(1):8-15.
[7] Muthumari S,Raja S. Bibliometric analysis of defence science journal during 2005—2014: A study based on Scopus database[J].CollnetJournalofScientometricsandInformationManagement,2016,10(2):273-287.
[8] Moed H F. Comprehensive indicator comparisons intelligible to non-experts: The case of two SNIP versions[J].Scientometrics,2016,106(1):51-65.
[9] Dissanayake H N K. Medicinal plant research in Sri Lanka : A scientometric study based on Scopus database[J].CollnetJournalofScientometricsandInformationManagement,2015,9(2):225-234.
[10] Cruz-Ramirez M,Escalona-Reyes M,Cabrera-Garcia S,etal. Scientometric analysis of Cuban educational publications in WoS and Scopus (2003—2012)[J].RevistaEspanoladeDocumentacionCientifica,2014;37(3):e058.
[11] da Silva J A T,Memon A R. CiteScore: A cite for sore eyes,or a valuable,transparent metric?[J].Scientometrics,2017,111(1):553-556.
[12] Poljak M. Coverage of acta dermatovenerologica Alpina,pannonica et Adriatica in Elsevier′s CiteScore index: A new tool for measuring the citation impact of academic journals[J].ActaDermatovenerologicaAlpinaPannonicaetAdriatica,2017,26(1):1-2.
[13] Garfield E. No-growth libraries and citation analysis; or publishing weeds with ISI′s journal citation reports[J].CurrentContents,1975,2(26):300-303.
[14] Elseview. Journal Metrics[EB/OL]. [2017-05-06]. https:∥journalmetrics.scopus.com.
[15] 劉雪立,蓋雙雙,張詩樂,等. 不同引證時間窗口影響因子的比較研究——以SCI數(shù)據(jù)庫眼科學(xué)期刊為例[J]. 中國科技期刊研究,2014,25(12):1509-1512.
[16] 劉雪立,蓋雙雙,張詩樂,等. “非可被引文獻(xiàn)”的引證特征及其對科技期刊影響因子的貢獻(xiàn)[J]. 編輯學(xué)報,2015,27(5):495-499.
[17] 劉雪立,蓋雙雙,周晶. 基于文獻(xiàn)類型矯正的影響因子及其實(shí)證研究[J]. 中國科技期刊研究,2016,27(3):309-315.
[18] Sundaram M,Hodler J,Rosenthal D I. On the relevance of the impact factor and other factors[J].Skeletalradiology,2012,41(2):125-126.
[19] Haddad F S. The impact factor: Yesterday′s metric?[J].Bone&JointJournal,2014,96B(3):289-290.
[20] Moed H F,van Leeuwen T N,Reedijk J. Towards appropriate indicators of journal impact[J].Scientometrics,1999,46(3):575-589.
[21] Liu X L,Gai S S,Zhou J. Journal impact factor: Do the numerator and denominator need correction?[J].PLoSOne,2016,11(3): e0151414.