■丁佐奇
中國藥科大學(xué)《中國天然藥物》編輯部,江蘇省南京市童家巷24號 210009
科學(xué)計量指標可以客觀反映期刊論文的質(zhì)量和影響,是期刊評價和科研管理工作的重要工具[1]。論文的被引頻次和下載量是用于論文評價的金指標,被引頻次是衡量學(xué)術(shù)質(zhì)量以及學(xué)術(shù)影響力的重要評價指標,下載量則可測度論文的可見度及傳播速率。因此,對論文及期刊進行評價,包括對核心期刊的確定,被引頻次與下載量同時作為文獻價值的表征而共同被納入到評價指標體系。被引頻次越高,學(xué)術(shù)影響力越大,Web即年下載率越高,說明讀者對期刊的興趣越大[2]。
近年來,國內(nèi)學(xué)者主要利用中國知網(wǎng)(CNKI)等引文數(shù)據(jù)庫對論文的被引頻次與下載量的相關(guān)性進行了研究。王麗[3]研究發(fā)現(xiàn)CNKI中醫(yī)藥衛(wèi)生科技類文獻的下載量與被引頻次之間沒有明顯的相關(guān)性,無規(guī)律可循。張小強[4]對CNKI、中國科學(xué)引文數(shù)據(jù)庫(CSCD)和中國人文社會科學(xué)引文數(shù)據(jù)庫(CHSSCD)來源期刊的下載量和被引頻次的相關(guān)性進行了研究,發(fā)現(xiàn)兩者之間具有高度正相關(guān)性。嚴美娟等[5]對CNKI中的6種兒科類期刊進行了研究,發(fā)現(xiàn)被引頻次與下載量相關(guān)性的高低和不同欄目論文內(nèi)容有關(guān)。國際上有不少學(xué)者利用各大國際數(shù)據(jù)庫對論文的下載量與被引頻次的相關(guān)性做了廣泛的研究。Nieder等[6]研究了5種腫瘤學(xué)領(lǐng)域的開放獲取(OA)期刊的情況,下載量數(shù)據(jù)來源于這些期刊的網(wǎng)站,被引頻次數(shù)據(jù)來源于Scopus數(shù)據(jù)庫,結(jié)果發(fā)現(xiàn)下載量和被引頻次的相關(guān)性較差。趙一權(quán)等[7]利用美國計算機協(xié)會數(shù)字圖書館數(shù)據(jù)庫研究了計算機領(lǐng)域的31種期刊,發(fā)現(xiàn)無論是在期刊層面,還是在文獻層面,下載量和被引頻次都具有較強的正相關(guān)性。Jiang等[8]對JAmMedInformAssoc網(wǎng)站的論文下載量和其在Web of Science(WoS)的被引頻次進行了研究,發(fā)現(xiàn)兩者之間存在較強的正相關(guān)性。Moed等[9]根據(jù)ScienceDirect平臺的下載量和Scopus數(shù)據(jù)庫的被引頻次發(fā)現(xiàn)所研究期刊的下載量和被引頻次呈正相關(guān),但高被引和高下載論文之間重合的論文較少。Guerrero-Bote等[10]也利用ScienceDirect平臺和Scopus數(shù)據(jù)庫對期刊和論文兩個層面下載量和被引頻次的相關(guān)性進行研究,發(fā)現(xiàn)期刊層面的相關(guān)性優(yōu)于論文層面。Jahandideh等[11]則利用ScienceDirect平臺和Scopus數(shù)據(jù)庫,研究了高下載和低下載論文各25篇及其后續(xù)被引頻次的相關(guān)情況,發(fā)現(xiàn)一定時段內(nèi)的下載量可以較好地預(yù)測論文未來可能達到的被引頻次。Subotic等[12]同樣利用ScienceDirect平臺和Scopus數(shù)據(jù)庫,研究了高下載及低下載論文各129篇及其后續(xù)被引頻次的相關(guān)情況,發(fā)現(xiàn)先期的下載量和后續(xù)的被引頻次呈正相關(guān)。Lippi等[13]利用ScienceDirect平臺的下載量和SciVerse上的被引頻次,發(fā)現(xiàn)一定時段內(nèi)的高下載能夠帶來后兩年的高引用。
從以上文獻綜述可以看出,由于ScienceDirect平臺能夠提供下載量、而Scopus數(shù)據(jù)庫能夠提供被引頻次,國際上利用其對下載量和被引頻次的相關(guān)性做了大量研究。WoS雖然有強大的文獻檢索和分析功能,但一直沒有文章下載量這個指標,直到2015年9月26日,WoS 數(shù)據(jù)庫平臺升級至5.19版,才新增了“文獻級別用量指標”,即使用次數(shù)?!拔墨I級別用量指標”反映了某篇論文滿足用戶信息需要的次數(shù),具體表現(xiàn)為用戶點擊了指向出版商處全文的鏈接(直接鏈接或開放鏈接),或是對論文進行了保存以便在題錄管理工具中使用(通過直接導(dǎo)出或另存為將論文重新導(dǎo)到其他格式)。使用次數(shù)每天更新一次,使用次數(shù)是從 2013年2月1日開始某條記錄的全文得到訪問或是對記錄進行保存的次數(shù),該次數(shù)可能會逐漸增長或保持不變;使用次數(shù)(180天),是最近180天內(nèi)通過某條記錄的全文得到訪問或是對記錄進行保存的次數(shù),該計數(shù)會隨著固定時段結(jié)束日期的推進而上升或下降[14]。
鑒于目前利用WoS數(shù)據(jù)庫進行下載量和被引頻次相關(guān)性研究的文獻較少[15-16],本文利用WoS數(shù)據(jù)庫對《中國天然藥物》(CJNM)高被引論文和高使用論文各自的使用次數(shù)和被引頻次的相關(guān)性進行研究。有大量的研究發(fā)現(xiàn),科技期刊論文被引量的峰值年在論文發(fā)表后的第6~8年,而論文下載量的峰值年在論文發(fā)表后第2年[2,17-19]。由于高被引和高下載論文的峰值年相差較遠,同一發(fā)表年份的高被引和高下載論文重合率的研究價值不大,本研究還對CJNM及其所在學(xué)科整合替代醫(yī)學(xué)論文同一年份的高使用和低使用論文的后續(xù)被引頻次進行比較,分析2014年和2015年高使用和低使用論文對應(yīng)的被引頻次是否有差異。
(1) 研究CJNM 2013—2017年在WoS核心合集中總被引頻次(TC)排名前50(TOP50)論文、使用次數(shù)(180天)(U1)TOP50論文、使用次數(shù)(U2)TOP50論文的具體情況,分析被引頻次TOP50論文TC和U1、U2的相關(guān)性,使用次數(shù)(180天)TOP50論文U1和TC、U2的相關(guān)性,使用次數(shù)TOP50論文U2和TC、U1的相關(guān)性。(2)研究CJNM及整合替代醫(yī)學(xué)學(xué)科的論文2014年和2015年單年的使用次數(shù)TOP50論文和排名最后50(LOWER50)論文,分析其后續(xù)的被引頻次是否有顯著性差異。CJNM數(shù)據(jù)檢索日期為2017年4月20日,整合替代醫(yī)學(xué)學(xué)科數(shù)據(jù)檢索日期為2017年9月10日。
采用GraphPad Prism 6.01軟件分析數(shù)據(jù),Pearson相關(guān)性分析,雙尾,置信區(qū)間為95%,顯著性系數(shù)P<0.05時差異有統(tǒng)計學(xué)意義;t檢驗P<0.05時差異有統(tǒng)計學(xué)意義。
對CJNM 2013—2017年在WoS核心合集中被引頻次、使用次數(shù)(180天)、使用次數(shù)TOP50論文的發(fā)表年份進行統(tǒng)計,結(jié)果如表1所示。被引頻次TOP50論文主要集中在2013—2015年,其中以2013年居首(24篇,占48%);使用次數(shù)TOP50論文同樣集中在2013—2015年,但以2014年居首(18篇,占36%);使用次數(shù)(180天)TOP50論文集中在2016年(30篇,占60%)。
表1 CJNM被引頻次、使用次數(shù)、使用次數(shù)(180天)TOP50論文數(shù)量分布 (篇)
表2顯示被引頻次TOP50論文的TC和U1、U2均呈正相關(guān)性,其中TC和U2的相關(guān)性較強(相關(guān)系數(shù)r=0.802,P<0.0001)。表3顯示使用次數(shù)(180天)TOP50論文的U1和TC、U2均呈正相關(guān)性,其中U1和U2的相關(guān)性較強(r=0.646,P<0.0001)。表4顯示使用次數(shù)TOP50論文的U2和TC、U1均呈正相關(guān)性,其中U2和TC的相關(guān)性較強(r=0.843,P<0.0001)。
表2 CJNM被引頻次TOP50論文的TC和U1、U2相關(guān)性
表3 CJNM使用次數(shù)(180天)TOP50論文的U1和TC、U2相關(guān)性
表4 CJNM使用次數(shù)TOP50論文的U2和TC、U1相關(guān)性
CJNM 2014年和2015年單年的使用次數(shù)TOP50論文和LOWER50論文的TC差異性見表5,2014年和2015年使用次數(shù)TOP50論文和LOWER50論文的TC差異均有顯著性,2014年和2015年使用次數(shù)TOP50論文的篇均被引頻次分別是使用次數(shù)LOWER50論文的2倍和11倍。
表5 CJNM使用次數(shù)TOP50論文和LOWER50論文的TC差異性
為了探討上述個刊案例結(jié)果是否可以推及到整個學(xué)科,繼續(xù)分析了整合替代醫(yī)學(xué)學(xué)科2014年和2015年單年的使用次數(shù)TOP50論文和LOWER50論文(表6),發(fā)現(xiàn)2014年和2015年使用次數(shù)TOP50論文和LOWER50論文的TC差異均有顯著性,2014年和2015年使用次數(shù)TOP50論文的篇均被引頻次分別是使用次數(shù)LOWER50論文的31倍和16倍。
表6 整合替代醫(yī)學(xué)學(xué)科使用次數(shù)TOP50論文和LOWER50論文的TC差異性
由于大多數(shù)情況下文獻的被引頻次與該文獻質(zhì)量呈高度正相關(guān),使得引文分析作為科學(xué)評價的方法具備一定的可行性,但是作者引用的文獻往往僅占其在研究工作中所閱讀過的文獻的一部分,那么其中未被引用的文獻的價值該如何去體現(xiàn)?下載量成為一個日漸公認的評估指標,它在直觀上能夠與該文獻的被閱讀次數(shù)相對應(yīng)。相對于被引頻次來說,下載量能夠較早地反映文章的受關(guān)注度。文章的下載量與被引頻次是否呈正相關(guān)?普遍認為:文章被閱讀的次數(shù)越多,被引用的可能性越大。事實上,下載量雖然反映了文章被社會關(guān)注的程度,但它僅是文章被引的前奏,并不是所有的下載都會帶來引用。Carey[20]認為下載量較于被引頻次能夠更好地反映期刊的真實影響力。也有專家認為,下載量只是反映了論文的可獲得性及可見度,而被引頻次才能真正反映論文的學(xué)術(shù)質(zhì)量。目前尚未有論文下載量與被引頻次相關(guān)性的定論。
WoS數(shù)據(jù)庫作為國際上公認的權(quán)威數(shù)據(jù)庫,一直沒有下載量指標是一個比較大的遺憾,且該數(shù)據(jù)庫文獻的入庫速度比較緩慢,當然這和該數(shù)據(jù)庫嚴謹?shù)氖珍浟鞒逃嘘P(guān),不過文獻信息的實時公開同樣是非常重要的。所幸的是,WoS 數(shù)據(jù)庫于2015年下半年增加了“文獻級別用量指標”,即使用次數(shù)指標。本研究對CJNM及其所在整合替代醫(yī)學(xué)類論文進行了分析,得出以下幾點結(jié)論:
分析CJNM 2013—2017年發(fā)表的論文,發(fā)現(xiàn)被引頻次TOP50論文主要集中發(fā)表在2013年,使用次數(shù)TOP50論文主要集中發(fā)表在2014年,使用次數(shù)(180天)論文主要集中發(fā)表在2016年。畢竟從引用到發(fā)表還有一定的時滯,而使用次數(shù)相對及時,本研究結(jié)果再次驗證了高被引論文是較老的文獻,而高使用論文是較新的文獻,尤以使用次數(shù)(180天)高的論文為最新。
本研究中,被引頻次和使用次數(shù)及使用次數(shù)(180天)三者之間互相具有較好的相關(guān)性。多位專家發(fā)現(xiàn)論文在發(fā)表當年及第二年達到下載高峰,而引用高峰則需要幾年的時間才能達到。目前論文下載量與被引頻次的相關(guān)性未能形成定論,其中時間跨度的選擇可能是造成矛盾結(jié)果的主要原因。因此,在論文下載量與被引頻次相關(guān)性的研究中,研究對象的發(fā)表年份的選擇很重要。例如,Coats[21]研究了IntJCardiol同一年份內(nèi)的TOP10被引和下載論文,發(fā)現(xiàn)兩者沒有重合的論文;還有一些文獻選擇5年甚至10年前的論文進行研究,得到下載量與被引頻次無相關(guān)性的結(jié)論,這有待商榷,畢竟5年前的論文早已達到被引高峰,而高下載的論文集中在近2年,高被引和高下載論文之間無重合也情有可原。
本研究發(fā)現(xiàn),被引頻次TOP50論文的被引頻次和使用次數(shù)及使用次數(shù)(180天)均呈正相關(guān)。這和Wang等[16]的研究結(jié)果一致,他們利用WoS的使用次數(shù)指標分析發(fā)現(xiàn),研究人員整體上傾向于使用較新的文獻,但被引頻次高的老文獻有助于其后續(xù)使用次數(shù)的二次提高。畢竟,歷年發(fā)表的文獻多如恒河沙數(shù),研究人員可能通過被引頻次的降序排列以盡快獲得需要的論文。
本研究還發(fā)現(xiàn),單刊使用次數(shù)TOP50論文的使用次數(shù)和被引頻次的相關(guān)性較強,單刊和整個學(xué)科論文2014年和2015年的高使用論文和低使用論文分別對應(yīng)后續(xù)的高被引和低被引論文,說明可以通過論文發(fā)表后2年內(nèi)的使用次數(shù)來預(yù)測未來可能達到的被引頻次。
此外,影響論文下載量和被引頻次的因素還有很多。Timsit等[22]利用WoS的被引頻次和SpringerLink的下載量研究了影響IntensiveCareMedicine下載和引用的因素,發(fā)現(xiàn)每年第二季度下載量較多,綜述下載量較多,且最后一位作者的h指數(shù)越高,下載越多;而會議報道和專論被引較多,且第一位作者的h指數(shù)越高,被引頻次越高。Wang等[23]研究了NatureCommunicationsOA論文和非OA論文,發(fā)現(xiàn)OA論文較非OA論文在引用和下載方面均有優(yōu)勢,且OA論文不僅能增加總下載量,還能延長被下載的時限。
綜上所述,期刊可以利用論文發(fā)表后2年內(nèi)的使用次數(shù)對其未來是否為高被引進行預(yù)測;年代悠久的高被引文獻,也可能帶來后續(xù)使用次數(shù)的二次提高。WoS文獻級別用量指標能夠在論文發(fā)表后的短時間內(nèi),對其影響力進行快速評估,提示該指標可作為論文影響力早期評價的客觀指標,期刊可以借助這個指標來選擇論文進行及時宣傳和推廣。
[1] 馬崢. 通過計量指標分析發(fā)現(xiàn)操縱期刊評價結(jié)果的行為[J]. 編輯學(xué)報,2016,28(6):608-611.
[2] 丁佐奇,鄭曉南,吳曉明. 科技論文被引頻次與下載頻次的相關(guān)性分析[J]. 中國科技期刊研究,2010,21(4):467-470.
[3] 王麗. 中國知網(wǎng)數(shù)據(jù)庫中高被引文獻與高下載文獻類型分析——以醫(yī)藥衛(wèi)生科技類文獻為例[J]. 編輯學(xué)報,2015,27(5):503-506.
[4] 張小強. 期刊下載頻次與被引頻次及影響因子相關(guān)性——以中國知網(wǎng)CSCD與CHSSCD刊物為樣本的計量分析[J]. 情報理論與實踐,2011,34(8):36-40.
[5] 嚴美娟,肖麗娟,張莉,等. 兒科類期刊欄目設(shè)置與論文被引頻次和下載頻次之間的關(guān)系[J]. 編輯學(xué)報,2012,24(4):399-401.
[6] Nieder C,Dalhaug A,Aandahl G. Correlation between article download and citation figures for highly accessed articles from five open access oncology journals[J].Springerplus,2013,2(1):261.
[7] 趙一權(quán),王振民,熊文炳,等. 科學(xué)論文的下載與引用關(guān)系研究:以ACM數(shù)字圖書館為例[J]. 中國科技期刊研究,2014,25(6):818-823.
[8] Jiang X,Tse K,Wang S,etal. Recent trends in biomedical informatics:a study based on JAMIA articles[J].JournaloftheAmericanMedicalInformaticsAssociation,2013,20(e2):e198-e205.
[9] Moed H F,Halevi G. On full text download and citation distributions in scientific-scholarly journals[J].JournaloftheAssociationforInformationScienceandTechnology,2015,67(2):412-431.
[10] Guerrero-Bote V P, Moya-Anegón F. Relationship between downloads and citations at journal and paper levels, and the influence of language[J].Scientometrics,2014,101(2):1043-1065.
[11] Jahandideh S,Abdolmaleki P,Asadabadi E B. Prediction of future citations of a research paper from number of its internet downloads[J].MedicalHypotheses,2007,69(2):458-459.
[12] Subotic S,Mukherjee B. Short and amusing:The relationship between title characteristics,downloads,and citations in psychology articles[J].JournalofInformationScience,2014,40(1):115-124.
[13] Lippi G,Favaloro E J. Article downloads and citations:Is there any relationship?[J].ClinicaChimicaActa,2013,415:195.
[14] 孫學(xué)軍. SCI新增功能“文獻級別用量指標”是個什么東東[EB/OL]. [2015-10-10]. http://blog.sciencenet.cn/blog-41174-926981.html.
[15] 付中靜. WoS數(shù)據(jù)庫收錄論文文獻級別用量指標與被引頻次的相關(guān)性[J]. 中國科技期刊研究,2017,28(1):68-73.
[16] Wang X W,Fang Z C,Sun X L. Usage patterns of scholarly articles on Web of Science:A study on Web of Science usage count[J].Scientometrics,2016,109(2):917-926.
[17] 方紅玲. 我國科技期刊論文被引量和下載量峰值年代——多學(xué)科比較研究[J]. 中國科技期刊研究,2011,22(5):708-710.
[18] 丁佐奇,鄭曉南,吳曉明. SCI藥學(xué)論文被引峰值研究及國別比較[J]. 科技與出版,2012 (8):114-116.
[19] Schl?gl C,Gorraiz J,Gumpenberger C,etal. Comparison of downloads,citations and readership data for two information systems journals[J].Scientometrics,2014,101(2):1113-1128.
[20] Carey R M. Quantifying scientific merit:Is it time to transform the impact factor?[J].CirculationResearch,2016,119(12):1273-1275.
[21] Coats A J. Top of the charts:Download versus citations in the International Journal of Cardiology[J].InternationalJournalofCardiology,2005,105(2):123-125.
[22] Timsit J F,Citerio G,Lavilloniere M,etal. Determinants of downloads and citations for articles published in intensive care medicine[J].IntensiveCareMedicineExperimental,2015,3(1):A863.
[23] Wang X W,Liu C,Mao W L,etal. The open access advantage considering citation,article usage and social media attention[J].Scientometrics,2015,103(3):1149.