盧垚 馬鑫 王鸑飛 顏蘊 郭洋 董越
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081;2.上海施普林格信息咨詢服務(wù)有限公司北京分公司,北京 100080)
Nature系列期刊涵蓋科學(xué)、技術(shù)和醫(yī)學(xué)領(lǐng)域的最前沿研究,為各個領(lǐng)域的科研工作者提供高影響力的研究成果。中國農(nóng)業(yè)科學(xué)院(以下簡稱“農(nóng)科院”)從2005年開始進行電子文獻資源建設(shè),2006年開始訂閱Nature及其系列刊物,隨后十年內(nèi)訂閱的期刊種數(shù)一直維持在10種上下,2016年之后大幅增加新刊,訂閱的Nature期刊數(shù)量達到20種,2018年再新增2種,截至2019年7月共訂閱22種Nature期刊,包括研究型期刊17種、綜述型期刊5種(見圖1)。一方面,隨著Nature期刊的不斷發(fā)展,Nature系列新增期刊越來越多,其系列期刊涉獵各學(xué)科前沿熱點領(lǐng)域、新興領(lǐng)域和交叉領(lǐng)域;另一方面,Nature期刊采用每種期刊單本定價的訂購方式并且單本價格高昂,因此無論是以新增還是續(xù)訂為目的,研究建立科學(xué)的循證分析方法,對訂閱Nature期刊的利用情況、使用成本及其在科研產(chǎn)出中的效益進行評估都具有十分的必要性。
圖書館數(shù)字資源的評估借鑒圖書館價值評估,目前常用的方法大多數(shù)建立在成本效益分析(Cost Benefit Analysis)的基礎(chǔ)上,結(jié)果以投資回報率(Return on Investment,ROI)的形式予以表示[1-3]。但“收益”往往難以衡量,目前收益評估的方法主要是條件價值評估法(Contingent Valuation Method)、消費者剩余法(Consumer Surplus Method)和時間成本法[4-7]。國內(nèi)外學(xué)者利用這些方法建立了一系列評估模型[8-12],但指標難以量化,一般需要通過調(diào)查問卷等形式來收集數(shù)據(jù)。本文利用期刊使用統(tǒng)計數(shù)據(jù)和用戶引文數(shù)據(jù),進行循證分析,借助引文分析、相關(guān)分析、回歸分析和復(fù)相關(guān)系數(shù)賦權(quán)法等,證明Nature期刊的使用、引用等文獻利用行為與科技論文發(fā)表、項目申請等科研活動具有關(guān)聯(lián)性;并通過使用成本、產(chǎn)出論文質(zhì)量、轉(zhuǎn)化率、相對投資回報率ROI等一系列指標,實現(xiàn)資源利用效益的比較和評估。
圖書館數(shù)字資源的效益評估,除考慮資源成本之外,核心就是如何量化其“收益”。Nature期刊作為電子文獻資源能夠帶來的“收益”,主要體現(xiàn)為其在用戶科研活動中產(chǎn)生的利用價值,既反映在用戶對科技文獻資源的下載閱讀、引用等利用行為中,也反映在與文獻利用相關(guān)的科技產(chǎn)出中。其中論文發(fā)表是最主要的產(chǎn)出形式,是文獻利用帶來的直接“收益”。因此本文通過收集農(nóng)科院用戶利用Nature期刊的相關(guān)全文下載、引用、論文發(fā)表三個環(huán)節(jié)的客觀數(shù)據(jù)來綜合評估資源利用效益。其中,農(nóng)科院2016—2018年Nature期刊的全文下載數(shù)據(jù)來自數(shù)據(jù)庫Journal Report1使用統(tǒng)計報告;相關(guān)論文發(fā)表數(shù)據(jù),即引用Nature期刊文獻產(chǎn)生的發(fā)文(下稱“施引文獻”),采集自Scopus數(shù)據(jù)庫,采集發(fā)文時間區(qū)間為2016—2018年;引用數(shù)據(jù),即用戶發(fā)表論文時引自Nature期刊的參考文獻(下稱“引文”),來自上述論文發(fā)表數(shù)據(jù)中的參考文獻;此外,2017年自然科學(xué)基金項目申請和獲批數(shù)量采集自國家自然科學(xué)基金委官方網(wǎng)站。
本文利用引文分析法對農(nóng)科院用戶利用Nature期刊的相關(guān)引文和發(fā)表的施引文獻進行分析,并結(jié)合使用統(tǒng)計數(shù)據(jù),利用相關(guān)分析和回歸分析的方法,揭示Nature期刊的使用、引用等文獻利用行為與科技論文發(fā)表、項目申請等科研活動相互間的關(guān)聯(lián);通過對使用成本、施引文獻質(zhì)量、轉(zhuǎn)化率等各類指標的分析,比較用戶對不同Nature期刊的利用特征和規(guī)律;利用復(fù)相關(guān)系數(shù)賦權(quán)法綜合全文下載量、引文量、發(fā)文量、發(fā)文質(zhì)量4個變量計算資源利用收益,與使用成本相比后經(jīng)歸一化,得到相對投資回報率ROI,來比較各Nature期刊的利用效益。
圖1 農(nóng)科院Nature期刊訂閱數(shù)量變化(2006—2019年)
對2016—2018年農(nóng)科院訂閱的22本Nature期刊的全文下載量、引用上述期刊的引文數(shù)量,以及對應(yīng)的引用Nature期刊的發(fā)文數(shù)量的相關(guān)分析結(jié)果表明(見表1),三者具有很高的相關(guān)性。選取發(fā)文量作為因變量,由于全文下載量和引文量之間存在相關(guān)關(guān)系,所以僅選擇全文下載量作為自變量,做一元回歸分析,得到置信度高于99.99%的回歸模型方程如公式(1)。
可以看出全文下載量與發(fā)文量之間呈線性正相關(guān)關(guān)系,這22本期刊每一種的全文下載量越多,利用該刊產(chǎn)生的發(fā)文數(shù)量就越多,說明這些期刊文章的閱讀和利用對相關(guān)科研論文的產(chǎn)出有正面的促進作用。
表1 Nature期刊使用、引用與發(fā)文相關(guān)分析(2016—2018年)
對2017年農(nóng)科院各直屬研究所Nature期刊全文下載量與各所2018年(申請截止時間為2018年3月)自然科學(xué)基金申請項目數(shù)量(包括面上項目和青年基金項目)和獲批項目數(shù)量的相關(guān)分析結(jié)果表明(見表2),全文下載量與各所申請項目數(shù)量的相關(guān)系數(shù)為0.74,與獲批項目數(shù)量的相關(guān)系數(shù)為0.73,說明各所對Nature期刊文獻的利用,與其自然科學(xué)基金項目的申請和獲批項目數(shù)量有一定的相關(guān)性,能夠一定程度上支撐科研項目。
單篇下載成本(Cost Per Download,CPD),指該刊當年訂閱價格與用戶全年對其全文下載數(shù)量的比值,22本Nature期刊的CPd分析結(jié)果(見表3)表明,除去2018年新增的Nature Ecology&Evolution和Nature Sustainability,其余期刊單篇下載成本在10元以下的有11種,10~20元的5種,余下的Nature Chemical Biology、Nature Reviews Drug Discovery、Nature Geoscience、Nature Materials單篇下載成本較高,尤其是NatureMaterials這3年單篇下載成本平均為133.43元。
就成本變化趨勢而言,除去2018年新增的兩本刊,這3年間Nature等9種期刊由于利用狀況良好發(fā)展、全文下載量持續(xù)增加,其單篇下載成本下降。11種期刊單篇下載成本上升,其中Nature Reviews Genetics等3種期刊全文下載量增加,是由于期刊價格漲幅造成成本上升;Nature Biotechnology等8種期刊的單篇下載成本上升則是由全文下載量減少和價格上漲兩方面原因造成的。隨后我們分析了這8種期刊的載文數(shù)量是否穩(wěn)定,載文量明顯下降的有3種,2018年Nature Structural&Molecular Biology的載文量相對于2016年減少9%,而其全文下載量減少21%;Nature ReviewsDrug discovery2018年載文量相對于2016年減少23%,而全文下載量減少38%;Nature Materials2018年載文量相對于2016年減少9%,而全文下載量減少55%,所以下載量的減少并不完全是因為期刊載文量減少造成的。
表2 農(nóng)科院各分所Nature期刊使用與自然科學(xué)基金申請獲批情況(2017—2018年)
表3 農(nóng)科院訂閱Nature期刊單篇下載成本(2016—2018年)
22種Nature期刊的引用分析結(jié)果(見表4)表明,除去不涉及引用的3種期刊Nature Microbiology、Nature Ecology & Evolution和Nature Sustainability,余下的期刊中Nature Reviews Genetics、Nature Cell Biology的引用量略有波動,其余17種期刊的引文量都是呈現(xiàn)上漲趨勢,尤其是Nature Plants、Nature Climate Change、Nature Geoscience、Nature Reviews Microbiology這4種刊的引用量上漲顯著,其中2016年新增的Nature Plants引文量在3年內(nèi)增長715.38%。
如果按照CPD的思路來測算各刊的引用成本(Cost Per Citation,CPC),即某一時間窗口內(nèi)期刊訂閱價格與用戶引用該刊文獻次數(shù)的比值,測算出22種Nature期刊中CPC較低的期刊是Nature、Nature Genetics和Nature Biotechnology,單篇引用成本不超過40元。
表4 農(nóng)科院訂閱Nature期刊引用情況(2016—2018年)
對引用22種Nature期刊文章的農(nóng)科院發(fā)文進行分析(見表5),結(jié)果表明,除去不涉及農(nóng)科院施引文獻的3種期刊Nature Microbiology、Nature Ecology & Evolution和Nature Sustainability之外,Nature Cell Biology過去3年的農(nóng)科院施引文獻量略有波動,引用其余18種期刊的相應(yīng)發(fā)文量都有所增加,尤其是引用Nature Plants、NatureClimate Change、Nature Reviews Microbiology、NatureGeoscience這4種刊的發(fā)文量上漲迅速,參考Nature Plants上載文的農(nóng)科院發(fā)文在3年增加609.09%。
同理,若按照CPD的思路來測算各刊的單篇發(fā)表成本(Cost Per Publication,CPP),不考慮引用這些期刊所發(fā)表的文章質(zhì)量僅考慮數(shù)量的情況下,計算某一時間窗口內(nèi)期刊訂閱價格與用戶引用該刊文獻發(fā)表文章數(shù)量的比值,測算出22種Nature期刊中CPP較低的期刊是Nature、Nature Genetics和Nature Biotechnology,分別為53.99元、56.39元和62.84元。
表5 農(nóng)科院引用Nature期刊的發(fā)文情況(2016—2018年)
利用引文影響力指標對2016—2018年農(nóng)科院引用Nature期刊文獻的發(fā)文的質(zhì)量進行分析,從表6可以看出除去3種刊(2018年新增的2種,2016年新增的1種但無引用發(fā)文),引用Nature Biotechnology等10種期刊文獻的發(fā)文,超過80%發(fā)表于Q1區(qū)期刊,引用Nature等8種期刊文獻的發(fā)文,發(fā)表在Q1區(qū)期刊上的占70%~80%,只有引用Nature Materials的發(fā)文的Q1文章占比略低于70%,但仍高于2016—2018年農(nóng)科院全部發(fā)文的Q1文章占比(62.7%)。就篇均被引頻次而言,引用各系列Nature期刊的發(fā)文的表現(xiàn)均高于2016—2018年農(nóng)科院全部發(fā)文的篇均被引次數(shù)4.4次,尤其是Nature Geoscience和Nature Climate Change表現(xiàn)突出。而考慮到施引文獻分屬不同學(xué)科造成的引文影響力的偏差,進一步采用學(xué)科規(guī)范化的引文影響力(Field Weighted Citation Impact,F(xiàn)WCI)來比較各刊相應(yīng)施引文獻的發(fā)文質(zhì)量,結(jié)果表明:只有引用醫(yī)學(xué)領(lǐng)域期刊Nature Medicine和Nature Immunology的發(fā)文的FWCI值低于農(nóng)科院2016—2018年發(fā)文平均值1.06,其余期刊的施引文獻都有較強的影響力,特別是引用Nature Geoscience、Nature Plants和Nature Climate Change的發(fā)文表現(xiàn)優(yōu)異??傮w而言,雖然引用的不同期刊的發(fā)文表現(xiàn)有所差異,但大部分期刊的施引文獻各項指標都高于農(nóng)科院發(fā)文平均水平,表現(xiàn)出較強的引文影響力。此外,也對Nature期刊的影響因子、期刊的使用成本CPD、CPC、CPP值和表6中引文影響力指標進行了相關(guān)分析,在期刊水平、使用成本和產(chǎn)出論文質(zhì)量各項指標間并未發(fā)現(xiàn)有顯著相關(guān)。
從2.1的分析結(jié)果可知,全文下載量和引文量、發(fā)文量呈一元回歸線性正相關(guān),因此從Nature期刊的引用率和發(fā)文影響轉(zhuǎn)化率的角度來比較各期刊的利用效益。引用率,即引文量與全文下載量的比值,反映在期刊的全文下載量中,有多大比例的下載行為能夠轉(zhuǎn)化為引用;同理,發(fā)文影響轉(zhuǎn)化率,即發(fā)文量與全文下載量的比值,同時引入FWcI值來反映有多大比例的全文下載行為能夠轉(zhuǎn)化為論文產(chǎn)出并造成一定的引文影響力。結(jié)果可以看出(見表7),引用率較高的期刊有Nature Geoscience、Nature Materials和Nature Methods,發(fā)文影響轉(zhuǎn)化率較高的期刊有Nature Geoscience、Nature Methods和Nature Protocols。
但利用引用率和發(fā)文影響轉(zhuǎn)化率來比較期刊利用效益,直接受全文下載量多少的影響,全文下載量少的期刊,容易有較高的轉(zhuǎn)化率,因此這兩項指標參考作用有限。為了綜合比較農(nóng)科院訂閱的Nature期刊的利用效益,用全文下載量、相關(guān)期刊引文量、對應(yīng)的發(fā)文量以及發(fā)表論文的引文影響力FWcI作為4個變量來衡量Nature期刊利用的“收益”,再除以使用成本,得到投資回報率ROI,如公式(2)所示。
其中a、b、c分別代表各指標的權(quán)重,由復(fù)相關(guān)系數(shù)賦權(quán)法計算而得。將全文下載量、引文量、發(fā)文量作為3個變量進行復(fù)相關(guān)分析,依據(jù)指標的獨立性確定其權(quán)重,指標與其他兩項指標的復(fù)相關(guān)系數(shù)越大、共線性越強、重復(fù)信息越多,越容易由其他兩個指標的線性組合表示,該指標的權(quán)重就應(yīng)當越小,反之亦然。因此本文取指標各自與其他兩個指標的復(fù)相關(guān)系數(shù)的絕對值的倒數(shù)作為權(quán)重。
但這樣計算的收益并未和成本一樣量化到金額,而是各期刊間用于比較的歸一化值,所以稱之為相對ROI。計算2016—2018年農(nóng)科院Nature期刊使用收益和成本的比值并進行歸一處理,得到相對ROI以比較Nature期刊的使用效益(見表7)。結(jié)果表明,在農(nóng)科院訂閱的19本Nature期刊中(除去2018年新增的2種,2016年新增的1種但無引用),使用效益最好的是Nature Genetics,其次是Nature、Nature Biotechnology、Nature Plants。
表7 農(nóng)科院Nature期刊利用效益比較(2016—2018年)
學(xué)術(shù)期刊的文獻資源建設(shè)及其利用與科研活動有著密切的聯(lián)系,尤其是Nature期刊這類高質(zhì)量、高影響力的學(xué)術(shù)資源。本文證明農(nóng)科院Nature期刊資源建設(shè)及相關(guān)利用與用戶科技論文發(fā)表、項目申請等科研活動的具有相關(guān)性。通過分析期刊的使用成本對農(nóng)科院訂閱Nature系列期刊的建設(shè)策略提出建議,針對利用狀況發(fā)展良好的期刊,采取穩(wěn)定建設(shè)的建議;對利用成本較高的期刊,需進一步培育用戶的利用需求,密切監(jiān)控其利用情況;對下載量下滑、成本持續(xù)上升的期刊,則需要進一步深入分析用戶對其利用規(guī)律、挖掘潛利用的“收益”,再考慮使用成本計算投資回報率ROI,是各期刊間用于比較的歸一化值。這種方法雖不能將具體收益量化到金額,計算出絕對投資回報率,但其完全依靠使用統(tǒng)計數(shù)據(jù)和引文相關(guān)數(shù)據(jù),數(shù)據(jù)來源客觀,能夠有效地對不同資源的利用效益進行簡單對比和評估,是對循證分析方法和成本效益分析方法的創(chuàng)新結(jié)合,能夠?qū)Y源建設(shè)工作起到參考和指導(dǎo)作用。