楊代慶,何文珍
我國高影響力論文對外文回溯期刊依賴研究
楊代慶,何文珍
文章以被ESI收錄我國作者論文及其引用參考文獻作為數(shù)據(jù)集,通過計算文獻半衰期、引用分布等方法,研究我國高影響力論文對回溯期刊的需求程度和范圍。研究結果表明:我國高影響力論文對回溯期刊的需求總量持續(xù)增長,并表現(xiàn)出一定的學科特異性,我國需加大對學會(協(xié)會)主辦回溯期刊的保障力度。
ESI回溯期刊文獻老化依賴度
引用本文格式楊代慶,何文珍.我國高影響力論文對外文回溯期刊依賴研究[J].圖書館論壇,2016 (8):54-59.
傳統(tǒng)研究認為,隨著文獻的老化,期刊學術價值及使用率將逐漸降低,并采用半衰期作為老化程度的度量[1]。數(shù)字圖書館方便了文獻的發(fā)現(xiàn)與獲取,部分學者據(jù)此認為文獻老化速度將不斷加快[2],大部分學者則認為數(shù)字化的手段有利于回溯文獻的發(fā)現(xiàn)與獲取,半衰期將出現(xiàn)延長現(xiàn)象。Philip M.Davis通過研究1997-2003年JCR收錄期刊的論文,發(fā)現(xiàn)文獻的引用半衰期平均為6.5年,且半衰期有逐年延長的趨勢[3]。Alex Verstak等研究 1990-2013年 Google Scholar中學術期刊的引文老化現(xiàn)象,發(fā)現(xiàn)2003-2013年的文獻老化現(xiàn)象比1990-2001年明顯延長。Alberto等的研究表明,幾乎在所有學科中,文獻老化延長呈現(xiàn)出加速狀態(tài)[4]。我國學者的研究與國外研究有相似的結論[5]。還有學者認為,互聯(lián)網(wǎng)環(huán)境下學術文獻的絕對老化并未發(fā)生,相對老化速度持續(xù)減緩,“長尾效應”日益顯現(xiàn)[6]。
與現(xiàn)刊資源一樣,圖書館在回溯資源建設過程中,同樣需要進行定量評估,才能有針對性地采取策略,實現(xiàn)信息資源經(jīng)濟效益和社會效益最大化。部分學者將“半衰期”及文獻老化理論在圖書館剔舊中的應用進行研究,取得了較好的投入產(chǎn)出效率[7]。對被利用文獻的老化研究成為回溯期刊資源的重要評估手段。從已有研究看,文獻老化研究的數(shù)據(jù)集主要基于中文期刊數(shù)據(jù)集,基于SCI、Google Scholar等國外期刊數(shù)據(jù)集,基于圖書、學位論文等非刊的外文文獻數(shù)據(jù)集。但通過這些數(shù)據(jù)集的研究尚不能回答:國外期刊相對于我國高水平科研人員需求的老化速度怎樣、我國科研人員尤其是高水平科研人員對國外期刊回溯文獻的依賴程度如何等問題。而這些問題的答案對我國圖書館回溯期刊資源建設具有重要意義。ESI(基本科學指標數(shù)據(jù)庫)是基于Web of Science收錄的文獻而建立的計量分析數(shù)據(jù)庫,是全球范圍內普遍用以評價機構、地區(qū)、國家學術水平及影響力的重要評價工具,其中的高影響力論文(Top paper)包括高被引論文和熱點論文,能反映論文的價值及影響力。本文通過ESI收錄的我國作者發(fā)表的高影響力論文及其引用文獻作為數(shù)據(jù)集,研究我國科研人員對外文回溯期刊的使用特點,并針對我國外文回溯期刊資源的保障提出應對策略。
為便于后續(xù)分析、計算和討論,需規(guī)范定義引用半衰期、回溯期刊、回溯期刊依賴度等概念。引用半衰期是指某一論文數(shù)據(jù)集所引用的全部參考文獻中,50%參考文獻引用量按從新到舊順序所對應的發(fā)表時間跨度。最大引用年限是指某一論文數(shù)據(jù)集所引用的全部參考文獻中,被引用次數(shù)最多參考文獻對應的年份?;厮萜诳侵阜墙瓿霭娴钠诳话銇碚f距離出版時間越長的期刊越屬于回溯期刊范疇。本文將第一次引用半衰期與第二次引用半衰期之間的期刊定義為近期回溯期刊,將第二次引用半衰期之后的期刊定義為歸檔性回溯期刊。例如,第N年發(fā)表論文引用參考文獻的半衰期為R,則近期回溯期刊是指被引用論文發(fā)表時間范圍為[N-2R,N-R]的所屬期刊,歸檔性回溯期刊是指被引用論文發(fā)表時間范圍為(-∞,N-2R)的所屬期刊。引用依賴度D是描述某一論文數(shù)據(jù)集對某一范圍內發(fā)表論文引用強度的依賴程度,即參考文獻中屬于某一時間范圍的文獻數(shù)量/參考文獻總數(shù)。為了考察論文隨著發(fā)表年代時間跨度的增加而呈現(xiàn)出的被引用特征,由上述定義可推出某一時間段內發(fā)表論文的近期回溯期刊依賴度(RD)和歸檔性回溯期刊依賴度(BD)定義,具體描述如下:
RD定義為從論文發(fā)表年至今所引用在第一次半衰期和第二次半衰期之間的論文總量與引用的全部論文總量的比值,該定義描述了論文對于較近時間段內文獻的需求依賴程度。BD定位為從論文發(fā)表年至今所引用在第二次半衰期以后的論文總量與引用的全部論文總量的比值,該定義描述了論文對于較遠時間段內文獻的需求依賴程度。
2005-2015年我國作者被ESI收錄的論文共13472篇(截止2015年9月30日),涉及22個主題,學科分布見表1。從表1中可以看出,不同學科的論文在發(fā)文量、篇均被引頻次等指標表現(xiàn)出較為明顯的主題特異性?;瘜W、工程等學科的發(fā)文量及被引頻次位居前兩位;而從篇均被引頻次看,發(fā)文量最少的跨學科及分子生物學等交叉及新興學科的篇均被引頻次較高。此外,根據(jù)各學科每年發(fā)文量統(tǒng)計,大部分學科呈現(xiàn)出波動性上漲和持續(xù)上漲規(guī)律,且所有學科的發(fā)文總量總體增長速度都較快,部分學科被ESI收錄的論文從無到有(如經(jīng)濟學、心理學),這說明我國高影響力論文的絕對數(shù)量、增長速度以及學科覆蓋度都表現(xiàn)出強勁的擴張趨勢。信息服務機構為了滿足科研人員日益增強的文獻資源需求,需提供有力的文獻保障和支撐,通過對現(xiàn)有高影響力論文的引用文獻進行分析,總結規(guī)律并發(fā)現(xiàn)不足是實現(xiàn)文獻資源科學保障的有效手段。
表1 2005-2015年ESI收錄我國作者發(fā)文學科分布
3.1文獻整體老化規(guī)律
ESI收錄的來自我國的高影響力論文(2005-2015年)的參考文獻共858,160篇,其中期刊論文647,056篇,平均每篇論文引用參考文獻63.7篇,其中期刊48.03篇。近10年引文數(shù)量呈明顯的上升趨勢,增長趨勢具有穩(wěn)定性(見圖1)。
圖1 ESI收錄我國作者論文的參考文獻數(shù)量分布
從ESI收錄的我國科研人員論文引用參考文獻的角度來計算文獻老化程度,結果見表2??傮w看,引文半衰期范圍是4~5年,2010年以來引用文獻的半衰期逐步穩(wěn)步延長,2010年之前引用文獻的半衰期呈現(xiàn)波動趨勢,最大引文年限除2005年外均為3年,即當年發(fā)表的論文引用參考文獻最多的是第3年前發(fā)表的。這說明近年來我國高影響力論文對于新文獻的引用大部分集中在5年內出版的文獻;而半衰期小幅穩(wěn)步增長,則說明對于回溯文獻的需求也在逐步增長。
3.2回溯文獻的整體性依賴度
我國高影響力論文對回溯期刊的依賴程度依據(jù)前述定義計算,結果見表3。從結果看,每年對歸檔性回溯期刊和近期回溯期刊的總體需求依賴程度相差不大,大致均占到20%以上。這說明歸檔性回溯期刊對我國高水平科研人員來說需求始終保持相對穩(wěn)定,約占總體文獻需求1/5。
表2 各年份半衰期及最大引文年限
表3 歷年高影響力論文對回溯期刊依賴度分布
3.3整體回溯文獻出版機構分布
統(tǒng)計我國作者發(fā)表ESI論文中引用的2000年之前期刊品種頻次前100位所對應的出版機構分布,結果見表4。從表4中可以發(fā)現(xiàn)Elsevier 以34種期刊位居第一,Wiley、Springer等出版社也位居前列。值得注意的是,被引回溯期刊前100位出版機構中,大部分是學會(協(xié)會),這說明學會(協(xié)會)期刊具有較高質量,老化程度更加緩慢。
表4 高被引回溯期刊出版機構分布
3.4學科間文獻老化的差異性
通過計算22個學科2005-2015年的引用論文的實際半衰期及最大引文年限,以考察不同學科之間文獻老化的程度及區(qū)別,結果見表5。從表5中可以發(fā)現(xiàn),去除部分年份的波動因素,從最大引文年限角度看,幾乎所有學科的中位數(shù)及平均值為2-4年,其中大部分為3年。這說明所有學科對期刊引用數(shù)量最多的年份都在論文發(fā)表后3年左右。從半衰期角度看,不同學科的中位數(shù)及平均值存在較大差異性,比如物理學明顯低于商業(yè)經(jīng)濟或農(nóng)業(yè)學科,這既說明在物理學方面,我國高水平論文更加依賴于新刊;也說明我國可能商業(yè)經(jīng)濟、農(nóng)業(yè)等學科發(fā)展與世界先進水平還存在差距,或者這些學科的研究時間周期較其他學科更長。
3.5學科間回溯期刊出版機構分布
通過統(tǒng)計各學科引用回溯期刊最多的品種及出版社(為簡化統(tǒng)計,將2000年之前的論文歸為回溯論文),以考察不同學科對于具體回溯期刊品種需求的差異性,結果見表6。從表6中可以發(fā)現(xiàn),Nature的回溯期刊位居四個學科第一位;其次為New England Journal of Medicine,位居二個學科第一位;而所有高引用回溯期刊都是各學科最具影響力的期刊。從出版社看,除NPG、Elsevier、OUP外,其余均為學會(協(xié)會)期刊,學會(協(xié)會)高引用回溯期刊占68%。
從前面分析可以得到結論:總體上我國高影響力論文對歸檔性回溯期刊仍具有較多需求,被引回溯期刊與全體被引文獻的比例保持穩(wěn)定(每年均在20%以上),絕對數(shù)量持續(xù)性增長,對回溯期刊的依賴性不但未減弱,還有增強的現(xiàn)象;不同學科之間對回溯期刊的需求具有明顯差異,物理學、化學、分子生物學、免疫學等學科文獻老化較快,比商業(yè)經(jīng)濟、地質、數(shù)學等學科對新期刊的依賴性更強?;诖私Y論,信息服務機構既要做好回溯期刊資源的保障工作,又需要與現(xiàn)刊資源建設進行區(qū)別對待,具體建議有:
(1)加強國家許可模式的回溯期刊建設。與現(xiàn)刊資源相比,由于回溯期刊數(shù)量較大、總價格較高,一般信息服務機構往往沒有足夠的經(jīng)費進行整體保障,因此國家許可模式等共同體授權形式成為回溯期刊建設重要模式,德國、英國等均有國家或團體性回溯期刊采購項目的實施[8]。在我國,國家科技圖書文獻中心(NSTL)與國家圖書館分別完成了Wiley、Taylor&Francis等16個國外重要數(shù)字化回溯期刊數(shù)據(jù)庫的國家許可模式采購,能較好地滿足我國科研人員的回溯期刊需求[9]。但對回溯期刊需求較為強烈的Elsevier、IEEE以及部分重要學會(協(xié)會)回溯期刊,我國保障不夠,應盡快啟動對這些機構的回溯出版物談判,爭取以國家許可模式進行購買,實現(xiàn)普惠服務。若短期內無法采取國家許可模式授權,也可考慮采用單用戶購買,但爭取合同條款允許文獻傳遞服務等。
表5 不同學科文獻老化分布
表6 不同學科高引用回溯期刊及出版機構分布
(2)推進國家層面的數(shù)字回溯期刊長期保存。部分重要學會(協(xié)會)及出版社的回溯期刊數(shù)據(jù)由于只需交納少量費用,或已經(jīng)包含在現(xiàn)刊數(shù)據(jù)庫中,我國相當數(shù)量的信息服務機構已經(jīng)實現(xiàn)了對這些回溯期刊的保障,如ACS、AIP、APS、ASME,但這部分回溯期刊可能存在只有訪問權、沒有長期保存的客觀現(xiàn)實。為實現(xiàn)對回溯資源的長期穩(wěn)定保障,有必要在國家層面建立統(tǒng)一的數(shù)字回溯期刊長期保存體系。由國家科技圖書文獻中心牽頭、我國數(shù)十家重要信息服務機構簽署的《數(shù)字文獻資源長期保存共同聲明》就是建立包括數(shù)字回溯期刊資源的數(shù)字資源長期保存的重要舉措。
(3)探討回溯期刊數(shù)字化合作加工與服務模式。對于受條件限制暫時不能采購的回溯期刊,可考慮根據(jù)回溯期刊的特性建立不同的回溯期刊共享模式,實現(xiàn)對部分重點期刊的保障;對已經(jīng)開放獲取的回溯期刊,可通過集中采集和加工實現(xiàn)回溯保障,如New England Journal of Medicine(新英格蘭醫(yī)學雜志)就采取了延遲公開的模式;對未開放獲取的回溯期刊,通過建立回溯期刊共享聯(lián)盟,結合回溯印本期刊在我國的館藏分布情況,經(jīng)評估后分布式加工回溯期刊二次文獻,集中揭示發(fā)現(xiàn)并進行原文傳遞,實現(xiàn)對未開放回溯期刊的服務。
(4)拓展對回溯期刊資源的深度開發(fā)利用?;厮萜诳哂心茌^全面反映科學系統(tǒng)性和完整性的作用,通過對回溯資源的細粒度加工及挖掘,能夠發(fā)現(xiàn)某學科及知識發(fā)展完整脈絡,體現(xiàn)回溯期刊的學術價值。深度開發(fā)回溯期刊資源是提高回溯期刊利用率的重要手段,加工粒度與深度都直接影響回溯資源的利用程度與利用效益。細粒度的加工與挖掘不但可以體現(xiàn)學術價值,通過結合知識發(fā)展過程以及與歷史時期科技政策頒布及支持的關聯(lián),還能為未來學科發(fā)展規(guī)劃及科研管理提供借鑒和參考。
[1]Burton R E,Kebler R W.Half-life of Some Scientific&Technical Literatures[J].American Documentation,1960(11):18-22.
[2]Line M B.Changes in the use of literature with time:Obsolescence revisited[J].Library Trends,1993(4):665-683.
[3]Philip M.Davis.Cited Half-Life of the Journal Literature[EB/OL].[2015-10-12].http://arxiv.org/ftp/arxiv/papers/1504/1504.07479.pdf.
[4]AlbertoMartin-Martin.Revivingthepast:the growthof citations to old documents[EB/OL].[2015-10-15].http://arxiv.org/ftp/arxiv/papers/1501/1501.02084.pdf.
[5]陳立新,梁立明,劉則淵.力學文獻老化速度50年(1954-2003)的變化趨勢[J].現(xiàn)代情報,2006(10):12-18.
[6]鐘晶晶,游毅,索傳軍.新信息環(huán)境下數(shù)學文獻老化趨勢及影響因素新探[J].情報雜志,2011(12):36-42.
[7]信丹丹.公共圖書館圖書剔舊指數(shù)指標體系構建研究[J].圖書館論壇,2013(3):122-125.
[8]Journal backfiles in scientific publishing-a market white paper[EB/OL].[2015-10-15].http://www.bl.uk/ reshelp/atyourdesk/docsupply/productsservices/digitisation/journlbackfileswhitepaper.pdf.
[9]潘曉蓉.NSTL全國開通數(shù)據(jù)庫資源建設與使用情況分析[J].數(shù)字圖書館論壇,2014(11):14-19.
(責任編輯:何燕)
Research on the Dependence of Chinese High-impact Papers on Foreign Archived Journals
YANGDai-qing,HEWen-zhen
Using Chinese papers listed in ESI and their citations as the dataset,this study analyzes the demands of those papers for archived journals by calculating the half life of literature,citation distribution etc.The results show that the demand of Chinese high-impact papers,whose specificities vary among different disciplines,for archived journal continues to grow,and the guarantee of achieved journals should be strengthened.
ESI;archived journal;obsolescence of literature;dependence
楊代慶,男,中國科學技術信息研究所高級工程師;何文珍,女,在讀碩士研究生,任職于中國科學技術信息研究所。
2016-02-05