陳京蓮
(井岡山大學圖書館,江西 吉安 343009)
載文量是指某一期刊在一定時期內所刊載的相關學科的論文數(shù)量??萍颊撐漠a出數(shù)量是體現(xiàn)科技成果產出的一個重要量化指標,在很大程度上說明科研發(fā)展水平[1]。載文量是反映一份期刊信息量的重要指標,期刊載文量多,在一定程度上表示這種期刊信息量較多,可供學者選擇的信息較多,因而該刊論文被引的次數(shù)也可能較多。但有不少人對此持不同觀點,認為載文量多的期刊,其論文水平并不一定就高;相反,載文量少的期刊,也可能是優(yōu)秀期刊。例如,有的刊物放松對論文質量的控制,提高稿件錄用率,把刊物由季刊改為月刊,其結果是載文量提高了,刊物的信息量也提高了,但刊物水平反而下降了。當前,有不少文獻報道了載文量與期刊影響因子之間的關系,但尚無一致的結論。Hooydonk[2]認為載文量與期刊影響因子為線性增長關系。何榮利[3]和俞立平等[4]的研究發(fā)現(xiàn),期刊影響因子與載文量無關。于挨福和馬虎兆[5]運用模型假設及實證檢驗的方法,得出期刊的載文量對影響因子影響不顯著的結論;黃明睿[6]基于預防獸醫(yī)學及相關學科科技期刊數(shù)據(jù),對單刊的影響因子與載文量的關系進行了研究,認為二者呈顯著負相關;劉晨霞等[7]研究了論文載文量增長與期刊影響因子之間的關系,認為期刊的影響因子約31%可由載文量決定。此外,他們還發(fā)現(xiàn):當期刊10 年的載文量處于中等(載文量為300~700 篇)時,影響因子隨載文量的增大呈現(xiàn)出減小的趨勢;但當期刊10 年的載文量處于較少(載文量為106~300 篇)或較大(載文量為700~1 070 篇)時,期刊影響因子隨載文量的增大有增大的趨勢。然而,許力琴等[8]對71 種高校自然科學學報2010—2017 年的載文量進行了統(tǒng)計,認為載文量下降會導致期刊影響因子的下降。由此可知,不同期刊或同一期刊不同時間的選取對研究其載文量對期刊影響因子的影響應該會導致不同的研究結論。
科研工作者在研究載文量和期刊影響因子關系的同時,也有不少學者研究主題詞在文獻檢索中的作用以及如何對主題詞進行自動提取等問題[9-10]。主題詞是指能體現(xiàn)一篇論文或一部著作的中心概念的詞語,也指檢索資料時所查內容中必須有的詞語[11]。主題詞能夠幫助人們快速地了解、把握文檔主題及內容,以便人們高效地管理、檢索及閱讀文檔[12]。當前,隨著科學技術的迅速發(fā)展尤其是網絡的普及,各期刊的載文量隨時間的快速增長、出版周期的減少以及論文的迅速傳播,科技工作者已無法通覽其研究領域內的所有文獻。為了快速獲取所需文獻,人們通常利用主題詞從Web of Science、Scopus 和CNKI 等數(shù)據(jù)庫中查找到自己所需要的論文。
在自然科學研究中,有些主題詞橫跨多個學科,如物理學、化學、文獻計量學、環(huán)境科學、工程學和醫(yī)學等,比如半衰期,其在不同的學科領域意義也不盡相同。在文獻計量學中,Gosnell[13]在1944 年提出了文獻老化的半衰期概念。1958 年,Bernal 提出用半衰期來表征文獻情報老化速度(歷時半衰期)。1960 年,Burton 和Kebler[14]提出了共時法半衰期測度的方法,他們將文獻的半衰期定義為這樣一段時間:在此時間內已發(fā)表的某一學科領域內正在被利用的全部文獻中較新的一半,或目前所利用的文獻中較新的一半是在多長時間內發(fā)表的。由此可知,雖然半衰期這個主題詞在不同的學科中其含義存在差異,但是作為一個重要的參數(shù)已經被廣泛用于定量研究不同學科中有關現(xiàn)象的自然規(guī)律中。另一方面,在不同學科中,含有半衰期的載文量隨時間的增加符合什么規(guī)律,是線性增加,指數(shù)增加,還是先指數(shù)增加然后負指數(shù)下降等等,我們尚不清楚不同學科中含有主題詞半衰期的載文量對時間的響應遵循什么變化規(guī)律,還有待于進一步研究。而這些問題的深入研究對明晰含有重要主題詞的載文量對時間的響應規(guī)律具有重要的理論價值和現(xiàn)實意義。
因此,文章從含有主題詞的文獻載文量增長和文獻老化的角度出發(fā),利用主題詞半衰期在物理學、化學、環(huán)境科學、生物化學、工程學和文獻計量學等6 個學科領域出現(xiàn)的載文量對時間的響應規(guī)律,構建出特定主題詞載文量對時間的響應模型,指導學術資源建設和服務,以豐富文獻計量學理論和研究方法。
在2020 年3 月23—25 日,利用Web of Science平臺中所有數(shù)據(jù)庫檢索2000—2019 年間主題詞半衰期在物理學、化學、環(huán)境科學、工程學、生物化學和文獻計量學等6 個學科的載文量對時間的響應規(guī)律。20 年期間6 個學科中含主題詞半衰期的載文量分別為:9 007 篇、27 880 篇、10 400 篇、10 858篇、37 586 篇和432 篇(表1)。
表1 6 個學科中含主題詞半衰期的載文量(篇)
為了能真實地描述主題詞載文量對時間的響應規(guī)律,構建了一個載文量對時間的響應模型,即:
式中,N(t)是時間為t 時的載文量;t 為時間(單位:年);t0為起始時間(單位:年);a、b、c 和d 是4 個與時間無關的系數(shù)。簡單地對公式(1)進行數(shù)學分析可知,N(t)隨時間t 的增加而逐漸增加,達到極大值后又逐漸下降。
公式(1)的一階導數(shù)為:
如果公式(1)的一階導數(shù)等于0,那么公式(1)就有可能存在極點。假如N′(t)=0,如果用tmax表示
載文量峰值所對應的最大時間,則有:
如果載文量峰值用Nmax表示,則有:
由此可知,新構建的模型不僅可以直接給出載文量的峰值,并且還可以給出載文量峰值所對應的最大時間。
此外,由(1)式可知,當ce-d(t-t0)>1 時,則公式(1)將變?yōu)橹笖?shù)方程,即
如果b=0,則(1)式在形式上就將變?yōu)長ogistic模型。由此可知,Logistic 模型是公式(1)的特例。
邏輯斯蒂(Logistic)模型是比利時數(shù)學家Verhulst PF 提出來的一個數(shù)學模型,現(xiàn)在該模型已被廣泛用于生物學和科技文獻增長[15-22]等領域。該模型的具體表達式為:
其中K 為所允許的最大載文量;N0為t=t0時的載文量,r 為載文量的增長率。
可以求得公式(6)的一階導數(shù),且其一階導數(shù)恒大于0,因此,該函數(shù)是一個沒有極點的漸近線,所以無法得到載文量峰值所對應的最大時間。
文章是利用SPSS 18.5 進行數(shù)據(jù)處理,并利用公式(1)和邏輯斯蒂模型分別擬合主題詞半衰期出現(xiàn)在物理學、化學、環(huán)境科學、工程學、生物化學和文獻計量學等6 個學科的載文量對時間的響應數(shù)據(jù),并進行相關性分析。作圖由Origin 8.5 軟件完成,然后用Adobe Illustrator CS 5 進行圖形處理。
圖1 為物理學、化學、環(huán)境科學、工程學、生物化學和文獻計量學等6 個學科的載文量對時間的響應關系擬合曲線。由圖1 可知,物理和工程學中出現(xiàn)半衰期的載文量對時間的響應曲線類似,載文量隨時間的增加而逐漸增加,然后快速增加到最大值,最后載文量又隨時間的增加而快速下降;環(huán)境科學中出現(xiàn)半衰期的載文量隨時間的增加而逐漸上升到最大值,上升較為平緩,然后又逐漸下降;化學、生物化學和文獻計量學中出現(xiàn)半衰期的載文量對時間的響應趨勢介于上述兩者之間。此外,由圖1還可知,新構建的模型可以較好地反映6 個學科出現(xiàn)半衰期的載文量對時間的響應趨勢,且具有較高的確定系數(shù)(R2)。由圖1 可知,新構建的模型擬合化學學科中出現(xiàn)半衰期的載文量對時間響應曲線的擬合度最好,工程學次之,文獻計量學的曲線最差。同樣,邏輯斯蒂模型擬合化學學科的載文量對時間的響應曲線的擬合度最好,環(huán)境科學次之,生物化學最差。6 個學科中出現(xiàn)半衰期的載文量對時間的響應曲線與邏輯斯蒂模型的擬合曲線存在較大的差異,且與式(1)相比,其R2也較小。結果表明:邏輯斯蒂模型不能很好地擬合6 個學科出現(xiàn)半衰期載文量對時間的變化趨勢,其原因為邏輯斯蒂模型是一個沒有極點的函數(shù),不能真實地反映本文研究的載文量到達峰值后會隨時間增加而下降這種趨勢。
圖1 6 個學科中出現(xiàn)主題詞半衰期的載文量對時間的響應曲線
表2 給出了2 個模型分別擬合6 個學科中出現(xiàn)主題詞半衰期的載文量對時間的響應曲線,得到載文量峰值和對應的峰值時間2 個關鍵參數(shù)。由表2 可知,新構建的模型可以得到載文量峰值和對應的峰值時間2 個關鍵參數(shù),而邏輯斯蒂模型只能給出載文量峰值,不能給出峰值時間。然而,表2 的數(shù)據(jù)表明2 個模型給出的載文量峰值非常接近。
表2 2 個模型擬合6 個學科中出現(xiàn)主題詞半衰期的載文量對時間的響應曲線得到的2 個關鍵參數(shù)
通過Web of Science 平臺中所有數(shù)據(jù)庫檢索了2000—2019 年間主題詞半衰期在物理學、化學、環(huán)境科學、工程學、生物化學和文獻計量學等6 個學科載文量并進行統(tǒng)計分析,利用新構建的模型和邏輯斯蒂模型分別擬合了它們的載文量對時間的響應曲線,得出以下結論。
(1)新模型不僅可以很好地擬合主題詞半衰期在6 個學科中的載文量對時間的響應數(shù)據(jù),而且還可以直接給出它們的載文量峰值和對應的峰值時間。擬合結果表明,在2000—2019 年間,主題詞半衰期在文獻計量學中的載文量最小,年最大載文量僅為33 篇,而在數(shù)據(jù)庫里檢索到的年最大載文量僅為41 篇;在生物化學學科出現(xiàn)該主題詞的載文量最大,年最大載文量達到2 125 篇,而在數(shù)據(jù)庫里檢索到的年最大載文量達到2 224 篇。主題詞半衰期出現(xiàn)在其他學科的最大載文量介于這兩者之間。同時,新模型給出的最大載文量與觀測值相差很小,給出的峰值時間與觀測值非常接近。此外,從表1 可知,雖然主題詞半衰期在文獻計量學中尤其在文獻老化中是一個重要的術語[23-27],借助于該主題詞,人們可以從載文量或文獻的被引頻次等研究某學科、某期刊或單篇文獻的老化趨勢和文獻老化的成因等[28-32],但該主題詞的載文量在文獻計量學中并不多,這意味著國內外從事文獻老化研究的學者數(shù)量較少,還有待于進一步提高。
(2)從擬合結果來看,邏輯斯蒂模型只可以給出主題詞半衰期在6 個學科中的最大載文量,但擬合曲線與觀測點之間存在較大的差異,且該模型不能反映該主題詞載文量隨時間的響應變化趨勢。這是由于該模型是一條沒有極點的漸近線。此外,該模型尚不能給出載文量最大時的峰值時間。所以,雖然該模型被廣泛應用于文獻增長規(guī)律的研究,但在應用邏輯斯蒂模型研究主題詞載文量時需要注意其適用范圍。
(3)新構建的模型比邏輯斯蒂模型和指數(shù)方程更具有普適性。因為在特定的條件下,如當ce-d(t-t0)>1時,該模型可以簡化為指數(shù)方程。此外,如果取b=0,新模型則將退化為Logistic 模型,Logistic 模型是新模型的特例。由此可知,新模型可以為文獻增長和文獻老化的研究提供一個可供選擇的數(shù)學工具。