龔舒野
(南通航運(yùn)職業(yè)技術(shù)學(xué)院圖書館,江蘇南通 226010)
下載頻次角度的h指數(shù)研究
——以圖書館學(xué)情報學(xué)核心期刊為例
龔舒野
(南通航運(yùn)職業(yè)技術(shù)學(xué)院圖書館,江蘇南通 226010)
文章基于下載頻次角度提出了評價期刊的hd指數(shù),并以中國知網(wǎng)(CNKI)為數(shù)據(jù)源,選擇圖書館學(xué)情報學(xué)核心期刊為研究對象,通過實(shí)證研究說明了hd指數(shù)在評價學(xué)術(shù)期刊方面的科學(xué)性和合理性,并探討了影響期刊hd指數(shù)的因素。
h指數(shù);hd指數(shù);期刊評價
2005年,美國物理學(xué)家J.E.Hirsch提出了一種新的文獻(xiàn)計量方法—h指數(shù)(h-index),并利用h指數(shù)對學(xué)者個人的學(xué)術(shù)成就進(jìn)行評價。Hirsch將h指數(shù)定義如下:如果一位學(xué)者發(fā)表的NP篇學(xué)術(shù)論文中有h篇學(xué)術(shù)論文,這h篇學(xué)術(shù)論文中每一篇論文的被引次數(shù)均大于等于h,并且其余論文中每一篇論文的被引次數(shù)均小于h,則這位學(xué)者的h指數(shù)為h。[1]
h指數(shù)的提出,立即引起學(xué)術(shù)界的廣泛注意,美國的《自然》雜志也對h指數(shù)進(jìn)行了相關(guān)報道。[2]眾多的學(xué)者、機(jī)構(gòu)將h指數(shù)運(yùn)用于各自的評價活動。布勞溫等人在評價期刊影響力時使用了h指數(shù),并對期刊h指數(shù)進(jìn)行了定義:對于一種期刊,如果刊載的論文中有h篇論文,這h篇論文每篇被引用次數(shù)至少為h,同時h為自然數(shù)并且為最大,則h為該期刊的h指數(shù)。[3,4]魯索在研究期刊h指數(shù)時發(fā)現(xiàn)不同期刊的載文量存在差異,由此可能導(dǎo)致不同期刊間h指數(shù)缺乏可比性,并提出期刊相對h指數(shù)的概念,即將期刊h指數(shù)除以對應(yīng)載文量。[5]
盡管h指數(shù)已經(jīng)被用于多領(lǐng)域評價并取得不少成果,但由于h指數(shù)自身的原因,也存在一定的不足,主要表現(xiàn)在以下五個方面:第一,h指數(shù)是從引文角度進(jìn)行評價,資深研究人員比新研究人員的優(yōu)勢大得多;第二,當(dāng)h指數(shù)相同時,不能對被評對象進(jìn)行區(qū)分;第三,當(dāng)科研成果以團(tuán)隊(duì)形式發(fā)表時,不能體現(xiàn)個人在其中的貢獻(xiàn);第四,h指數(shù)受引文數(shù)據(jù)庫的影響較大,不同數(shù)據(jù)庫得出的結(jié)果會有差異;第五,不能區(qū)分被引情況,即被引是他引還是自引?;谏鲜鰄指數(shù)存在的缺點(diǎn),有學(xué)者對h指數(shù)進(jìn)行擴(kuò)展,引申出基于下載頻次的h指數(shù)。
Hirsch提出的h指數(shù)是用來考察被引頻次,即從被引的角度來評價學(xué)者的學(xué)術(shù)貢獻(xiàn)等作用,為了區(qū)分,本文把期刊h指數(shù)定義為期刊hc指數(shù)。雖然基于被引頻次的期刊hc指數(shù)能夠很好地反映一份學(xué)術(shù)期刊的質(zhì)量,但期刊論文的下載頻次在一定程度上也能反映出該期刊的影響力?;谄诳痟c指數(shù)的定義,可以將對基于下載頻次的h指數(shù)做如下定義:對于一種期刊,如果刊載的論文中有h篇論文,這h篇論文每篇被下載次數(shù)至少為h,同時h為自然數(shù)并且為最大,則h為該期刊的h指數(shù)。為了與基于被引頻次的h指數(shù)區(qū)分,將基于下載頻次的h指數(shù)定義為期刊hd指數(shù)。
2.1 數(shù)據(jù)選擇
本文選擇北大版《中文核心期刊要目總覽》(2011年版)中的“G25圖書館事業(yè)、信息事業(yè)類核心期刊表”中的19種核心期刊為研究對象,以中國知網(wǎng)的“中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫”及“中國引文數(shù)據(jù)庫”為數(shù)據(jù)來源進(jìn)行研究。[6]為了便于比較研究,本文選定從2001-2011年間上述19種期刊刊載的論文,于2013年4月17日采集數(shù)據(jù)。
2.2 hd指數(shù)分析
表1對18種北大版核心期刊的若干項(xiàng)指標(biāo)進(jìn)行了匯總統(tǒng)計。從數(shù)據(jù)匯總情況看,18種期刊的hd指數(shù)的范圍是227-452。其中《情報雜志》的hd指數(shù)最高,說明共有452篇文論至少被下載了452次;《國家圖書館學(xué)刊》的hd指數(shù)最低,說明共有227篇論文至少被下載了227次。從數(shù)值上看,《情報雜志》具有廣泛的影響力,在圖書情報界已被廣泛認(rèn)可。[7]
從hd指數(shù)和hc指數(shù)數(shù)值本身看,hd指數(shù)具有以下兩個特點(diǎn):一是數(shù)值較大,二是數(shù)值重復(fù)現(xiàn)象較少。hd指數(shù)的取值范圍為227-452,hc指數(shù)的取值范圍為29-65。hd指數(shù)平均為hc指數(shù)的7倍。在統(tǒng)計的18種期刊中,《圖書館雜志》和《圖書情報知識》的hd指數(shù)均為311,《圖書館論壇》和《現(xiàn)代圖書情報技術(shù)》的hd指數(shù)均為315,出現(xiàn)了相同的分值。同時,觀察hc指數(shù)分值就會發(fā)現(xiàn),出現(xiàn)相同分值的情況更多。這一現(xiàn)象在其他文獻(xiàn)中更明顯。出現(xiàn)分值相同的時候,期刊的區(qū)分度則會大大降低,對于期刊評價則會帶來一定的困難,從而降低該指標(biāo)的評價功能。hd指數(shù)和hc指數(shù)相比,雖然hd指數(shù)也出現(xiàn)了同分值,但由于下載頻次相對于被引頻次更活躍,也就是說hd指數(shù)的變化更敏銳,因此hd指數(shù)在期刊評價時具有一定的優(yōu)勢。
表1 核心期刊數(shù)據(jù)統(tǒng)計匯總表
2.3 hd指數(shù)與核心期刊排名分析
北大版《中文核心期刊要目總覽》至今已出版6版,第6版由北京大學(xué)圖書館等27個單位的108位專家和工作人員參加研究,全國各地8 000余位學(xué)科專家參加了核心期刊表的評審工作,其研究成果具有較高的科學(xué)性、準(zhǔn)確性和可靠性。將hd指數(shù)與核心期刊進(jìn)行對比分析,對于研究hd指數(shù)在期刊評價中的科學(xué)性和合理性具有一定借鑒意義。
表1中的數(shù)據(jù),正數(shù)表示排名上升,負(fù)數(shù)表示排名下降,0表示排名未變化。從表1中匯總數(shù)據(jù)看,2種期刊排名未變化,3種期刊排名變化浮動為1,1種期刊排名變化浮動為2,1種期刊排名變化為3,即接近1/ 2的期刊排名變化較小,說明hd指數(shù)在一定程度上能夠?qū)ζ诳u價產(chǎn)生正面影響。但是,另外有四種期刊的排名變化浮動在8以上,最多的達(dá)到-12,說明hd指數(shù)與核心期刊的排名存在一定程度的偏離。
2.4 hd指數(shù)與其它指標(biāo)相關(guān)性分析
表1中的Nd代表某期刊在統(tǒng)計期間內(nèi)的總下載量,其數(shù)值范圍為167 441-1 345 621。總下載量是個直觀的指標(biāo),很容易從數(shù)據(jù)庫中獲得??傁螺d量在衡量期刊的影響力方面容易被大家所接受,但是總下載量卻具有很大的隨意性和不確定性。隨著時間的推移,即使經(jīng)過較短的時間,這個指標(biāo)的數(shù)值也會發(fā)生變化。通過計算單篇最高下載量與總下載量的比值發(fā)現(xiàn),有兩種期刊的結(jié)果超過分別為1%和1.17%,其余期刊的比值均在1%以下,最小值0.269%,數(shù)值的差距較大。這說明單篇論文的高下載頻次會極大的影響到總下載量。同時,總下載量只是簡單地提供了下載量這個信息,至于期刊中哪些論文對總下載量做出哪些貢獻(xiàn)卻無法明確。通過統(tǒng)計單篇最高下載量這個指標(biāo)可以得出期刊刊載的論文中最受讀者關(guān)注的是哪篇論文,但無法明確期刊總影響力和質(zhì)量。通過統(tǒng)計發(fā)現(xiàn),每種期刊在相同統(tǒng)計期刊內(nèi)載文量是不同的,這也客觀上造成了期刊總下載量的差異。篇均下載頻次這個指標(biāo)能夠很好地克服載文量不同對下載量的影響,但對于區(qū)分期刊影響力貢獻(xiàn)不大。
期刊hd指數(shù)能很好得揉合載文量、總下載量、單篇最高下載量等幾個指標(biāo),具有一定的優(yōu)勢。第一,數(shù)值較穩(wěn)定。雖然網(wǎng)絡(luò)環(huán)境下論文的下載行為成為一種常態(tài),基于下載量的hd指數(shù)就會因?yàn)橄螺d行為而發(fā)生變化。但從hd指數(shù)設(shè)計的原理上看,短時間內(nèi)能夠改變hd指數(shù)數(shù)值的論文只局限在hd指數(shù)附近的若干篇。因此hd指數(shù)具有較高的穩(wěn)定性。第二,能夠提供較多的信息。從hd指數(shù)的定義上看,hd指數(shù)試圖尋找期刊載文和單篇下載頻次之間的平衡點(diǎn)。因此獲取hd指數(shù)數(shù)值的同時,還能獲得該期刊的高被關(guān)注論文。例如,《中國圖書館學(xué)報》的hd指數(shù)390,就是說《中國圖書館學(xué)報》的刊載論文中有390篇論文的下載頻次大于等于390,同時還能看出到底哪些論文對hd指數(shù)做出了貢獻(xiàn)。
筆者利用SPSS18.0統(tǒng)計分析軟件,將表1中hd指數(shù)分別與載文量(N)、總下載量(Nd)、單篇最高下載量(Ntop)、篇均下載頻次(Ntop/N)及hc指數(shù)進(jìn)行相關(guān)性分析。分析結(jié)果如下:hd指數(shù)與N在0.01水平上相關(guān)性顯著,Pearson相關(guān)系數(shù)為0.594;hd指數(shù)與Nd在0.01水平上相關(guān)性顯著,Pearson相關(guān)系數(shù)為0.868;hd指數(shù)與Ntop在0.01水平上相關(guān)性顯著,Pearson相關(guān)系數(shù)0.714;hd指數(shù)與Ntop/N不相關(guān);hd指數(shù)與hc指數(shù)在0.01水平上相關(guān)性顯著,Pearson相關(guān)系數(shù)為0.684。從分析結(jié)果看,除hd指數(shù)與Ntop/N不相關(guān)外,hd指數(shù)與其余評價指標(biāo)均相關(guān),其中相關(guān)系數(shù)最高的0.868,最低的為0.594,這一結(jié)果與預(yù)期相符合。從分析結(jié)果看,hd指數(shù)在一定程度上能夠?qū)ζ诳绊懥M(jìn)行闡釋,并且能夠引導(dǎo)學(xué)術(shù)期刊走上從“量”轉(zhuǎn)換到“質(zhì)”的發(fā)展軌道。
從hd指數(shù)的定義看,hd指數(shù)與hc指數(shù)均能反映一種學(xué)術(shù)期刊的學(xué)術(shù)影響力及期刊質(zhì)量,并且兩者之間存在一定的相關(guān)性,說明這兩個指數(shù)可以從不同的角度對期刊進(jìn)行評價。但hd指數(shù)也有其特定的個體影響應(yīng)當(dāng)在期刊評價時引起注意。
3.1 全文數(shù)據(jù)庫對hd指數(shù)的影響
從本文獲取hd指數(shù)的過程看,全文數(shù)據(jù)庫是準(zhǔn)確獲取hd指數(shù)的關(guān)鍵。而全文數(shù)據(jù)庫收錄學(xué)術(shù)期刊的時間與紙質(zhì)期刊出版的時間不可避免地存在著時間差。隨著學(xué)術(shù)交流的加速和頻繁,人們對期刊論文的時效性提出了更高的要求。期刊論文在出版的最初一段時間會引起學(xué)者的廣泛關(guān)注。突出表現(xiàn)為在最初的一段時間內(nèi)被大量下載。如果全文數(shù)據(jù)庫能夠在最短時間內(nèi)刊載最新的期刊論文,則能夠在“關(guān)注高峰期”內(nèi)被學(xué)者獲取,從而使得hd指數(shù)保持合理性。
3.2 檢索系統(tǒng)對hd指數(shù)的影響
全文數(shù)據(jù)庫在保證及時收錄期刊論文的同時,其檢索系統(tǒng)的高效、便利及智能化也是影響hd指數(shù)的因素之一。衡量一個檢索系統(tǒng)通常有查全率、查準(zhǔn)率、響應(yīng)時間、新穎性、可存取性、收錄范圍、使用方便性等幾個方面。一個高效、便利及智能化的檢索系統(tǒng)可以幫組用戶在最短的時間內(nèi)、準(zhǔn)確地獲取滿足用戶需求的信息。
3.3 下載動機(jī)對hd指數(shù)的影響
在考察hd指數(shù)過程中,無法避免用戶復(fù)雜的下載動機(jī)這個因素。用戶檢索論文的動機(jī)不同,會造成論文下載頻次的巨大差異,從而影響hd指數(shù)的數(shù)值。部分用戶是為了獲取某個研究領(lǐng)域全部的信息,從而大量下載該領(lǐng)域的論文;部分用戶在研究過程中為了解決某個具體問題而對該主題論文集中下載并研究;部分論文屬于應(yīng)用型或介紹型論文,對某特定問題提供參考解決方案,會有較高的下載頻次,但被引用的可能性較低。客觀上影響hd指數(shù)的因素較多,這些因素會“人為”加大下載頻次。但真正對hd指數(shù)產(chǎn)生實(shí)質(zhì)的、長期影響的因素依然是學(xué)術(shù)期刊所刊載論文本身的質(zhì)量和價值。只有不斷刊載高質(zhì)量論文,才能引起廣大學(xué)者的注意,不斷地下載并引用論文,hd指數(shù)才能真正地提高。
本文從論文下載頻次的角度審視h指數(shù),并以圖情專業(yè)核心期刊為樣本進(jìn)行實(shí)證研究。研究結(jié)果表明,基于下載頻次的hd指數(shù)能夠在一定程度上反映期刊的質(zhì)量,與部分傳統(tǒng)的期刊評價指標(biāo)具有一定的相關(guān)性,并且可以將hd指數(shù)作為評價期刊的一項(xiàng)指標(biāo)。但本研究的實(shí)證數(shù)據(jù)僅僅來源于圖情專業(yè)核心期刊,所選擇的數(shù)據(jù)庫僅為中國知網(wǎng)的“中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫”及“中國引文數(shù)據(jù)庫”。為了更好地研究hd指數(shù)在評價期刊時的科學(xué)性和有效性,以及與期刊指標(biāo)的關(guān)系,還應(yīng)該開展多學(xué)科、大樣本的統(tǒng)計與分析。
[1]J.E.Hirsch.An index to quantify an individual's scientific output[J].Proceeding of the National Academy of Sciences of the United States of America,2005(46):16569-16572.
[2]BALL P.Index aims for fair ranking of scientists[J].Nature,2005(7053):900.
[3]Cronin B.Machos L.Using the h-Index to Rank Influential Information Scientists[J].Journal of the American Society for Information Science and Technology,2006(9):1275-1278.
[4]Braun T,Grazel W,Schugert A.A Hirsch-type index for journals[J].The Scientist,2005(22):8.
[5]Rousseau R.案例研究:美國信息學(xué)會會刊h指數(shù)的時間序列變化[J].科學(xué)觀察,2006(1):16-17.
[6]許新軍.H指數(shù)對電子期刊影響力的解析—以圖書館學(xué)情報學(xué)期刊為例[J].情報雜志,2011(5):63-67.
[7]龔舒野.基于h指數(shù)和hm指數(shù)的《情報科學(xué)》核心作者分析[J].情報科學(xué),2013(1):82-85,95.
Research on the Hd-index for Downloading Frequency——Taking the Core Periodicals of Library Science and Information Science as a Case of Study
GONG Shu-ye
(Library,Nantong Vocational&Technical Shipping College,Nantong 226010,China)
Based on downloading frequency,this article proposes the hd-index for periodical evaluation.In addition,taking CNKI as its data source and core periodicals of library science and information science as its object of study,it demonstrates the scientificity and rationality of hd-index in evaluating academic journals as well as studies the factors affecting the hd-index.
H-index;hd-index;Journal evaluation
G250.2
A
1671-9891(2014)01-0098-04
10.3969/j.issn.1671—9891.2014.01.025
2013-08-21
龔舒野(1981—),男,江蘇南通人,南通航運(yùn)職業(yè)技術(shù)學(xué)院圖書館館員,碩士。