孔紅蕊
南陽醫(yī)專圖書館,河南南陽 473000
大數(shù)據(jù)視角下學(xué)術(shù)期刊核心作者群的測(cè)評(píng)
——以《圖書館雜志》為例
孔紅蕊
南陽醫(yī)專圖書館,河南南陽473000
利用《中國學(xué)術(shù)期刊(網(wǎng)絡(luò)版)》,采用綜合指數(shù)法對(duì)《圖書館雜志》核心作者進(jìn)行測(cè)評(píng),進(jìn)而揭示《圖書館雜志》核心作者隊(duì)伍的特征。
大數(shù)據(jù);圖書館雜志;核心作者
選擇《中國學(xué)術(shù)期刊(網(wǎng)絡(luò)版)》(CAJ-N)數(shù)據(jù)庫作為本文統(tǒng)計(jì)數(shù)據(jù)的來源。選擇“刊名”字段,輸入檢索式“刊名=圖書館雜志”,“精確匹配”,時(shí)間限制在“2006-2015年”。依據(jù)檢索條件,CAJ-N數(shù)據(jù)庫提供的檢索結(jié)果為3 076條數(shù)據(jù),將得到的題錄數(shù)據(jù)從CAJ-N全部下載并導(dǎo)入到NoteExpress文獻(xiàn)管理軟件,通過查重和對(duì)不符合研究的題錄數(shù)據(jù)進(jìn)行清洗(剔除323條),最終得到2 753條題錄數(shù)據(jù)。
目前,在核心作者研究的評(píng)價(jià)方面,學(xué)術(shù)界尚未建立學(xué)科領(lǐng)域核心作者的統(tǒng)一標(biāo)準(zhǔn)。由于采用的標(biāo)準(zhǔn)不同,諸多研究結(jié)果或多或少存在商榷之處。早期的研究往往只考慮單一指標(biāo),如作者的發(fā)文量、被引頻次、H指數(shù)等。通過對(duì)大量核心作者測(cè)評(píng)的文獻(xiàn)的梳理,綜合吸收具有一定實(shí)際意義的研究結(jié)果,筆者總結(jié)出核心作者理應(yīng)包含兩大顯著特征:較高的發(fā)文量和被引頻次,二者不能顧此失彼。為此,本文同時(shí)選擇既能反映作者科研生產(chǎn)力的學(xué)術(shù)論文發(fā)文量指標(biāo)又能反映作者成果影響力的論文被引頻次指標(biāo)分別考察作者學(xué)術(shù)地位的不可替代性及作者影響力的大小。學(xué)術(shù)論文發(fā)表數(shù)量大,反映作者在科研生產(chǎn)力方面具有較強(qiáng)科研創(chuàng)造能力,這是衡量具備核心作者的“先天條件”。論文被引用,說明該論文對(duì)他人的研究起到了幫助作用,該論文成果對(duì)社會(huì)或經(jīng)濟(jì)帶來了一定的學(xué)術(shù)效益,這是衡量具備核心作者的“后天條件”。2個(gè)條件的具備,則評(píng)選出的“核心作者”可以稱得上具有一定的權(quán)威性和說服力。
2.1從發(fā)文量角度遴選核心作者候選人
遴選依據(jù)是文獻(xiàn)計(jì)量學(xué)中美國著名的科學(xué)史學(xué)家普賴斯(PRICED)在1969年發(fā)表的《小科學(xué),大科學(xué)》一書中提出的普賴斯定律,定律計(jì)算公式為:(m為發(fā)文量較高的臨界點(diǎn),n是所統(tǒng)計(jì)的作者中最大發(fā)文量的篇數(shù))。2006—2015年《圖書館雜志》發(fā)文量最多的作者是黃國彬(16篇)。依據(jù)普賴斯公式:,根據(jù)取整原則得,m=3,也就是說發(fā)表3篇及以上論文的作者被確定為核心作者的候選人,共計(jì)275位。
2.2從論文被引頻次角度遴選核心作者候選人
分別計(jì)算出275位作者在2006-2015年間發(fā)表的全部論文的被引頻次之和。經(jīng)過統(tǒng)計(jì)得到,論文被引頻次之和最大的作者是郭晶,總被引頻次為218次,借鑒普賴斯定律測(cè)定出核心作者候選人的最低總被引頻次分界點(diǎn)為:,由取整原則,m=12,也就是說論文總被引頻次在12次及以上的作者被確定為核心作者的候選人。對(duì)符合最低發(fā)文量和最低總被引頻次兩個(gè)指標(biāo)的作者進(jìn)行比對(duì)查重后,最終確定的核心作者候選人共計(jì)174位。
運(yùn)用綜合指數(shù)法測(cè)定核心作者共分4步來完成:第一步,計(jì)算平均指數(shù)。借鑒普賴斯定律遴選出核心作者候選人,運(yùn)用綜合指數(shù)法對(duì)核心作者候選人的綜合學(xué)術(shù)水平值進(jìn)行精確計(jì)算時(shí)須考慮兩個(gè)指數(shù)(發(fā)文平均指數(shù)和被引平均指數(shù));第二步,確定權(quán)重值。對(duì)發(fā)文平均指數(shù)和被引平均指數(shù)賦予權(quán)重值;第三步,設(shè)定閥值。對(duì)測(cè)算出的核心作者候選人的綜合指數(shù)值的閥值進(jìn)行設(shè)定,凡是大于該閥值的候選人才能被確定為核心作者,反之則相反;第四步,對(duì)核心作者進(jìn)行排序。在確定的核心作者群中,按照每一位核心作者綜合指數(shù)值的大小由高到低進(jìn)行排名。
3.1發(fā)文平均指數(shù)和被引平均指數(shù)
1)發(fā)文平均指數(shù)。發(fā)文平均指數(shù)(X),定義表述為“所有核心作者候選人的發(fā)文平均值”。2006-2015年《圖書館雜志》174位核心作者候選人發(fā)文量共計(jì)802篇,因此,發(fā)文平均指數(shù)為4.61。
2)被引平均指數(shù)。被引平均指數(shù)(Y),定義表述為“所有核心作者候選人的被引平均值”。2006-2015年《圖書館雜志》174位核心作者候選人發(fā)表的論文共被引頻次為7 507次,因此,被引平均指數(shù)為43.14。
3.2發(fā)文指數(shù)和被引指數(shù)的權(quán)重值的確定
以往研究者對(duì)作者生產(chǎn)力評(píng)價(jià)的關(guān)注遠(yuǎn)高于其影響力評(píng)價(jià),將發(fā)文量和被引頻次2個(gè)指標(biāo)權(quán)重設(shè)為0.7和0.3,或0.6和0.4,這種權(quán)重的設(shè)置只注重了學(xué)術(shù)成果的“量”的累積,而忽視了“質(zhì)”的評(píng)估。通常情況下,作者的發(fā)文量和其被引頻次相關(guān)性較差[1]。利用相關(guān)函數(shù)得到174位核心作者候選人的發(fā)文量和被引頻次之間的相關(guān)關(guān)系函數(shù)圖象(如圖1)。計(jì)算得R=0.50596443,根據(jù)統(tǒng)計(jì)學(xué)知識(shí),174位核心作者候選人的發(fā)文量和被引頻次之間呈中度相關(guān)(0.4<R<0.6)。因此,在運(yùn)用發(fā)文量和被引量兩個(gè)指標(biāo)對(duì)核心作者進(jìn)行測(cè)評(píng)時(shí)應(yīng)同時(shí)考慮作者的論文數(shù)量和質(zhì)量,賦予兩者同樣重要的評(píng)價(jià)程度。為此,本文將發(fā)文數(shù)量和被引頻次權(quán)重值分別定為0.5和0.5。
3.3綜合指數(shù)閥值的設(shè)定
表1 綜合指數(shù)法測(cè)定的核心作者
綜合指數(shù)值越大,說明作者的學(xué)術(shù)水平越高,對(duì)《圖書館雜志》所做的貢獻(xiàn)和努力也就越大。運(yùn)用綜合指數(shù)法計(jì)算公式(公式1)精準(zhǔn)得出每一位核心作者候選人的綜合學(xué)術(shù)水平值。對(duì)測(cè)算出的核心作者候選人的綜合指數(shù)值的閥值進(jìn)行設(shè)定,凡是大于該閥值的候選人才能被確定為核心作者,反之則相反;此處的閥值也稱綜合指數(shù)的平均值,由公式1計(jì)算得到本文的閥值計(jì)算結(jié)果為100。也即是當(dāng)某一候選核心作者的綜合指數(shù)高于100則可標(biāo)記為核心作者。本文最終確定的核心作者共有61位。結(jié)果見表1。
4.1核心作者隊(duì)伍已初具規(guī)模,但核心作者群尚未形成
2006—2015年《圖書館雜志》已建成了一支高水平的科研隊(duì)伍,一些在圖書情報(bào)界有著非常重要影響力的核心作者(如吳建中、王世偉、王知津、徐雁、鄭建明、侯漢清、王子舟、姜愛蓉、肖希明)對(duì)《圖書館雜志》研究水平的推動(dòng)和發(fā)展做出了杰出的貢獻(xiàn)。然而,61位核心作者約占核心作者候選人總數(shù)的1.52%,61位核心作者共發(fā)表論文388篇,占全部論文總數(shù)的14.09%,這一結(jié)果遠(yuǎn)遠(yuǎn)未達(dá)到普賴斯定律的理論值(50%),這在一定程度上說明《圖書館雜志》核心作者群尚未形成。
4.2核心作者的所屬機(jī)構(gòu)或地區(qū)具有“地域性”特征
由研究統(tǒng)計(jì)得知,61位核心作者所屬地區(qū)主要集中在上海(20人)、北京(15人)、南京(12人);核心作者研究機(jī)構(gòu)排在前3位的是上海交通大學(xué)圖書館(7人)、南京大學(xué)信息管理學(xué)院(6人)、復(fù)旦大學(xué)圖書館(4人)。從作者機(jī)構(gòu)或地區(qū)來看,《圖書館雜志》擁有的核心作者具有很明顯的“地域性”。
4.3核心作者的發(fā)文量與被引頻次分布呈現(xiàn)無相關(guān)關(guān)系
文章對(duì)最終測(cè)定的38位核心作者的發(fā)文量和總被引頻次之間的關(guān)聯(lián)程度進(jìn)行統(tǒng)計(jì)分析,得到相關(guān)函數(shù)Y=3.499X+55.56(R2=0.058)。根據(jù)相關(guān)函數(shù)計(jì)算公式,得到R=0.24083189(R∈(0.0-0.3)區(qū)間),由此推出,38位核心作者的發(fā)文量與被引頻次之間是呈低度相關(guān)的。進(jìn)一步說明了測(cè)評(píng)核心作者單單依靠發(fā)文量指標(biāo)是不科學(xué)的,必須結(jié)合發(fā)文量和被引頻次2個(gè)指標(biāo)同時(shí)滿足一定條件的情況才能得出相對(duì)比較科學(xué)的研究結(jié)果。
[1]李宗紅.利用綜合指數(shù)測(cè)評(píng)期刊的核心著者——以《中國科技期刊研究》為例[J].中國科技期刊研究,2008,19(1):54-56.
G2
A
1674-6708(2016)166-0039-02
本文為2015年南陽市科技局軟科學(xué)項(xiàng)目“科學(xué)計(jì)量學(xué)視角下南陽市高校哲學(xué)社會(huì)科學(xué)高水平人才測(cè)評(píng)研究”(2015RKX24)和2016年度南陽醫(yī)專校級(jí)課題“文獻(xiàn)計(jì)量學(xué)視角下我??蒲谐晒膭?chuàng)新分布研究”(2016NYYZ011)的研究成果之一。
孔紅蕊,南陽醫(yī)專圖書館。