郭鳳嬌 孫劭敏
(山東理工大學科技信息研究所,淄博 255049)
全球化時代的到來不僅是生產(chǎn)貿(mào)易的全球化,更是科學研究的全球化[1],科研工作者應有國際化的科研眼光,立足于一個良好的國際學術交流平臺并得到國際同行的認可[2]。中國學者也日益重視在國際刊物上發(fā)表學術論文,以提高研究機構、學術成果乃至學者個人的國際影響力。在ESI中,按國家/地區(qū)路徑查看引文排名(citation rankings)發(fā)現(xiàn),近十年中國(不含港澳臺地區(qū))被ISI Web of Science(SCIE/SSCI)收錄的學術論文總量和總被引次數(shù)僅次于美國[3],是世界上第二大SCIE/SSCI學術論文產(chǎn)出國家??梢姡趪H學術論文發(fā)表總量和總被引次數(shù)上,中國已經(jīng)超過英國、法國等歐洲國家,成為科學研究大國。然而,中國的社會科學學科發(fā)展過程中一直存在國際化和本土化的矛盾,相比自然科學來說,更重視本土化,使得中國社會科學研究在國際學術界的聲音比較微弱[4]。
社會科學學術論文作為社會科學研究成果的主要載體,能夠反映一個國家/地區(qū),乃至全球的社會科學研究發(fā)展狀況和水平[5]。因此,對中國SSCI論文的客觀研究,能反映中國社會科學研究國際化發(fā)展的狀況和水平。目前關于中國SSCI論文的研究主要集中在4個方面:①對SSCI論文評價的理論性思考研究[6];②對國家/地區(qū)或研究機構的SSCI論文的定量研究[7-8];③對某學科領域SSCI論文的定量研究[9];④對SSCI論文合作情況的研究[10-11]。
隨著期刊開放存取平臺及社交網(wǎng)絡迅速發(fā)展,科研人員的交流渠道及科研成果的傳播方式都發(fā)生巨大變化,新媒體環(huán)境中學術論文的大量非正式傳播與討論促進了學術論文影響力評價的發(fā)展[12]。基于社交軟件與基于成果使用率的新型指標——Altmetrics指標,為學術論文評價體系帶來新的維度[13]。伴隨著Altmetrics的誕生,也涌現(xiàn)出多種Altmetrics應用工具,本文將利用Altmetric.com公司的Altmetric Explore[14]獲取中國SSCI論文的Altmetrics指標數(shù)據(jù),從指標情況和影響因素兩個維度對中國SSCI論文的Altmetrics指標特征進行分析,以揭示中國SSCI論文獲得在線關注情況。
以Web of Science核心合集的SSCI數(shù)據(jù)庫為數(shù)據(jù)來源,按地址路徑檢索“China”,時間不限。在檢索結果界面,按照文獻類型選擇“article”和“proceedings paper”進行精煉,共得到78 899篇論文,把最終檢索結果保存為全記錄格式并下載。得到初始數(shù)據(jù)后,刪除文獻類型為非“article”和非“proceedings paper”的論文,以及“作者地址”和“通信作者地址”字段均非中國地址的論文數(shù)據(jù),最終得到77 168條學術論文數(shù)據(jù)。
獲取學術論文Altmetrics指標數(shù)據(jù)的具體方法:首先提取論文數(shù)據(jù)的D O I字段,然后把D O I導入Altmetric Explore進行查詢,最后在個人機構庫中保存查詢結果并輸出。本文77 168條論文數(shù)據(jù)中,部分論文的DOI字段值缺失,其中含DOI的學術論文共有69 543篇,占學術論文總量的90.12%。將69 543篇學術論文的DOI分批導入Altmetric Explore進行檢索,共獲得含Altmetrics指標數(shù)據(jù)的24 173篇學術論文,保存并輸出,構成本文研究數(shù)據(jù)集。
Altmetric Explore包含新聞報道數(shù)等17個指標,為便于對指標分析,筆者按照指標數(shù)據(jù)的來源性質(zhì),將17個指標劃分為在線社交媒體類指標、在線政策文件與主流媒體類指標、在線文獻管理軟件類指標及其他在線資源類指標4個類別。考慮到Altmetric.com公司成立于2011年,數(shù)據(jù)回溯時間不確定,以及學術論文老化,發(fā)表較早的學術論文很難再獲得關注,本節(jié)僅選取發(fā)表在2012年以后的18 555篇具有Altmetrics指標數(shù)據(jù)的論文進行研究,占本文數(shù)據(jù)集總量的76.76%。對4個來源類別的17個指標的最大值、最小值、指標值總和、非0值論文數(shù)以及覆蓋率進行統(tǒng)計,Altmetrics指標基本情況見表1。
表1 Altmetrics指標基本情況
通過對Altmetrics指標基本情況統(tǒng)計,發(fā)現(xiàn)微博帖子數(shù)、領英帖子數(shù)、研究推薦平臺數(shù)、音像數(shù)、Q&A問答數(shù)、訂閱數(shù)以及開放教學大綱數(shù)等7個指標的非0值論文數(shù)較少,覆蓋率均不足1%,后續(xù)研究中將不再考慮這7個指標。對于剩余指標,借助相關性分析方法挖掘指標間關系及指標與被引頻次關系。當前對Altmetrics指標關系的相關研究多集中在Altmetrics指標與被引頻次、Altmetric Attention Score等關系的揭示[15-17],少量已有對Altmetrics指標間關系的研究僅是對指標間相關系數(shù)數(shù)值的描述[18],缺乏對指標數(shù)據(jù)來源影響的探討。筆者將結合前文對指標數(shù)據(jù)來源的分類,對Altmetrics指標間關系進行深入挖掘。
為選擇適合的相關性分析方法,對所有指標進行Kolmogorov-Smirnov單樣本非參數(shù)正態(tài)分布檢驗,檢驗發(fā)現(xiàn)11個指標的漸進顯著性水平都為0,拒絕原假設,因此選用Spearman相關性分析方法。限于篇幅,Spearman相關分析結果在本文不予展示。進一步對Spearman相關分析結果進行整理,得到指標間相關強度情況,見表2。
表2 指標間相關強度情況
表2中,在相關強度列,Sig值大于0.05時,兩指標相關性不顯著。Sig值小于0.05情況下,相關系數(shù)|r|<0.2時,兩指標極弱相關;相關系數(shù)|r|[0.2,0.4)時,兩指標弱相關;相關系數(shù)|r|[0.4,0.6)時,兩指標中度相關;相關系數(shù)|r|[0.6,0.8)時,兩指標強相關;相關系數(shù)|r|>0.8時,兩指標極強相關。
對表2進行分析可以發(fā)現(xiàn),11個指標共構成55組相關關系(45組Altmetrics指標間關系,10組Altmetrics指標與被引頻次關系),其中,臉譜網(wǎng)帖子數(shù)和政策文件數(shù)等7組Altmetrics指標互不相關,且7組指標中僅有同行評審數(shù)和維基百科頁面數(shù)組指標來源于同類別;呈極弱相關關系的34組Altmetrics指標中,有8組指標來源于同類別,約占該組關系指標數(shù)的23.53%;呈弱相關關系的4組Altmetrics指標中,有3組指標來源于同類別,占該組關系指標數(shù)的75.00%;Altmetrics指標間相關系數(shù)均小于0.4,不存在中度相關以上程度的Altmetrics指標間關系。從以上分析還可以看出,來源于同類別的指標相關強度相對較高,指標來源對相關強度有一定影響,但是從相關系數(shù)大小來看,影響并不顯著。由此可見,中國SSCI論文的Altmetrics指標之間共變趨勢不明顯,不存在重復可替代的指標。在進行中國SSCI論文影響力評價等相關研究時,這些指標均具有獨立代表性。此外,在Altmetrics指標與被引頻次相關關系上,除Mendeley讀者數(shù)外,其他指標均與被引頻次相關性較弱,進一步表明Altmetrics指標作為學術論文評價的補充指標的必要性。
Altmetric Attention Score是Altmetric.com公司對目標文獻在線受關注的數(shù)量和質(zhì)量的綜合定量評價值,在給定權重基礎上通過自動算法計算得到。24 173篇論文的Altmetric Attention Score總分為127 535分,篇均5.28分,關注度最高的一篇學術論文的Altmetric Attention Score達到3 041分。所有論文的AltmetricAttention Score區(qū)間分布情況如圖1所示。
圖1 Altmetric Attention Score區(qū)間分布情況
由圖1可知,絕大多數(shù)論文的Altmetric Attention Score值為1或者0,其中值為1的論文數(shù)量占到論文總量的35.40%,值為0的論文數(shù)量占到論文總量的23.04%。Altmetric Attention Score值低于平均值5.28的學術論文有20 880篇,占論文總量的86.38%。Altmetric Attention Score值高于平均值的學術論文也主要分布在低區(qū)間6~15,Altmetric Attention Score值高于200的學術論文量僅占論文總量的0.26%。由此可見,雖然已有部分中國SSCI論文獲得在線關注,但在線受關注程度普遍較低。
被引頻次是評價學術論文影響力的常用指標,同時對Altmetric Attention Score和被引頻次進行研究,可了解學術論文獲得的在線關注度與被引頻次之間是否存在關系??紤]到引文時滯問題,僅對發(fā)表在2015年以前的15 133篇論文進行研究。其中,被引頻次最高的一篇學術論文被引用1 197次,其Altmetric Attention Score值為9;在線關注度最高的一篇學術論文的Altmetric Attention Score值為1 015,被引用173次。對Altmetric Attention Score各區(qū)間學術論文的被引頻次進行統(tǒng)計,見表3。
分析表3可以發(fā)現(xiàn),無論學術論文的在線關注度Altmetric Attention Score值高低,在每個區(qū)間都含有0被引及被引頻次很高的學術論文。統(tǒng)計各區(qū)間學術論文的篇均被引頻次可以發(fā)現(xiàn),當Altmetric Attention Score值小于10,處于低關注度區(qū)間時,篇均被引頻次隨著Altmetric Attention Score區(qū)間值增大上下波動;當Altmetric Attention Score值在10以上時,篇均被引頻次隨著Altmetric Attention Score區(qū)間值增大開始顯著遞增。
表3 Altmetric Attention Score各區(qū)間學術論文的被引頻次分布
繼續(xù)利用SPSS軟件,觀察Altmetric Attention Score與被引頻次兩組數(shù)據(jù)的關聯(lián)性,當Altmetric Attention Score值小于10時,二者的Spearman相關系數(shù)為0.04;當Altmetric Attention Score值大于10時,二者的Spearman相關系數(shù)為0.17;當Altmetric Attention Score值大于50時,二者的Spearman相關系數(shù)為0.22??傮w來說,中國SSCI論文獲得的在線關注情況與被引用頻次之間相關性較弱,但是獲得較高在線關注度的學術論文獲得較高被引頻次的概率相對更高。
對Altmetrics指標影響因素的挖掘有助于指引學者有針對性地撰寫學術論文,提高學術論文的在線受關注度。影響Altmetrics指標的相關因素可以從學術論文的自身影響因素(作者、研究機構、論文研究內(nèi)容、基金資助情況以及參考文獻等)和外界影響因素(期刊影響因子、使用情況、被引情況等)兩方面進行討論,筆者主要從學者可控的自身影響因素進行討論。
具體分析中,由于考察時間范圍長,涉及學科領域多,相對來說每位作者發(fā)表的學術論文數(shù)量較少,作者因素的影響非常小,因此不再考慮作者因素;研究機構方面,不對具體機構進行分析,只對第一/通信作者研究機構國別是否為中國以及研究機構數(shù)量進行分別討論;對于學術論文研究內(nèi)容,由于論文數(shù)量多,沒有有效的方法對單篇學術論文內(nèi)容進行深層次挖掘,因此僅從學術論文篇幅角度考察影響;參考文獻也僅考察參考文獻的數(shù)量影響。此外,考慮到絕大多數(shù)Altmetrics指標覆蓋率較低,對單個Altmetrics指標影響因素挖掘的意義不大,因此選用Altmetrics指標綜合評價值Altmetric Attention Score進行替代研究。對各影響因素進行統(tǒng)計分析,具體情況見表4~表8。
表4 第一/通信作者研究機構國別影響
表5 研究機構數(shù)影響
表6 論文篇幅影響
表7 基金資助情形影響
表8 參考文獻數(shù)影響
由表4可知,雖然中國研究機構學者同時作為第一作者和通信作者的論文數(shù)量最多,約占論文總量的64.33%,但是論文的Altmetric Attention Score平均分表現(xiàn)最差,且低于整體論文的Altmetric Attention Score平均分5.28;中國研究機構學者或非中國研究機構學者分別作為第一作者和通信作者的論文數(shù)量較少,兩種情形僅占到論文總量的8.24%,論文的Altmetric Attention Score平均分表現(xiàn)較中國研究機構學者同時為第一作者和通信作者的情形有較大提升,且非中國研究機構學者作為第一作者的學術論文獲得的在線關注情況優(yōu)于中國研究機構學者作為第一作者的學術論文;第一作者和通信作者同時為非中國研究機構學者的論文數(shù)量占到論文總量的27.43%,但是論文的Altmetric Attention Score平均分相對其他3種情形最為突出。進而計算4種情形下,Altmetric Attention Score得分值和對應論文數(shù)量的相關系數(shù)分別為-0.123、-0.110、-0.104及-0.100,可見學術論文獲得在線關注情況在一定程度上受第一/通信作者研究機構國別影響。
由表5可得,具有Altmetrics指標的中國SSCI論文的研究機構數(shù)以2個和3個居多,研究機構數(shù)超過5個的論文僅占論文總量的10.75%。從不同研究機構數(shù)情形下Altmetric Attention Score平均分表現(xiàn)來看,隨著研究機構數(shù)增加,Altmetric Attention Score平均分也不斷增加,且研究機構數(shù)大于5個的學術論文的Altmetric Attention Score平均分遠大于研究機構數(shù)在5個及以下的學術論文Altmetric Attention Score平均分。進而計算不同機構數(shù)情形下,Altmetric Attention Score得分值和對應論文數(shù)量的相關系數(shù)分別為-0.226、-0.179、-0.173、-0.154、-0.143及-0.118。綜上分析,可以認為學術論文的研究機構數(shù)對Altmetric Attention Score有影響。
分析表6發(fā)現(xiàn),無論Altmetric Attention Score取值高低,在每個區(qū)間都含有篇幅很小和篇幅很大的學術論文,個別學術論文的篇幅大小與其能獲得的在線關注度之間沒有關系。通過對各區(qū)間學術論文平均篇幅的統(tǒng)計可以發(fā)現(xiàn),0區(qū)間學術論文平均篇幅為16頁(不足1頁按1頁算),平均篇幅最大;1 000以上區(qū)間學術論文平均篇幅為10頁,平均篇幅最??;其他區(qū)間學術論文的平均篇幅都在12~14頁??傮w來說,各區(qū)間論文的平均篇幅差異不大。繼續(xù)計算Altmetric Attention Score與論文篇幅的相關系數(shù)為-0.024,進一步表明學術論文獲得的在線關注情況與篇幅大小之間的關系不明顯。
在對學術論文的基金資助情況進行統(tǒng)計時,只統(tǒng)計基金種數(shù),不考慮個數(shù),如“National Natural Science Foundation of China [31371044,30970910,31170969,31500903]”只計為1種基金。表7中“占總量百分比”,是指占總數(shù)據(jù)77 168篇學術論文中對應基金資助種數(shù)下學術論文總量的百分比。可以發(fā)現(xiàn),受基金資助的學術論文相對不受基金資助的學術論文更容易獲得在線關注,且Altmetric Attention Score平均分隨基金資助種數(shù)的增加而增大。繼續(xù)計算不同基金資助情形下,Altmetric Attention Score得分值和對應論文數(shù)量的相關系數(shù)分別為-0.206、-0.151、-0.148、-0.139、-0.100及-0.083。由此可見,學術論文獲得的在線關注情況受基金資助情況影響,基金資助種數(shù)的增加有助于學術論文獲得更高的在線關注度。
由表8對各區(qū)間參考文獻最小量和最大量的統(tǒng)計可以發(fā)現(xiàn),當Altmetric Attention Score在200以下時,每個區(qū)間都存在含極少參考文獻和大量參考文獻的學術論文,可見單篇學術論文的參考文獻數(shù)量與其獲得的在線關注程度之間沒有關系;當Altmetric Attention Score大于200時,學術論文一般都含一定數(shù)量的參考文獻。通過對各區(qū)間篇均參考文獻量的統(tǒng)計可以發(fā)現(xiàn),各區(qū)間論文的平均參考文獻數(shù)量都在38條以上,且各區(qū)間差異不大。繼續(xù)計算得到Altmetric Attention Score與參考文獻數(shù)量的相關系數(shù)為0.015,再次驗證篇均參考文獻數(shù)量與Altmetric Attention Score之間沒有明顯關系。
綜上分析,第一/通信作者研究機構國別、研究機構數(shù)以及基金資助情況對中國SSCI論文的在線關注度值有正向影響,論文篇幅和參考文獻數(shù)量的影響不顯著。
本文對中國SSCI論文的Altmetrics指標情況和影響因素進行了研究,揭示出中國SSCI論文的Altmetrics指標特征如下。
(1)部分中國SSCI論文獲得在線關注,但在線受關注程度普遍較低。獲得在線關注的學術論文的Altmetrics指標中,除Mendeley讀者數(shù)和推文數(shù)以外,其他Altmetrics指標覆蓋率均較低;且Altmetrics指標之間共變趨勢不明顯,均具有獨立代表性;Mendeley讀者數(shù)與被引頻次中度相關,能在一定程度上預測學術論文的被引情況;Altmetric Attention Score與被引頻次之間沒有明顯關系。
(2)中國SSCI論文獲得在線關注情況受第一/通信作者研究機構國別、研究機構數(shù)和基金資助種數(shù)的影響??赏ㄟ^以下措施提高學術論文的在線關注度:在第一作者和通信作者研究機構國別方面,可以加強中國研究機構與國外同領域研究機構間的合作,同時鼓勵中國研究機構學者積極參與國外研究機構的社會科學研究;在研究機構數(shù)方面,增加社會科學研究中合作的研究機構個數(shù),可以是跨國、跨地區(qū)或者跨機構的合作研究;在基金資助方面,研究機構積極申請爭取獲得更多基金項目資助,國家相關部門也應加大社會科學研究的基金資助力度。
然而本文研究僅是基于SSCI收錄的中國研究機構發(fā)表的學術論文以及Altmetric Explore提供的指標數(shù)據(jù),只能在一定程度上反映中國SSCI論文獲得的在線關注情況,且在對學術論文的Altmetrics指標影響因素進行分析時,只考慮了學者可控的自身因素,后續(xù)研究將對學術論文質(zhì)量及研究內(nèi)容的影響關系進行深層次挖掘。