■姚志昌 段瑞云 付繼娟 沈昕威 鄭雪萍 李思宇
1)中國礦業(yè)大學學報編輯部,江蘇省徐州市金山東路1號 2210082)香港科技大學數(shù)學系,香港九龍清水灣 3)中國礦業(yè)大學圖書館,江蘇省徐州市大學路1號 221116
國民經(jīng)濟和社會發(fā)展對創(chuàng)新的渴求需要科技期刊以提升創(chuàng)新能力為使命,以社會需求為導(dǎo)向創(chuàng)辦精品期刊,首要任務(wù)就是不間斷地發(fā)表高水平論文,提高創(chuàng)新效率,這不僅是因為創(chuàng)新效率的高低決定了自身的發(fā)展前景,而且在很大程度上影響著整個國家的創(chuàng)新進程[1]。期刊創(chuàng)新效率的高低受初審方法、評審質(zhì)量、編輯水平、傳播速度等因素的影響,直接體現(xiàn)在論文發(fā)表后的被引頻次、下載次數(shù)上,間接體現(xiàn)在學術(shù)創(chuàng)新后衍生出來的社會效益上。初審作為期刊最重要的工作之一歷來受到重視,國內(nèi)眾多學者對科技期刊初審多有論述,例如從初審原則、內(nèi)容審查、真實性審查進行探討[2-6],在如今來稿量與日俱增的情況下,審稿人尤其是知名專家面對日益增多的審稿任務(wù)往往感到難以應(yīng)付,導(dǎo)致審稿周期過長,論文不能得到快速發(fā)表。減少審稿專家的工作量、縮短出版時間現(xiàn)已成為辦刊人首先要面對和解決的問題,行之有效的方法就是在初審時盡可能地對論文進行全面評估,通過精準選稿來提高論文在發(fā)表后有良好表現(xiàn)的概率。
布拉德福的“文獻離散定律”、加菲爾德的“引文分析體系”、普賴斯的“文獻指數(shù)增長規(guī)律”共同構(gòu)成“核心期刊”理論,為精準選稿提供了有力支撐。核心期刊是指特定學科領(lǐng)域內(nèi)刊發(fā)較多高學術(shù)質(zhì)量論文的期刊,從遴選核心期刊的兩個主要指標載文量和引證情況看出:哪種期刊擁有的被引論文數(shù)量、高被引作者數(shù)量越多,哪種期刊在核心區(qū)的地位就越強,而且高被引作者對核心期刊的貢獻最大。因此,精準選稿首先就是要在核心期刊已發(fā)表并表現(xiàn)良好的論文中找出其特征,以辦刊效果突出的期刊為參照;以高被引論文獨有的、共有的特征為借鑒,從中感知作者背景、科研支撐、團隊合作與被引頻次的相關(guān)性,由此建立客觀、科學、有據(jù)的精準選稿方法。
論文發(fā)表后的大數(shù)據(jù)研究已經(jīng)被推到創(chuàng)新、提高競爭力和工作效率的前沿,過去大部分人對大數(shù)據(jù)的理解還停留在大量數(shù)據(jù)和數(shù)據(jù)的多樣性本身,而忽略了它最重要的角色之一,即幫助挖掘創(chuàng)新亮點與社會需求。影響因子、期刊被引量在一定程度上反映了期刊的創(chuàng)新效率,零被引、下載次數(shù)不高是期刊創(chuàng)新效率低的表現(xiàn),一年一度權(quán)威部門發(fā)布的期刊引證報告和中國知網(wǎng)(http:∥www.cnki.net)不斷更新的每一篇論文的被引頻次、下載次數(shù)是我們關(guān)注并研究的大數(shù)據(jù),這些數(shù)據(jù)具有Volume(大量)、Variety(多樣)、Value(價值)、Veracity(真實)的特征,是體現(xiàn)辦刊效果及作者創(chuàng)新能力、研究水平、創(chuàng)新效率的最好見證,關(guān)注學術(shù)創(chuàng)新亮點、不斷向比自己更優(yōu)秀的期刊學習是期刊自我提升的必經(jīng)之路。通過分析這些數(shù)據(jù)可以發(fā)現(xiàn):(1)結(jié)合論文數(shù)、作者h指數(shù)等指標,識別不同研究方向的代表性專家[7];(2)了解學術(shù)創(chuàng)新對個體的影響,做到有針對性的傳播[8];(3)挖掘數(shù)據(jù)尋找影響辦刊效果的關(guān)鍵指標[9]。如果辦刊人真正理解期刊文獻指標和中國知網(wǎng)發(fā)布的每一篇論文的引用、下載數(shù)據(jù)所透露出來的實質(zhì),把論文發(fā)表后的表現(xiàn)看成是期刊選稿效果的展示,也是讀者對獲取知識后的反饋,那么,可以從這些數(shù)據(jù)中不斷挖掘讀者和引用者的學習和研究需求來優(yōu)選組稿方向。
期刊核心競爭力的提升戰(zhàn)略是適應(yīng)外部環(huán)境變化,通過大數(shù)據(jù)挖掘在創(chuàng)新方面有突出表現(xiàn)的人,借助他們的創(chuàng)新特長來提升期刊影響力的一整套戰(zhàn)略。期刊的精品榮譽都是因發(fā)表眾多高水平論文而獲得的,其“超凡脫俗”的表現(xiàn)70%歸功于有創(chuàng)新稟賦的作者[10],秉持“與優(yōu)秀的人為伴會讓自己也變得優(yōu)秀”的選稿理念,提高期刊核心競爭力的重點是對期刊外部資源的有效挖掘[11],通過對期刊文獻指標數(shù)據(jù)和論文引用、下載數(shù)據(jù)的挖掘,幫助辦刊人發(fā)現(xiàn)有創(chuàng)新稟賦的作者和熱點方向,提高論文發(fā)表后成為高被引論文的概率。精準選稿的目的就是要選出有潛力成為高被引的論文,助力期刊提高創(chuàng)新效率,讓刊發(fā)的每一篇論文都能為期刊“提質(zhì)增效”。
引用期刊層次、被引量是評價已發(fā)表論文是否出色的重要指標,本文以“中國精品科技期刊”(以下簡稱“精品期刊”)為切入點,以2012—2018年能源領(lǐng)域代表性期刊的F5000入選論文為研究樣本,分析F5000入選論文所具有的特征及背景,為實現(xiàn)精準選稿提供參考。
精品期刊是中國科學技術(shù)信息研究所(以下簡稱“中信所”)每3年根據(jù)中國科技期刊綜合評價指標體系,利用主要學術(shù)指標通過隸屬度轉(zhuǎn)換,采用層次分析法由專家打分確定重要指標的權(quán)重,分學科對中國科技論文與引文數(shù)據(jù)庫(Chinese Science and Technology Paper Citation Database,CSTPCD)收錄的每種期刊科學計量指標進行綜合評定而遴選出來的優(yōu)秀期刊。2017年中信所從115個學科分類、2008種核心期刊中遴選出300種 “中國精品科技期刊”,這些期刊是各學科分類中綜合評價總分排名居前者,也是核心期刊中的佼佼者,將目光聚焦在精品期刊上,就是要從這些精品期刊的F5000入選論文中挖掘亮點,不斷提高選稿水平,讓不是精品期刊的期刊爭取跨入精品期刊行列,已是精品期刊的進入精品期刊前列。
2012—2018年以來中信所共提名22546篇論文入選F5000。從遴選過程來看,入選F5000的論文有以下特點[12]:(1)出自于精品期刊;(2)被引頻次高于該學科類別年度的高被引論文的基準線;(3)任何一種期刊擇優(yōu)入選篇數(shù)限定為20篇。由此可知,入選F5000的每篇論文都因其特有的創(chuàng)新性而被引用借鑒,從高被引能體現(xiàn)論文可信度和權(quán)威性來看,他們是我國精品期刊上發(fā)表的原創(chuàng)性科學發(fā)現(xiàn)和技術(shù)創(chuàng)新最有影響力的研究成果,基本上代表了中文科技論文在各學科領(lǐng)域的學術(shù)水平。對中信所而言,F(xiàn)5000入選論文是精品期刊中優(yōu)秀論文的代表;對辦刊人而言, F5000入選論文是精準選稿的結(jié)果。近年來F5000入選論文受到國內(nèi)學者廣泛關(guān)注,相繼有對F5000入選論文進行文獻計量學研究的文章發(fā)表[13-15],但綜合作者被引情況、將F5000入選論文數(shù)量等大數(shù)據(jù)用以指導(dǎo)精準選稿的方法報道不多,尤其是對能源領(lǐng)域期刊及F5000入選論文缺少分析。能源在國民經(jīng)濟中的地位非同一般,況且能源領(lǐng)域F5000入選論文眾多、精品期刊數(shù)量龐大,以此為研究對象分析得出的結(jié)果受益面廣。
從F5000展示平臺(http:∥f5000.istic.ac.cn/f5000/index)選取“石油天然氣工程類”期刊6種、“礦山工程技術(shù)類”期刊3種、“能源科學綜合類”期刊3種,共計12種能源領(lǐng)域期刊。將這12種期刊2012—2018年入選F5000的論文數(shù)量進行統(tǒng)計(圖1),參照2013—2017年中國各學科Top1%高被引論文基準線(表1)[16],根據(jù)其年度入選論文數(shù)量的變化,了解其深層次原因。
2012—2017年F5000展示平臺顯示入選F5000論文數(shù)量(不含編輯部推薦)排序為:《煤炭學報》96篇;《石油勘探與開發(fā)》88篇;《天然氣工業(yè)》79篇;《石油學報》76篇;《石油天然氣地質(zhì)》38篇;《中國礦業(yè)大學學報》46篇;《燃料化學學報》55篇;《石油化工》21篇;《采礦與安全工程學報》22篇;《太陽能學報》10篇;《中國石油大學學報》5篇;《礦物學報》1篇。從圖1可以看出:(1)石油天然氣工程類期刊入選F5000論文數(shù)量最多,礦山工程技術(shù)類入選F5000論文數(shù)量最少。(2)各期刊不同年度入選F5000論文數(shù)量出現(xiàn)波動,2012—2013年有些期刊的波動與中信所2013年提名論文Excel表和2012年提名論文的Excel表中作者重復(fù)有關(guān),但2013年以后入選F5000的論文數(shù)量基本反映了期刊的辦刊效果;有些期刊在2017年未能入選“中國精品科技期刊”,導(dǎo)致入選F5000論文數(shù)量為0。(3)雖然不同學科的年度高被引論文基準線(表1)存在差異,總體上學會、科研院所主辦期刊入選F5000論文數(shù)量高于高校主辦期刊入選F5000論文數(shù)量。
圖1 2012—2018年能源領(lǐng)域12種期刊F5000入選論文數(shù)量變化
表1 2013—2017年中國各學科Top1%高被引論文基準線
從F5000展示平臺(http:∥f5000.istic.ac.cn/f5000/search)上檢索出2012—2017年中信所提名的能源領(lǐng)域F5000論文數(shù)量排名居前的期刊、作者及作為第一單位產(chǎn)出的全部F5000論文數(shù)量(表2)。從表2可以看出:(1)人才匯集的高校是產(chǎn)出數(shù)量眾多F5000論文的地方,但高校主辦期刊進入能源領(lǐng)域F5000論文數(shù)量排名前10的期刊僅有3種;(2)F5000入選論文數(shù)量(不含期刊推薦)排名前10的作者(含并列)中都是正高級專家,其中有8位是院士,排名榜前3位的鄒才能于2017年當選中國科學院院士、康紅普于2015年當選中國工程院院士、趙文智于2013年當選中國工程院院士,這與他們在科研上取得突出成就支撐其撰寫出高水平論文分不開。F5000入選論文數(shù)量與通過中國知網(wǎng)查詢的2007—2017年每位作者發(fā)表的論文總量(表2)之比折射出作者在研究領(lǐng)域的高屋建瓴及“領(lǐng)跑者”地位,作者論文發(fā)表頻率、創(chuàng)新效率也可見一斑。雖然F5000入選論文4篇及以上(不含期刊推薦)的作者人數(shù)不多,但其入選F5000的論文數(shù)量已充分展現(xiàn)了作者在學科領(lǐng)域里的引領(lǐng)力、輻射力,這一切都與他們獨具的創(chuàng)新稟賦密切相關(guān),從論文入選F5000的難度上看,精準選稿的工作就是要選準創(chuàng)新稟賦突出的作者,而且選準作者比選準方向更為重要,這是因為具有創(chuàng)新稟賦的作者自己就具備引領(lǐng)創(chuàng)新方向的能力。
中信所劃分的礦山工程類、能源綜合類的期刊大多屬礦業(yè)領(lǐng)域期刊,有必要對礦山工程技術(shù)類F5000入選論文的第一作者職稱、單位、基金資助情況(表3)進行統(tǒng)計分析,然后與礦業(yè)領(lǐng)域入選F5000論文2篇以上的第一作者及作者h指數(shù)、作者單位、發(fā)表期刊(表4)進行對比,找出原因所在。
從表3可以看出:作者為正高級職稱和博士研究生的入選F5000論文數(shù)量較多;《中國礦業(yè)大學學報》《采礦與安全工程學報》都是中國礦業(yè)大學主辦、Ei Compendex收錄的雙月刊,《中國礦業(yè)大學學報》的本校稿件入選率為47.17%,《采礦與安全工程學報》的本校稿件入選率為65.39%,在吸引本校作者投稿方面,《采礦與安全工程學報》做得比較好,《中國礦業(yè)大學學報》在吸引校外投稿方面比《采礦與安全工程學報》有優(yōu)勢;入選F5000的論文基本上都有基金項目資助,從資助類別來看,國家級資助項目占比很大,充足的資金來源對高水平成果產(chǎn)出尤為重要。
表2 2012—2017年中信所提名的能源領(lǐng)域F5000入選論文數(shù)量排位居前的期刊、作者和單位
注:小括號內(nèi)的數(shù)字為該作者2007—2017年在http:∥www.cnki.net上收錄文章數(shù)量。
表3 2012—2018年礦山工程技術(shù)類期刊F5000入選論文背景
注:《中國礦業(yè)大學學報》的F5000入選論文第一作者中有一位為碩士研究生,《采礦與安全工程學報》的F5000入選論文中有一篇論文沒有基金資助,因此未將這2篇論文列入表3中。
表4為礦業(yè)類F5000入選論文數(shù)量超過2篇(不含期刊推薦)的作者統(tǒng)計結(jié)果。可以看出:(1)在數(shù)量上,中國礦業(yè)大學、中國礦業(yè)大學(北京)作為“雙一流”高校,是F5000論文產(chǎn)出最多的高校,煤炭科學研究總院緊隨其后,說明優(yōu)勢學科支撐、良好的實驗條件對孵化出高水平論文至關(guān)重要。(2)許多第一作者的入選F5000論文發(fā)表在不同的期刊,盡管這些論文出自不同期刊,但作者發(fā)表的論文入選F5000這件事本身就體現(xiàn)出該論文對他人的借鑒價值。同一作者的F5000入選論文來自不同的期刊,既反映了期刊之間存在影響力、競爭力上的差距,又為期刊編輯了解自身不足,改進選稿思路與習慣,有利于今后約稿、組稿能力的提升。(3)在礦業(yè)領(lǐng)域,6年內(nèi)入選F5000論文數(shù)量超過3篇(不含期刊推薦)、h指數(shù)超過40的第一作者當選院士的概率最大,由此可見入選F5000的論文數(shù)量與作者h指數(shù)一起,可以作為衡量作者學術(shù)創(chuàng)新能力及論文質(zhì)量的標尺。(4)表4中單獨作者的論文有15篇(其中11篇來自院士),占F5000入選論文總數(shù)(79篇)的18.99%,這既體現(xiàn)了單獨作者引領(lǐng)創(chuàng)新的獨特魅力,又反映了科研團隊對產(chǎn)出F5000論文相互協(xié)作與貢獻。論文入選F5000(不含期刊推薦)表明其創(chuàng)新性和學術(shù)質(zhì)量已被中信所認可,F(xiàn)5000入選論文完全可以看成是所有作者好的資質(zhì)和成果的記錄。
在深入了解論文入選F5000的不易后,從辦刊的角度來看,應(yīng)充分發(fā)揮和利用F5000入選論文作者在學術(shù)創(chuàng)新上的獨特能力,以他們的研究成果作為精準選稿的方向,將F5000入選論文的第一作者納入重點關(guān)注人員名單,尤其是緊盯2次及以上入選F5000論文第一作者的科研進展,主動邀請其審稿,積極向其約稿,讓F5000入選論文作者獨具的創(chuàng)新能力助力期刊學術(shù)影響力提升。
表4 2012—2017年礦業(yè)領(lǐng)域入選F5000論文數(shù)量超過2篇的作者統(tǒng)計
F5000入選論文為精品期刊的優(yōu)秀代表,論文入選F5000離不開期刊責任編輯的輔助作用,編輯是論文的“發(fā)現(xiàn)者”“培養(yǎng)者”,是對論文的“再創(chuàng)造”[17],編輯給予作者的是讓論文更完美。2012—2017年《中國礦業(yè)大學學報》入選F5000的44篇論文發(fā)表時間為2007—2016年,考慮投稿時間早于發(fā)表時間9個月以上,將投稿時間段責任編輯職稱與F5000入選論文的專業(yè)方向統(tǒng)計列于表5中。由于《中國礦業(yè)大學學報》稿件處理采取對來稿按責任編輯主管專業(yè)進行分稿,經(jīng)過責任編輯初審→專家評審→主編終審后論文得以發(fā)表,從這點來看,F(xiàn)5000入選論文的高被引表現(xiàn)主要來自作者及所在學科的優(yōu)勢,與責任編輯職稱級別關(guān)系不大,是作者的創(chuàng)新稟賦起關(guān)鍵作用,但也不能忽視編輯對學術(shù)創(chuàng)新的鑒別能力。經(jīng)編輯選稿到加工后發(fā)表,論文入選F5000看上去如同“伯樂相馬”,要想提高期刊的F5000入選論文數(shù)量,編輯需要擔當好三方面的角色:(1)導(dǎo)演角色,挑選有創(chuàng)新稟賦的作者和刊用優(yōu)先方向;(2)精品設(shè)計師角色,為作者精雕細琢出“華麗”作品;(3)創(chuàng)新助推者角色,以社會需求為導(dǎo)向、以解決在科研中出現(xiàn)的“疑難雜癥”為己任,通過辛勤勞動將創(chuàng)新成果挖掘并快速展示出來。
表5 2012—2017年《中國礦業(yè)大學學報》F5000入選論文的責任編輯職稱、專業(yè)方向
實現(xiàn)精準選稿的關(guān)鍵在于選準作者及刊用方向,要領(lǐng)在于科學地設(shè)立初審尺度來遴選稿件,而這一切都需要來自期刊引證報告、作者發(fā)表論文表現(xiàn)等大數(shù)據(jù)的支撐。精準選稿的核心任務(wù)就是利用大數(shù)據(jù)對論文進行鑒別,以大數(shù)據(jù)作為科學遴選論文的起點、支點,在深度和廣度上對研究領(lǐng)域、作者表現(xiàn)進行量化對比,輔助辦刊人實現(xiàn)優(yōu)選關(guān)鍵作者、優(yōu)選關(guān)鍵題目,促進學術(shù)創(chuàng)新走上高質(zhì)量發(fā)展的道路。
創(chuàng)新稟賦體現(xiàn)在科研創(chuàng)新、學術(shù)創(chuàng)新上,創(chuàng)新稟賦與論文被引量存在正相關(guān)關(guān)系,每一位論文作者都是從創(chuàng)新意識→科研支撐→研究成果→創(chuàng)新感悟→發(fā)文論述中成長起來的,鑒于創(chuàng)新稟賦的差異,所獲得的創(chuàng)新成就不同,作者創(chuàng)新稟賦的高低決定了作者創(chuàng)新效率與獲得成就的高低,承擔重大科研項目、發(fā)表論文被引量高無不體現(xiàn)出創(chuàng)新稟賦及其獨有的創(chuàng)造力、競爭力,而這正是精準選稿所看重的品質(zhì),況且精品期刊與非精品期刊在數(shù)量上基本符合帕累托定律(Pareto Law),對社會貢獻的創(chuàng)新價值存在差異(圖2)。F5000入選論文的作者是從精品期刊遴選出來的表現(xiàn)突出者,理應(yīng)成為組稿的優(yōu)先關(guān)注人選,邱均平等[18]認為基于某學科領(lǐng)域核心期刊的發(fā)文量和h指數(shù)相結(jié)合的方法,能更好地篩選出高影響力的領(lǐng)域?qū)<遥@與筆者“精中選優(yōu)”的思路不謀而合,可以將入選F5000論文數(shù)量與作者h指數(shù)相結(jié)合,作為衡量作者創(chuàng)新能力及論文質(zhì)量的標尺,與作者發(fā)表論文的頻率、篇均被引頻次、作者的學術(shù)創(chuàng)新指數(shù)[19]一起作為目標作者的挑選指標。
圖2 期刊創(chuàng)新價值
自然科學、工程技術(shù)方面的重大研究很少是憑借單人之力能夠完成的,F(xiàn)5000入選論文的作者,剛開始時都是科研團隊中的一員,經(jīng)過科研過程的歷練,因論文相繼發(fā)表而顯露頭角,盡管團隊中每個人的創(chuàng)新感悟不一,各自作為第一作者的論文發(fā)表后被引頻次出現(xiàn)差異,但沒有科研項目的支撐,很難涌現(xiàn)出高水平的學術(shù)論文。F5000入選論文作者的成長經(jīng)歷相似:參加科研項目→發(fā)表高質(zhì)量的學術(shù)論文→展現(xiàn)出個人創(chuàng)新稟賦→項目主持人→科技獎獲得者→國家重大項目領(lǐng)軍人物。一方面,揭示論文有無科研項目支撐非常重要,能拿到科研項目就已經(jīng)表明申報者的創(chuàng)新思路及所具備的科研能力在眾多申報者中足夠優(yōu)秀,其優(yōu)秀還意味著其今后發(fā)表的論文成為高被引論文的概率會很高,國家重大科技攻關(guān)進展、優(yōu)勢學科專家的研究成果應(yīng)是精準選稿的主要追蹤熱點;另一方面,科研團隊承擔項目多,產(chǎn)出的成果就多,科研團隊規(guī)模與學術(shù)影響力呈正相關(guān)關(guān)系[20],尤其是發(fā)表科研團隊領(lǐng)軍人物的論文一定會有好的效果。在科研團隊領(lǐng)軍人物成為各種期刊的追逐焦點、一稿難求的情況下,應(yīng)將目光放在科研團隊中年輕有為的作者身上:(1)通過作者發(fā)表論文的頻率,了解作者創(chuàng)新感悟能力及寫作勤奮度;(2)通過作者發(fā)表論文的篇均被引頻次,了解作者學術(shù)創(chuàng)新效率及水準;(3)通過計算作者學術(shù)創(chuàng)新指數(shù)[19],知曉作者學術(shù)創(chuàng)新水準在不同年度的變化情況。
態(tài)勢感知是預(yù)測未來推動期刊發(fā)展的重要手段,通過對廣域時空范圍內(nèi)涉及科技期刊發(fā)展變化的各類要素的采集、理解,力爭主動、準確、有效地辦好期刊。精準選稿作為提升期刊創(chuàng)新效率的有效方法,在反復(fù)經(jīng)歷“來稿→篩選→決策→執(zhí)行→效果→反饋”的過程中(圖3),不斷獲取態(tài)勢感知以對選稿方法進行改進。
圖3 辦刊態(tài)勢感知
經(jīng)歷了對精品期刊、F5000入選論文、學科強弱和自身的不斷認知后,在篩選論文時有必要對來稿進行評測而獲得態(tài)勢感知:一來提高工作效率;二來提高論文發(fā)表后的被引概率。對辦刊人而言,具備的職業(yè)素養(yǎng)和能力有很多項,但在這些素養(yǎng)和能力中,學術(shù)鑒賞力是不可或缺的素養(yǎng),它是長期實踐中生成的獨特的感知和判斷能力,也是在態(tài)勢感知中感悟出來的一種認知能力。經(jīng)歷了從大數(shù)據(jù)獲取多維信息、理解這些信息及預(yù)測未來態(tài)勢的態(tài)勢感知過程,編輯 “獨具慧眼”的能力逐步提高,根據(jù)預(yù)測后產(chǎn)生的效果來厘清哪些數(shù)據(jù)可以作為關(guān)鍵數(shù)據(jù)能獲得可靠的態(tài)勢感知,在篩選論文時態(tài)勢感知是不可缺少的一環(huán),與學術(shù)鑒賞力同等重要且相輔相成。
辦刊中的態(tài)勢感知來自多個方面,主要包括:(1)對作者的態(tài)勢感知——通過h指數(shù)、學術(shù)創(chuàng)新指數(shù)、發(fā)表頻率、創(chuàng)新效率,可以深入了解作者的學術(shù)創(chuàng)新角色,感知其是創(chuàng)新的引領(lǐng)者還是跟隨者;(2)對科研條件的感知——從基金項目級別及金額、實驗室支撐上感知創(chuàng)新競爭力;(3)對科研團隊的感知——從人員參與規(guī)模上感知發(fā)文頻率及研究的可持續(xù)性;(4)對學科熱點的感知——從被引頻次、下載量上感知普遍關(guān)注和共同研究的某一學科或領(lǐng)域的熱點;(5)對辦刊方向的感知——從期刊年報、其他優(yōu)秀期刊的被引頻次和下載次數(shù)上感知今后組稿方向??傊谏鲜鲂枰兄?個方面中,科研條件是基礎(chǔ),科研團隊是配角,作者創(chuàng)新稟賦是關(guān)鍵。感知涉及的內(nèi)容越豐富就會讓我們的認知越深入、預(yù)判越準確,而目的只有一個——在現(xiàn)有環(huán)境下指導(dǎo)辦刊績效最大化。大數(shù)據(jù)和高級分析的時代已經(jīng)到來,需要感知的信息越來越多,以大數(shù)據(jù)為切入點洞察數(shù)據(jù)價值、獲取態(tài)勢感知的工作量日益增多,培養(yǎng)數(shù)據(jù)驅(qū)動、測試與機器學習相結(jié)合的智能處理方法乃是實現(xiàn)精準選稿的最佳路徑,人類擅長處理的是所指和異態(tài)勢感知,計算機擅長的是能指和同態(tài)勢感知[21],人工處理與計算機處理分工合作,應(yīng)用人工智能在一定時間和空間內(nèi)對來稿進行感知、理解、預(yù)測效果、決策的評審方法便應(yīng)運而生。
人工智能技術(shù)已應(yīng)用于學術(shù)論文評審工作,而且大幅提高了大數(shù)據(jù)處理的效率和洞察的深度[22]。2016年,Aries系統(tǒng)公司將元文獻計量智能(Meta Bibliometric Intelligence)集成到《編輯經(jīng)理》(EditorialManager)這一學術(shù)刊物的稿件和同行評審跟蹤系統(tǒng)中[23],以幫助編輯在同行評審中利用人工智能估算一篇稿件的未來被引頻次和影響,多項測試結(jié)果標明:該技術(shù)可以幫助編輯作出更加準確的論文出版決策。2018年,北京大學的楊鵬程課題組提出基于層級結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),同時引入了注意力機制來解決論文評測問題,該模型可以自動進行論文評估,決定哪些論文應(yīng)該被會議接收,結(jié)果表明,“作者”對論文能否被接收的影響最大[24],這與筆者前面分析得出的“高水平論文與作者創(chuàng)新稟賦密切相關(guān)”不謀而合。此外,對結(jié)果影響最大的分別是“結(jié)論”和“摘要”,而“方法”這一部分的影響則相對較小,不過該項實驗結(jié)果表明該模型目前的準確率僅達到 67.6%,距離真正可以使用該自動評價系統(tǒng)來進行論文評審工作還有一定距離。紐約雪城大學(Syracuse University)開發(fā)了一種算法[25],分析了截至2015年P(guān)ubMed Open Access(PMOS)子集中發(fā)布的所有數(shù)據(jù),包含了760036篇文章、超過200萬條數(shù)據(jù),自動檢測圖像重用的嫌疑對象,研究結(jié)果表明,在PubMed Open Access上,大約有0.59%的文章被認為具有欺騙性——在760036篇文章中大約有4484篇文章涉嫌造假。此外,國家自然科學基金委員會利用人工智能工具來減少尋找評審人所需的時間[26],通過抓取在線科學文獻數(shù)據(jù)庫和科學家個人網(wǎng)頁,利用自然語言處理來收集潛在評審人的出版物或研究項目的詳細信息,將文中的關(guān)鍵詞與其他科學家出版物中的關(guān)鍵詞相匹配,利用文本語義分析來比較這些信息,并確定最匹配的評審人,以最匹配評審人的意見為參考助力精準選稿。
總的來說,人工智能可以全方位輔助審稿工作,但要實現(xiàn)人工智能完全獨立審稿必須深化目標問題中關(guān)聯(lián)參數(shù)之間相關(guān)規(guī)律的解析和建模。常規(guī)求解是以文獻指標為目標導(dǎo)向,目標拓展后,關(guān)聯(lián)參數(shù)之間的非線性模型將更為復(fù)雜?,F(xiàn)有描述復(fù)雜過程的非線性模型中多為統(tǒng)計類和神經(jīng)網(wǎng)絡(luò)類模型,即利用統(tǒng)計方法(如回歸分析、參數(shù)估計等)獲得顯式數(shù)學表達,或利用神經(jīng)網(wǎng)絡(luò)類(如BP、RBF、SVM等)方法來映射輸入和輸出獲得隱式數(shù)學表達。從對稿件創(chuàng)新度的認識程度的角度來看,這些方法形成的模型仍是“黑箱”,這并不利于對過程的深入理解。特別值得注意的是,神經(jīng)網(wǎng)絡(luò)類的建模必須依靠大量具有典型特征的樣本數(shù)據(jù),模型參數(shù)選擇要依靠經(jīng)驗和試驗,訓練過程耗時長,且易出現(xiàn)“過學習”或“欠學習”導(dǎo)致局部最優(yōu),模型泛化能力不強。因此要充分利用大數(shù)據(jù),采用融合算法實現(xiàn)審稿過程解析和數(shù)據(jù)驅(qū)動的結(jié)合,深化對復(fù)雜過程參數(shù)的建模和解析。
實現(xiàn)重大創(chuàng)新的捷徑是培養(yǎng)數(shù)據(jù)驅(qū)動、測試與學習相結(jié)合的能力。無論是編輯還是采用人工智能在進行精選時,看重的都是以往的創(chuàng)新效率(不同層次論文的數(shù)量/被引頻次)→現(xiàn)在的素質(zhì)能力(主持或參加項目的級別和數(shù)量)→未來的潛力(論文高被引的概率)。借助大數(shù)據(jù)獲得態(tài)勢感知,編輯在學術(shù)創(chuàng)新鑒別上火眼金睛、在社會需求感知上高瞻遠矚;人工智能則采用最為科學的算法,利用計算機不知疲倦、公正工作的特點,不斷發(fā)現(xiàn)不足而進行迭代改進,如此循環(huán)往復(fù)最終實現(xiàn)目標的精準選出。