摘 要:同行評議是科學(xué)研究中重要的質(zhì)量控制機(jī)制,但傳統(tǒng)同行評議在發(fā)展過程中面臨著來自效率與公平等方面的挑戰(zhàn)。人工智能(AI)作為一種新興的技術(shù)手段,具備對傳統(tǒng)同行評議所產(chǎn)生的問題進(jìn)行優(yōu)化與改善的潛力。通過對AI輔助同行評議的相關(guān)案例與研究成果進(jìn)行分析,梳理AI在同行評議中的技術(shù)潛力、應(yīng)用領(lǐng)域以及可能引發(fā)的倫理風(fēng)險和挑戰(zhàn),本文認(rèn)為,AI輔助同行評議是一種有前景的技術(shù)探索,但在實際操作過程中,為了確保AI輔助同行評議的科學(xué)性、公正性和可信性,也需要在數(shù)據(jù)質(zhì)量、人機(jī)協(xié)作、倫理規(guī)范等方面進(jìn)行充分的考量和平衡,以期突破傳統(tǒng)同行評議的瓶頸。
關(guān)鍵詞:同行評議;人工智能;智能化轉(zhuǎn)型;質(zhì)量控制
DOl: 10.3969/j.issn.2097-1869.2023.03.004 文獻(xiàn)標(biāo)識碼:A
本文著錄格式:徐亦舒, 查欣雨. 人工智能輔助同行評議的技術(shù)潛力、應(yīng)用領(lǐng)域與倫理隱憂[J]. 數(shù)字出版研究, 2023, 2(3): 21-27.
0 引言
同行評議(Peer Review)是判斷稿件質(zhì)量、保護(hù)編輯,以避免學(xué)術(shù)成果重復(fù)、證明科研成果學(xué)術(shù)貢獻(xiàn)、維護(hù)科學(xué)共同體聲譽(yù)和信譽(yù)、應(yīng)對學(xué)科專業(yè)細(xì)化的要求以及提升科學(xué)交流質(zhì)量,同時能夠有效促進(jìn)學(xué)術(shù)生產(chǎn)與學(xué)術(shù)出版的良性運(yùn)作和整體科學(xué)知識創(chuàng)新[]。自1665年英國皇家學(xué)會官方刊物《哲學(xué)匯刊》首次采用同行評議作為審稿方法開始,到二戰(zhàn)后國家管理科學(xué)的模式確立,同行評議得到進(jìn)一步發(fā)展并形成一種封閉審稿機(jī)制。
目前同行評議已經(jīng)成為世界范圍內(nèi)科學(xué)組織管理的主要運(yùn)行機(jī)制,是專家系統(tǒng)地以判斷標(biāo)準(zhǔn)進(jìn)行內(nèi)容質(zhì)量評價的重要制度,也是控制科研成果質(zhì)量的有力保證[]。但傳統(tǒng)同行評議(Traditional Peer Review,TPR)模式也因模式不完善、不透明、主觀偏見以及周期長等問題而不斷被詬病。
傳統(tǒng)同行評議基本遵循一個相對固定的流程與標(biāo)準(zhǔn)對科研成果進(jìn)行質(zhì)量控制:通常會選擇2~3位同行專家擔(dān)任評議人,對相關(guān)科研成果從創(chuàng)新性、科學(xué)性、完整性等多個維度進(jìn)行質(zhì)量把關(guān),并提出相應(yīng)的評審意見;評議一般采取匿名的形式進(jìn)行,即作者與評議專家彼此間不直接進(jìn)行溝通;編輯等承擔(dān)聯(lián)系作者與評議專家的工作。同行評議作為科學(xué)學(xué)術(shù)共同體內(nèi)部的評判和關(guān)鍵決策程序,基本上是基于一定的評判標(biāo)準(zhǔn)對科學(xué)工作進(jìn)行系統(tǒng)性的“定性評價”,呈現(xiàn)出高度專業(yè)化和相對主觀化的特征,整體對專家經(jīng)驗存在高度依賴性[3]。其主觀性結(jié)果也是造成同行評議本身的公平性、有效性等問題的重要原因。此外,學(xué)術(shù)投稿、科研項目申報等數(shù)量與日俱增,學(xué)術(shù)研究的專業(yè)細(xì)分化以及跨學(xué)科學(xué)術(shù)研究日益同時出現(xiàn),也加劇了傳統(tǒng)同行評議制度的現(xiàn)實運(yùn)作困境。
20世紀(jì)90年代以來,大眾對于科學(xué)研究的關(guān)注日益提升,科學(xué)研究倫理問題被普遍討論,科學(xué)研究迅速發(fā)展,科研成果數(shù)量不斷增多,諸多要素疊加,造成科學(xué)面臨著“走向社會”的壓力,原本相對封閉的科學(xué)自治結(jié)構(gòu)被迫向社會敞開。信息技術(shù)的快速發(fā)展在為同行評議“走向社會”奠定技術(shù)基礎(chǔ)的同時也打開了實踐空間,以在線審稿系統(tǒng)、預(yù)印本倉儲(E-print Repository)工具arXiv為代表的開放獲?。∣pen Access)和開放同行評議(Open Peer Review)以及人工智能(Artificial Intelligence ,AI)輔助同行評議等,從不同維度,如組織形式、流程設(shè)計、過程管理等,對傳統(tǒng)同行評議進(jìn)行重塑甚至顛覆[4]。
AI技術(shù)快速迭代升級,尤其是2023年年初以來諸如ChatGPT等AI輔助工具展現(xiàn)出超乎想象的實際應(yīng)用效果,引發(fā)各行各業(yè)的廣泛關(guān)注。對于學(xué)術(shù)出版等相關(guān)領(lǐng)域而言,AI技術(shù)的介入,尤其是對AI輔助同行評議(AI-assisted Peer Review)的探索,將為突破傳統(tǒng)人工評議的瓶頸,以人機(jī)協(xié)同的方式提升評議的效率與質(zhì)量、優(yōu)化評議流程以及提升評議效率提供潛力。
基于對國內(nèi)外AI輔助同行評議的相關(guān)研究與實踐案例進(jìn)行考察,嘗試從AI在同行評議中的技術(shù)潛力、發(fā)展方向以及潛在的倫理風(fēng)險與挑戰(zhàn)等方面對AI輔助同行評議的探索進(jìn)行回顧與反思,以期為提升我國學(xué)術(shù)出版質(zhì)量、加快該領(lǐng)域的數(shù)字化與智能化提供參考。需要特別說明的是,本文所討論的同行評議指的是一種抽象的科學(xué)共同體對于科研成果進(jìn)行質(zhì)量判斷與控制的實踐,而非特定的、針對科研工作者個體的評議行為。
1 AI輔助同行評議的技術(shù)潛力
2022年7月,施普林格·自然(Springer Nature)宣布推出一項AI引導(dǎo)的新服務(wù)——自然科研智訊(Nature Research Intelligence)。該服務(wù)包含三種產(chǎn)品,即自然策略報告(Nature Strategy Report)、自然指數(shù)(Nature Index )以及自然引航(Nature Navigator),以協(xié)助科研決策者制定數(shù)據(jù)驅(qū)動的戰(zhàn)略,發(fā)現(xiàn)研究與合作的機(jī)會,并更好地理解有關(guān)最新研究趨勢的真知灼見,進(jìn)而指導(dǎo)戰(zhàn)略決策、吸引資助和開展前沿研究,以此來造福社會。正如施普林格·自然的負(fù)責(zé)人Niels Peter Thomas所說,AI“不僅有助于我們創(chuàng)造新的知識,也有助于我們更好地閱讀和理解現(xiàn)有的內(nèi)容”。而AI與出版的融合,尤其是以AI技術(shù)賦能學(xué)術(shù)出版是近年來國內(nèi)外學(xué)術(shù)出版相關(guān)研究與實踐領(lǐng)域研究探索的重要內(nèi)容之一。盡管目前相關(guān)領(lǐng)域尚處于探索與起步階段,但機(jī)器學(xué)習(xí)(Machine Learning,ML)、自然語言處理(Natural Language Processing,NLP)以及自動化算法匹配等創(chuàng)新技術(shù)展現(xiàn)出巨大技術(shù)潛力,已經(jīng)開始逐步改變同行評議的面貌。
1.1 NLP賦予文本可讀性
NLP是AI的重要分支,其目的是利用計算機(jī)對自然語言進(jìn)行智能化處理?;A(chǔ)的NLP技術(shù)主要圍繞語言的不同層級展開,包括音位(語言的發(fā)音模式)、形態(tài)(字、字母如何構(gòu)成單詞、單詞的形態(tài)變化)、詞匯(單詞之間的關(guān)系)、句法(單詞如何形成句子)、語義(語言表述對應(yīng)的意思)、語用(不同語境中的語義解釋)、篇章(句子如何組合成段落)七個層級。這些基本的NLP技術(shù)經(jīng)常被運(yùn)用到下游的多種NLP任務(wù)中,如機(jī)器翻譯、對話、問答、文檔摘要等。依靠NLP技術(shù)讓機(jī)器能夠理解人類語言,用自然語言的方式與人類交流,最終實現(xiàn)“智能”。從2023年年初ChatGPT等這類AIGC應(yīng)用給人類帶來的強(qiáng)烈震撼中可以印證,借由NLP技術(shù),AI已經(jīng)能夠理解并生成人類的語言[5]。
NLP對AI輔助同行評議發(fā)展至關(guān)重要,因為AI參與同行評議的一個關(guān)鍵性技術(shù)前提就是能夠有效理解文本數(shù)據(jù)(不同領(lǐng)域的科研成果內(nèi)容),即需要具備文本可讀性(Readability)[6]。有關(guān)可讀性公式(Readability Formulas)和認(rèn)知指數(shù)(Cognitive Indices)的研究也顯示,NLP是進(jìn)行文本質(zhì)量評估的有效工具。研究者在NLP技術(shù)的幫助下,利用從特定的醫(yī)學(xué)領(lǐng)域提取的特征,如領(lǐng)域信息量和類別等,最終幫助文章進(jìn)行自動且有效的分類[7]。再比如,有研究者使用NLP技術(shù)從評審內(nèi)容、評審相關(guān)性、評審覆蓋率、評審語氣、評審數(shù)量和是否剽竊他人評審意見六個方面幫助審稿人提高評審質(zhì)量[8]。
但是,我們也需要清醒地認(rèn)識到科研成果是極其復(fù)雜的文本,對其進(jìn)行質(zhì)量判斷是一項極具挑戰(zhàn)性的工作,依然有很多挑戰(zhàn)需要應(yīng)對。比如:如何制定判斷標(biāo)準(zhǔn)?如何應(yīng)對學(xué)術(shù)語言的千變?nèi)f化?如何設(shè)計綜合性的判斷指標(biāo)?等等。
1.2 AI算法促進(jìn)評議流程高效化
同行評議在全球?qū)W術(shù)出版領(lǐng)域被普遍接納,并成為其中關(guān)鍵性環(huán)節(jié)與科研成果質(zhì)量把關(guān)程序。此外,隨著科學(xué)研究的快速發(fā)展,科研成果數(shù)量與學(xué)術(shù)論文數(shù)量都隨之高速增長,學(xué)術(shù)研究的生產(chǎn)量能超出了學(xué)術(shù)同行評議的供給量[9],導(dǎo)致同行評議壓力劇增以及科研成果發(fā)表周期被拉長。這就使得在同行評議中引入AI作為評議工具和手段,以人機(jī)協(xié)同的方式來提高評議的信度和效度成為可能。其中一個重要探索領(lǐng)域就是通過數(shù)據(jù)統(tǒng)計以及相關(guān)實驗算法分析來提升同行評議整體效率,而AI算法在其中發(fā)揮著重要作用。
所謂AI算法是一系列計算機(jī)指令組成的程序,相較于一般算法,它的特殊之處在于能夠模仿人類在解決問題時所表現(xiàn)出來的智能行為,進(jìn)而推動特定問題的解決[10]。比如,Mrowinski等分析了《塞爾維亞化學(xué)學(xué)會雜志》(Journal of the Serbian Chemical Society)運(yùn)用自然啟發(fā)進(jìn)化算法——笛卡兒遺傳規(guī)劃( Cartesian Genetic Programming),在保持相同數(shù)量審稿人的情況下只消耗了原本70%的評議時長[11];江虎軍等對我國國家自然科學(xué)基金(National Natural Science Foundation of China,NSFC)評審過程中的同行評議專家智能指派項目進(jìn)行分析,發(fā)現(xiàn)同行評議智能化完全可行,并且隨著相關(guān)工作的完善,其質(zhì)量會進(jìn)一步提升[12]。
AI算法不僅能夠輔助同行評議提升效率,同時通過不斷重復(fù)過程,能夠逐步建立起一套質(zhì)量判斷的新指標(biāo),進(jìn)而提升評議的科學(xué)性。但目前來看,AI輔助同行評議在算法設(shè)計、算法對于科學(xué)研究情境的識別以及算法合理性的規(guī)制等方面都尚處于起步階段。最后,無論NLP技術(shù)還是AI算法的加入,AI輔助同行評議的重要意義在于對傳統(tǒng)同行評議流程的標(biāo)準(zhǔn)化和自動化進(jìn)行改造,而這也是AI從“輔助”同行評議向深度“參與”同行評議,以及更深入地嵌入并逐步發(fā)揮主體性功能的重要體現(xiàn)。
2 AI輔助同行評議的應(yīng)用領(lǐng)域
傳統(tǒng)的同行評議在使用計算機(jī)設(shè)備時大多只是將其作為平臺性工具來進(jìn)行評議信息檢索和存取等活動,而在AI輔助同行評議中,AI將作為行動者在初審、送審和評審階段都發(fā)揮特定的作用。基于科研成果同行評議的獨(dú)特性,AI在其中的運(yùn)用呈現(xiàn)逐步深入的特征,主要集中在來稿審查、審稿人智能匹配以及學(xué)術(shù)影響力預(yù)測等方面。
2.1 AI輔助來稿審查
無論學(xué)術(shù)期刊來稿,還是科研項目申報投標(biāo)亦或是學(xué)位論文盲審,來稿審查是同行評議首要也是最基本的評議環(huán)節(jié)。一般而言,來稿審查主要涵蓋了結(jié)構(gòu)合理性審查、統(tǒng)計數(shù)據(jù)審查以及學(xué)術(shù)不端檢測等。具體來說,文本挖掘技術(shù)、關(guān)鍵詞掃描技術(shù)以及基于NLP技術(shù)的內(nèi)容剽竊檢測算法等前沿技術(shù)的運(yùn)用,使得AI可以對科研成果的結(jié)構(gòu)合理性、統(tǒng)計數(shù)據(jù)以及學(xué)術(shù)不端狀況進(jìn)行有效審查。
其中,學(xué)術(shù)不端智能檢測功能是AI輔助同行評議功能開發(fā)與應(yīng)用得最早、最普遍,以及相對發(fā)展成熟的領(lǐng)域。比如,全球最大的學(xué)術(shù)出版商愛思唯爾(Elsevier)在2015年就開發(fā)了線上審稿與編輯系統(tǒng)Evise,系統(tǒng)會自動與反剽竊軟件進(jìn)行關(guān)聯(lián),檢測文章是否存在抄襲情況。我國的知網(wǎng)學(xué)術(shù)不端檢測平臺通過對文本、公式、表格等進(jìn)行檢測,得出文獻(xiàn)相似度等總結(jié)性分析材料。此外,與之相似的還有萬方數(shù)據(jù)的文獻(xiàn)相似性檢測服務(wù)、維普論文檢測系統(tǒng)以及美國的CrossCheck等等。
2.2 AI輔助審稿人智能推薦
審稿人智能推薦是AI輔助同行評議的另一項重要應(yīng)用,主要是通過AI推薦算法在特定數(shù)據(jù)庫中篩選出最佳審稿人。具體來說,審稿人推薦算法一般包括對象匹配和約束條件兩個部分[13],通常是在給定的多重約束條件下通過作者共現(xiàn)網(wǎng)絡(luò)來進(jìn)行審稿人智能匹配。
審稿人的匹配與推薦過程能夠通過智能算法快速完成,從而有效提升審稿人推薦效率。相關(guān)研究表明,相較于人工審稿人指派,智能審稿人推薦與指派能夠更有效、更充分地利用所有符合約束條件的評議專家資源,同時也能夠更為精準(zhǔn)地進(jìn)行專家回避等,有效緩解評審專家超負(fù)荷評審問題[12]。相關(guān)實踐顯示,AI指派審稿人的效率約為人工指派的285倍[14],從而大大節(jié)約了人工送審成本。
我國各項科學(xué)基金項目管理機(jī)構(gòu)早就開始嘗試運(yùn)用AI技術(shù)輔助項目評審。比如,國家自然科學(xué)基金就引入評審專家AI指派系統(tǒng),利用NLP技術(shù)抓取在線學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫和科學(xué)家個人網(wǎng)頁,搜集潛在評審專家信息,再通過語義分析比較項目申報書與潛在評審專家在研究方向上的契合度,同時考量專家的學(xué)術(shù)信譽(yù)數(shù)據(jù),最終篩選出合適的審稿人[14]。但是,盡管通過設(shè)計對象匹配和約束條件兩種算法可在短時間內(nèi)篩選出符合條件的人員,但是由于地域或跨學(xué)科等約束條件無法進(jìn)行擇優(yōu)排序,導(dǎo)致推薦出來的人員可能并非現(xiàn)實中的最佳人選,仍需要人工進(jìn)行最終把關(guān)。此外,受限于專家?guī)煲约叭找嫫毡榈目鐚I(yè)研究帶來的挑戰(zhàn),目前相關(guān)基金項目的同行評議智能指派依然有待進(jìn)一步完善。
2.3 AI輔助學(xué)術(shù)影響力預(yù)測
學(xué)術(shù)影響力是科學(xué)研究評價的一個極為關(guān)鍵的指標(biāo),因此對其進(jìn)行有效預(yù)測是同行評議的重中之重,也是評價學(xué)者、機(jī)構(gòu)、期刊、國家等學(xué)術(shù)實體影響力的基礎(chǔ)工作[15]。截至目前,國內(nèi)外學(xué)界在學(xué)術(shù)影響力的評判上并無統(tǒng)一標(biāo)準(zhǔn),只能借被引頻次等間接指標(biāo)來推測。
通常而言,AI輔助科研成果影響力預(yù)測是借助ML技術(shù),通過挖掘數(shù)據(jù)的潛在規(guī)律來實現(xiàn)學(xué)術(shù)影響力預(yù)測功能,由此識別具有高影響力的科研成果。這對于科學(xué)研究管理者預(yù)測學(xué)科領(lǐng)域發(fā)展方向、研究主題以及推介重點(diǎn)研究成果等具有指導(dǎo)意義。根據(jù)現(xiàn)有的實踐經(jīng)驗來看,常用于預(yù)測論文、學(xué)者等學(xué)術(shù)影響力的ML方法主要有 NN、SVM、Markov 模型以及 XGBoost等[14]。目前,比較知名的實踐包括丹麥的UNSILO運(yùn)用NLP與ML技術(shù)提煉論文的結(jié)論和觀點(diǎn),形成內(nèi)容總結(jié)[16];美國的MBI通過建構(gòu)預(yù)測模型來推測審核稿件的未來被引頻次等[17]。
盡管從目前的狀況來看,AI輔助學(xué)術(shù)影響力預(yù)測還存在諸多局限性,學(xué)術(shù)影響力預(yù)測也成為目前AI輔助同行評議最難以取代人工的部分,但無疑這是未來AI輔助同行評議最具價值和發(fā)展前景的領(lǐng)域和方向。
3 AI輔助同行評議的倫理隱患
隨著AI參與同行評議實踐日益普遍化和程度不斷深化,一些附著于AI技術(shù)的問題以及AI參與到同行評議之中后帶來的全新倫理問題等開始逐漸顯現(xiàn)。其中,最令人擔(dān)憂和受到關(guān)注的就是效率與公平之間的沖突等倫理問題,在實踐中具體體現(xiàn)為“數(shù)據(jù)中心”的運(yùn)作邏輯、智能技術(shù)對“人的主體性”的剝離以及人機(jī)協(xié)同評議對傳統(tǒng)學(xué)術(shù)倫理造成的沖擊等方面。
3.1 “數(shù)據(jù)中心主義”的科學(xué)隱患
AI的三大基礎(chǔ)分別是算法、算力及數(shù)據(jù),其中數(shù)據(jù)是AI模型訓(xùn)練的前提。從AI輔助同行評議的基本場景與流程中也可以發(fā)現(xiàn),其運(yùn)行的基礎(chǔ)之一就是大量現(xiàn)有科研成果資料、行業(yè)數(shù)據(jù)、人口數(shù)據(jù)、同行專家信息等多種類型數(shù)據(jù)資料。得益于越來越普遍的科研數(shù)據(jù)共享與科研成果開放,利用海量專業(yè)科研數(shù)據(jù)訓(xùn)練專業(yè)的AI模型成為可能。
但隨著AI介入同行評議程度不斷加深,對于AI模型的智能程度也提出更高的要求,尤其是在AI參與到對科研成果的實質(zhì)性內(nèi)容的深層評估時,用于AI模型訓(xùn)練的數(shù)據(jù)質(zhì)量,尤其是數(shù)據(jù)的多樣性、公正性以及真實性,將直接影響到AI參與同行評議的公正、準(zhǔn)確以及科學(xué)性?!皵?shù)據(jù)中心”的運(yùn)作邏輯也給AI輔助同行評議埋下了隱患,比如延續(xù)社會性偏見、數(shù)據(jù)虛假等。
具體來說,這些海量的科研數(shù)據(jù)集本身在時間、語言以及地域等方面就可能存在巨大的不平衡,而這種不平衡必然會造成訓(xùn)練出來的AI模型帶有一定程度的偏見。這種偏見一方面可能延續(xù)了傳統(tǒng)社會性偏見(比如性別、地域、年齡等),另一方面可能在學(xué)術(shù)評議中進(jìn)一步強(qiáng)化目前互聯(lián)網(wǎng)環(huán)境下涌現(xiàn)的種種偏見。比如,數(shù)字鴻溝導(dǎo)致對“數(shù)字貧困”群體的忽視,這種對數(shù)字邊緣群體的偏見就會日積月累傳遞到學(xué)術(shù)研究中。此外,如何有效杜絕大量網(wǎng)絡(luò)虛假信息對同行評議AI模型的侵襲也將是一大挑戰(zhàn)。
3.2 “人的主體性”受到挑戰(zhàn)的風(fēng)險
就目前AI輔助同行評議的現(xiàn)狀來看,其發(fā)展尚處于初級階段,即對科學(xué)成果評判與管理的主體依然是人類,AI介入其中的程度還相對有限,或者說AI尚未成為同行評議的主導(dǎo)者。其原因在于同行評議流程和文本結(jié)構(gòu)尚未在學(xué)界統(tǒng)一,尤其是在學(xué)術(shù)影響力分析層面,評價標(biāo)準(zhǔn)未統(tǒng)一、涉及領(lǐng)域復(fù)雜、課題新穎無參考數(shù)據(jù)等問題可能導(dǎo)致現(xiàn)階段的AI無法進(jìn)行量化處理,只能成為人工評議的“助手”而不是“替身”[18]。
隨著AI智能化程度與整體算力不斷提升,AI參與同行評議的技術(shù)潛力與能力也將會得到快速釋放。不久的將來,AI參與同行評議的廣度與深度將會全面加強(qiáng),甚至出現(xiàn)AI輔助同行評議的“ChatGPT”或“iPhone”。這不免在同行評議領(lǐng)域引發(fā)關(guān)于AI的經(jīng)典擔(dān)憂:智能機(jī)器是否會取代人?也就是,AI是否會剝奪人對科學(xué)成果質(zhì)量把關(guān)、價值判斷以及管理等方面的主體性?
對于這些擔(dān)憂,首先需要明確和達(dá)成共識的是:AI輔助人類是未來社會各行各業(yè)發(fā)展的必然趨勢,也必將成為人們的生活與工作常態(tài)。同時,在科研成果評議上,AI目前無法完全取代人類。在此基礎(chǔ)上,我們再去思考科研成果判斷與管理當(dāng)中可能面臨的“人的主體性”被剝奪的問題,我們要做的并不是去拒絕或者有意弱化AI對同行評議的輔助,而是需要加強(qiáng)其學(xué)習(xí)能力,不斷完善數(shù)據(jù)庫和算法模型,改變單一的程序性能,使之能夠在繁瑣、復(fù)雜、新穎的真實環(huán)境下做出適當(dāng)?shù)呐袛嗪瓦x擇。同時,人類應(yīng)致力于在認(rèn)知能力上取得與科技相匹配的進(jìn)步,以實現(xiàn)在同行評議領(lǐng)域的“AI賦能”,進(jìn)而去規(guī)避“AI支配”。
3.3 對傳統(tǒng)學(xué)術(shù)倫理形成沖擊
隨著AI在科學(xué)研究領(lǐng)域的應(yīng)用日益廣泛,科學(xué)研究倫理層面的問題開始被觸及,比如AI創(chuàng)造的知識產(chǎn)權(quán)、智能造假、智能剽竊等。2023年1月,巴黎政治大學(xué)因其學(xué)生大量使用ChatGPT做作業(yè)而向其學(xué)生和教師發(fā)送電子郵件,要求禁止使用ChatGPT等AI工具,并頒布“AI禁令”[19]。長久以來,“圍繞著技術(shù)跨越的哲學(xué)反思是異常復(fù)雜的,也是險象環(huán)生的,往往需要人有更多的審慎”[20]。從AI輔助同行評議逐步發(fā)展為AI參與同行評議,如何建立起基于AI的科研倫理也必然成為必須面對的新的倫理問題。
在當(dāng)下的數(shù)據(jù)時代,AI作為一個嶄新的領(lǐng)域出現(xiàn),將智能輔助作為新元素融入數(shù)字文明時代,并成為類似于互聯(lián)網(wǎng)的一種大眾默認(rèn)功能。目前,AI輔助在學(xué)術(shù)影響力分析和審稿人篩選中仍處于研發(fā)狀態(tài),未能進(jìn)行大規(guī)模應(yīng)用。并且由于涉及知識產(chǎn)權(quán)問題,評議專家?guī)煲约罢撐膸炷芊袷占暾残枰鞣焦餐Γ块T應(yīng)出面協(xié)商,軟硬件技術(shù)提供高質(zhì)量保障,確保評議相關(guān)者利益不受損害,從而在AI逐步嵌入的過程中形成和完善基于“AI賦能”的科學(xué)成果管理與質(zhì)量判斷的科學(xué)倫理體系。
4 結(jié)語
科學(xué)技術(shù)發(fā)展是推動社會進(jìn)步的關(guān)鍵動力,而做好科研成果質(zhì)量控制是推動科學(xué)發(fā)展與成果轉(zhuǎn)化的關(guān)鍵環(huán)節(jié)。傳統(tǒng)同行評議從首次嘗試到逐步探索并制度化,再到全球范圍內(nèi)得到推廣,歷經(jīng)數(shù)百年發(fā)展至今,在公平與效率等方面都面臨著日益增大的調(diào)適與創(chuàng)新壓力。AI輔助同行評議在提升同行評議效率、簡化同行評議流程、縮短科研成果發(fā)表周期、科學(xué)指派審稿專家以及預(yù)測科研成果影響力等方面都具有重要價值,能夠有效提升同行評議的科學(xué)性。AI技術(shù)契合了同行評議社會化改革的發(fā)展方向,能夠應(yīng)用于同行評議的全過程和多領(lǐng)域。通過對AI輔助同行評議實踐的檢視發(fā)現(xiàn),學(xué)術(shù)機(jī)構(gòu)運(yùn)用數(shù)據(jù)庫進(jìn)行檢索和審查科研成果已經(jīng)相當(dāng)普遍,但是,目前AI輔助同行評議的整體層次尚待提升。
同時,我們也需要注意不應(yīng)當(dāng)過度依賴AI而忽視人的作用,否則可能會導(dǎo)致“AI輔助”同行評議變成“AI支配”同行評議。在此過程中也需要警惕AI自身的算法問題,以及由此產(chǎn)生的科學(xué)成果質(zhì)量判斷上的倫理挑戰(zhàn),尤其是可能會造成新的公平困境。如何協(xié)調(diào)AI與科研成果管理之間的關(guān)系,如何理順科研管理與算法治理之間的關(guān)系,是未來AI輔助乃至賦能同行評議需要進(jìn)一步探討的問題。
作者簡介
徐亦舒,男,安徽大學(xué)新聞傳播學(xué)院講師、編輯出版學(xué)系出版智庫研究員。研究方向:數(shù)字出版、政治傳播。
查欣雨,女,安徽大學(xué)新聞傳播學(xué)院碩士研究生。研究方向:數(shù)字文化、政治傳播。
參考文獻(xiàn)
劉紅,胡新和.學(xué)術(shù)期刊同行評審的發(fā)展、方式及挑戰(zhàn)[J].中國科技期刊研究,2005,16(5):605-608.
張彤,周云霞,蔡斐,等.學(xué)術(shù)期刊同行評議的歷史演進(jìn)[J].中國科技期刊研究,2019,30 (6):588-595.
付偉棠.我國學(xué)術(shù)期刊同行評議研究綜述[J].中國科技期刊研究,2019,30(8):819-826.
WALKER R,DA SILVA P R.Emerging trends in peer review:A survey[J].Frontiers in neuroscience,2015(9):169.
RUSSELL S J.Artificial intelligence a modern approach[M].New York:Pearson Education Inc,2010.
CHECCO A,BRACCIALE L,LORETI P,et al.AI-assisted peer review[J].Humanities and Social Sciences Communications,2021,8(1):1-11.
COZZA V,PETROCCHI M,SPOGNARDI A.A matter of words:NLP for quality evaluation of Wikipedia medical articles[C]//Web Engineering:16th International Conference,ICWE 2016,Lugano,Switzerland.Proceedings 16.Springer International Publishing,2016:448-456.
RAMACHANDRAN L,GEHRINGER E F,YADAV R K.Automated assessment of the quality of peer reviews using natural language processing techniques[J].International Journal of Artificial Intelligence in Education,2017,(27):534-581.
KOVANIS M,PORCHER R,RAVAUD P,et al.The global burden of journal peer review in the biomedical literature:Strong imbalance in the collective enterprise[J].PloS One,2016,11(11):e0166387.
燕曉婕.人工智能時代行政決策的法治化進(jìn)路[J].哈爾濱師范大學(xué)社會科學(xué)學(xué)報,2020,11(1):37-40.
MROWINSKI M J,F(xiàn)RONCZAK P,RONCZAK A,et al.Intelligence in peer review:How can evolutionary computation support journal editors?[J].PLoS One,2017,12(9):e0184711.
江虎軍,郝艷妮,徐巖英,等.國家自然科學(xué)基金項目同行評議的智能化探討[J].中國科學(xué)基金,2019,33(2):149-153.
PRICE S,F(xiàn)LACH P A.Computational support for academic peer review[J].Communications of the ACM,2017,60(3) :70-79.
張彤,尹歡,蘇磊,等.人工智能輔助學(xué)術(shù)同行評議的應(yīng)用及分類[J].中國科技期刊研究,2021,32(1):65-74.
白曉梅.基于社會網(wǎng)絡(luò)分析的學(xué)術(shù)影響力評估與預(yù)測[D].大連:大連理工大學(xué),2017.
董文杰,李苑.科技期刊智能出版工具:UNSILO平臺[J].中國科技期刊研究,2020,31(6):702-709.
HEAVEN D.AI peer reviewers unleashed to ease publishing grind[J].Nature,2018, 563(7733):609-610.
陳銳,王文玉.司法人工智能與人類法官的角色定位辨析[J/OL].重慶大學(xué)學(xué)報(社會科學(xué)版),2021:1-16[2023-06-12].網(wǎng)絡(luò)首發(fā).
界面新聞.巴黎政治大學(xué)禁用ChatGPT以防抄襲[EB/OL].(2023-01-28)[2023-06-12].https:/baijiahao.baidu.com/s?id=1756236407347221652amp;wfrspideramp;for=pc.
杜駿飛.何以為人?AI興起與數(shù)字化人類[J].南京社會科學(xué),2023(3):76-85.
Technical Potential, Application Fields and Ethical Concerns of AI-Assisted Peer Review
XU Yishu, ZHA Xinyu
School of Journalism and Communication, Anhui University, 230601, Hefei, China
Abstract: Peer review is an important quality control mechanism for scientific research, but traditional peer review faces challenges from efficiency and fairness in the development process. As an emerging technology, artificial intelligence (AI) has the potential to optimize traditional peer review. By analyzing relevant cases and research results of AI-assisted peer review, the technical potential, application fields, and possible ethical risks and challenges that maybe triggered by AI in peer review were sorted out.AI-assisted peer review is a promising technological exploration, but to ensure the scientificity, fairness and credibility, it is also necessary to fully consider and balance data quality, human-machine collaboration, and ethical norms in the actual "operation process, with a view to breaking through the bottleneck of traditional peer review.
Keywords: Peer review; Artificial intelligence; Intelligent transformation; Quality control