宋 歡, 陳金輝, 吳瑞林
(1.高技術(shù)研究發(fā)展中心, 北京 100044; 2.北京航空航天大學(xué)人文社會(huì)科學(xué)學(xué)院, 北京 100191; 3.清華大學(xué)公共管理學(xué)院, 北京 100084)
國(guó)家科技計(jì)劃是政府支持科技創(chuàng)新、高效配置科技資源的主要途徑,也是加快建設(shè)科技強(qiáng)國(guó)、實(shí)現(xiàn)高水平科技自立自強(qiáng)的關(guān)鍵載體。自2014年實(shí)施國(guó)家科技計(jì)劃管理改革以來(lái),改革開放后設(shè)立的一批科技計(jì)劃被優(yōu)化整合為布局合理、定位清晰的新五類國(guó)家科技計(jì)劃體系,包括國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家科技重大專項(xiàng)、技術(shù)創(chuàng)新引導(dǎo)專項(xiàng)(基金) 、基地和人才專項(xiàng)[1]。在國(guó)家科技計(jì)劃項(xiàng)目管理全流程中,項(xiàng)目評(píng)審立項(xiàng)環(huán)節(jié)更加備受關(guān)注,因其立項(xiàng)結(jié)果往往與科研工作者的科研事業(yè)和前途密切相關(guān)。隨著項(xiàng)目的數(shù)量和種類日益增多,對(duì)項(xiàng)目評(píng)審的要求也越來(lái)越高[2]。近年來(lái),關(guān)于項(xiàng)目評(píng)審的研究主要聚焦于評(píng)審概況分析[2-3]、項(xiàng)目評(píng)審方法[4-6]、專家評(píng)價(jià)模型[7-8]、專家遴選系統(tǒng)和專家?guī)旖ㄔO(shè)[9-11]等,而結(jié)合國(guó)家相關(guān)政策文件對(duì)評(píng)審工作中現(xiàn)存的一些瓶頸問(wèn)題進(jìn)行深入分析的相關(guān)文獻(xiàn)報(bào)道較為少見(jiàn)。
近70年來(lái),人工智能(AI)始終被稱作世界三大尖端技術(shù)之一,近年來(lái)更是取得了飛躍式的發(fā)展[12]。2017年7月,國(guó)務(wù)院印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,強(qiáng)調(diào)要抓住人工智能發(fā)展的重大歷史機(jī)遇,提出了面向2030年中國(guó)人工智能發(fā)展的戰(zhàn)略規(guī)劃[13]。2022年7月,科技部等六部門印發(fā)《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》的通知,推進(jìn)人工智能場(chǎng)景創(chuàng)新,著力解決人工智能重大應(yīng)用和產(chǎn)業(yè)化問(wèn)題,提升人工智能發(fā)展質(zhì)量和水平[14]。2022年年底,美國(guó)OpenAI人工智能實(shí)驗(yàn)室發(fā)布的ChatGPT成為當(dāng)今最強(qiáng)大的AI處理模型之一,以極快的速度引起學(xué)術(shù)界和企業(yè)界的現(xiàn)象級(jí)關(guān)注。全世界的互聯(lián)網(wǎng)巨頭都紛紛宣布對(duì)標(biāo)ChatGPT模型開發(fā)競(jìng)品,將這些模型統(tǒng)稱為類ChatGPT模型[15]。類ChatGPT具有卓越的自然語(yǔ)言理解能力和生成能力,在諸多領(lǐng)域都展現(xiàn)出良好的應(yīng)用前景,如教育教學(xué)[16]、編輯出版[15]、情報(bào)工作[17]以及學(xué)術(shù)研究[18]等,但在國(guó)家科技計(jì)劃項(xiàng)目管理中的應(yīng)用尚未見(jiàn)報(bào)道。那么,該如何利用類ChatGPT的強(qiáng)大功能來(lái)解決項(xiàng)目評(píng)審工作的瓶頸問(wèn)題,并盡可能避免其負(fù)面影響呢?
為回答上述問(wèn)題,結(jié)合現(xiàn)有的國(guó)家政策文件,深入探討中國(guó)國(guó)家科技計(jì)劃項(xiàng)目評(píng)審工作中亟待解決的問(wèn)題,以具體問(wèn)題作為導(dǎo)向和啟發(fā)源頭,基于類ChatGPT的技術(shù)優(yōu)勢(shì)提出其在項(xiàng)目評(píng)審工作中的4個(gè)潛在應(yīng)用以及可能存在的挑戰(zhàn),以期為國(guó)家科技計(jì)劃項(xiàng)目管理工作提供價(jià)值參考。
評(píng)審專家作為同行評(píng)議的主體,其評(píng)審意見(jiàn)是國(guó)家科技計(jì)劃項(xiàng)目立項(xiàng)的重要決策依據(jù),對(duì)國(guó)家科技資源合理配置起著關(guān)鍵作用。研究人員之所以對(duì)同行評(píng)議的過(guò)程感到不滿更可能是對(duì)評(píng)審專家的質(zhì)量或者選擇感到不滿[19]。尤其當(dāng)評(píng)審專家沒(méi)有認(rèn)清評(píng)審的重要責(zé)任和義務(wù),甚至急功近利、面對(duì)利益沖突難以維持學(xué)術(shù)界的純潔,其自身的科研誠(chéng)信和專業(yè)能力必然會(huì)受到各方質(zhì)疑,如此一來(lái)對(duì)國(guó)家科研事業(yè)的健康發(fā)展將產(chǎn)生很大的負(fù)面作用。對(duì)此,國(guó)家自然科學(xué)基金委員(以下簡(jiǎn)稱“基金委”)深入調(diào)研2015—2019年項(xiàng)目評(píng)審的實(shí)際情況,向項(xiàng)目申請(qǐng)人和評(píng)審專家開展了連續(xù)5年的滿意度調(diào)查[20]。部分調(diào)查結(jié)果顯示:超過(guò)10%的專家對(duì)于不熟悉的申請(qǐng)書選擇“找熟悉項(xiàng)目?jī)?nèi)容的專家?guī)兔υu(píng)審”;項(xiàng)目申請(qǐng)人反饋評(píng)審專家對(duì)“申請(qǐng)書研究?jī)?nèi)容的理解有偏差”“評(píng)審意見(jiàn)籠統(tǒng)空洞”;在通信評(píng)審和會(huì)議評(píng)審均存在小比例的打招呼現(xiàn)象,等等。這些現(xiàn)象或行為將不同程度地影響項(xiàng)目評(píng)審結(jié)果,進(jìn)而影響中國(guó)各領(lǐng)域科技發(fā)展的進(jìn)程乃至科技強(qiáng)國(guó)目標(biāo)的實(shí)現(xiàn)。
其實(shí),關(guān)于評(píng)審專家在項(xiàng)目評(píng)審中出現(xiàn)的異?,F(xiàn)象或者違規(guī)行為早已引起各項(xiàng)目管理部門的重視。中共中央辦公廳、國(guó)務(wù)院辦公廳于2018年印發(fā)的《關(guān)于深化項(xiàng)目評(píng)審、人才評(píng)價(jià)、機(jī)構(gòu)評(píng)估改革的意見(jiàn)》(以下簡(jiǎn)稱《三評(píng)改革》)以及教育部、科技部于2020年印發(fā)的《關(guān)于規(guī)范高等學(xué)校SCI論文相關(guān)指標(biāo)使用 樹立正確評(píng)價(jià)導(dǎo)向的若干意見(jiàn)》均強(qiáng)調(diào),應(yīng)對(duì)評(píng)審專家的實(shí)際表現(xiàn)予以記錄,建立誠(chéng)信檔案或信譽(yù)制度等,以嚴(yán)格規(guī)范評(píng)審行為[21-22]。基金委于2018年提出了“負(fù)責(zé)任、講信譽(yù)、計(jì)貢獻(xiàn)”的評(píng)審機(jī)制,對(duì)專家評(píng)審提出了包括倡導(dǎo)性規(guī)范、限制性規(guī)范和禁止性規(guī)范在內(nèi)的三類規(guī)范性行為,鼓勵(lì)項(xiàng)目評(píng)審中負(fù)責(zé)任、講信譽(yù)的行為,同時(shí)對(duì)不負(fù)責(zé)任、不講信譽(yù)的行為實(shí)行有效監(jiān)督,目前已取得了一定的效果[23]。然而,以上所涉及的對(duì)評(píng)審專家行為的規(guī)范和監(jiān)督機(jī)制,其本質(zhì)還是依靠專家嚴(yán)格自律。唯有高度重視和引導(dǎo)專家認(rèn)清評(píng)審過(guò)程的神圣不可侵犯,才是解決思想行為不端正的最佳途徑。
合作共享是推動(dòng)科技創(chuàng)新、迎接全球新科技革命和產(chǎn)業(yè)變革的利器。人類要破解共同發(fā)展難題,比以往任何時(shí)候都更需要國(guó)際合作和開放共享[24]。借鑒外籍專家的先進(jìn)經(jīng)驗(yàn)和創(chuàng)新理念、促進(jìn)對(duì)科技創(chuàng)新發(fā)展的研判和拔尖創(chuàng)新人才的培養(yǎng),對(duì)于中國(guó)國(guó)家科技計(jì)劃項(xiàng)目管理工作具有重要意義。2017年,為進(jìn)一步完善國(guó)際專家隊(duì)伍的建設(shè),科技部研究出臺(tái)了《科技部關(guān)于推進(jìn)外籍科學(xué)家深入?yún)⑴c國(guó)家科技計(jì)劃的指導(dǎo)意見(jiàn)》,明確提出鼓勵(lì)外籍科學(xué)家參與國(guó)家科技計(jì)劃的頂層設(shè)計(jì)、項(xiàng)目管理以及研究開發(fā)等相關(guān)工作的支持意見(jiàn)[25]?!度u(píng)改革》強(qiáng)調(diào),在部分前沿與基礎(chǔ)科學(xué)等領(lǐng)域逐步按適當(dāng)比例引入國(guó)際同行評(píng)價(jià),提高科技評(píng)價(jià)活動(dòng)的公開性和開放性,確保評(píng)價(jià)結(jié)果的科學(xué)性和客觀性[21]。
然而,科技部在2019年發(fā)布的《關(guān)于政協(xié)十三屆全國(guó)委員會(huì)第二次會(huì)議第2439號(hào)(科學(xué)技術(shù)類139號(hào))提案答復(fù)的函》中提到,國(guó)家重點(diǎn)研發(fā)計(jì)劃的在庫(kù)專家共計(jì)9萬(wàn)余人,其中外籍專家有1 260多名[26]。由此可見(jiàn),國(guó)家重點(diǎn)研發(fā)計(jì)劃的項(xiàng)目管理工作還是以國(guó)內(nèi)專家隊(duì)伍參與為主。究其根本,很大一部分原因在于語(yǔ)言差異給國(guó)際專家隊(duì)伍的建設(shè)帶來(lái)了阻礙。以外籍專家參與評(píng)審項(xiàng)目申請(qǐng)書為例,國(guó)家科技計(jì)劃的項(xiàng)目申請(qǐng)書可能在很長(zhǎng)一段時(shí)間內(nèi)都只能以中文為主,由于外籍科學(xué)家通常不會(huì)說(shuō)中文更不認(rèn)識(shí)漢字,難以對(duì)中文項(xiàng)目申請(qǐng)書進(jìn)行評(píng)閱。由此推斷,目前專家?guī)熘械耐饧畬<铱赡芑居赏饧A人組成,絕大部分非華人的外籍科學(xué)家由于語(yǔ)言不通難以深入?yún)⑴c到國(guó)家科技計(jì)劃的評(píng)審活動(dòng)中[27]。
研究人員尤其是早期研究人員作為評(píng)審專家,可以從項(xiàng)目評(píng)審工作中挖掘可利用的寶貴資源,及時(shí)了解所在領(lǐng)域的前沿動(dòng)態(tài)以及如何開展高質(zhì)量的研究、寫出有力論據(jù),對(duì)于提高科研思維能力和項(xiàng)目申請(qǐng)的命中率有較大幫助。然而,項(xiàng)目評(píng)審涉及的知識(shí)面既廣又專,即便是評(píng)審經(jīng)驗(yàn)豐富的專家也不太可能對(duì)項(xiàng)目申請(qǐng)書中的所有知識(shí)點(diǎn)或技術(shù)都精通?;鹞瘜?duì)2014—2021年函評(píng)專家的評(píng)審負(fù)荷進(jìn)行調(diào)研。統(tǒng)計(jì)結(jié)果表明,2020年、2021年被指派項(xiàng)目數(shù)在15項(xiàng)以上的函評(píng)專家占比分別為60%和35%,指派20項(xiàng)以上的函評(píng)專家約為6%[28]。此外,評(píng)審專家完成1份面上項(xiàng)目評(píng)審的平均時(shí)間約2 h,一個(gè)月內(nèi)若評(píng)審20份面上項(xiàng)目則需要約34 h[28]。這對(duì)于利用工作之余來(lái)評(píng)審項(xiàng)目的專家來(lái)說(shuō)依然是一項(xiàng)繁重的任務(wù)。評(píng)審負(fù)荷過(guò)重可能導(dǎo)致評(píng)審疲勞或者缺少足夠的時(shí)間和精力閱讀申請(qǐng)書并給出科學(xué)合理的意見(jiàn),影響評(píng)審效率和質(zhì)量。
自2018年以來(lái),科技部、財(cái)政部、教育部等先后實(shí)施了《貫徹落實(shí)習(xí)近平總書記在兩院院士大會(huì)上重要講話精神開展減輕科研人員負(fù)擔(dān)專項(xiàng)行動(dòng)方案》(減負(fù)行動(dòng)1.0)、《關(guān)于持續(xù)開展減輕科研人員負(fù)擔(dān) 激發(fā)創(chuàng)新活力專項(xiàng)行動(dòng)的通知》(減負(fù)行動(dòng)2.0)和《關(guān)于開展減輕青年科研人員負(fù)擔(dān)專項(xiàng)行動(dòng)的通知》(減負(fù)行動(dòng)3.0),旨在持續(xù)減輕科研人員的負(fù)擔(dān),充分激發(fā)創(chuàng)新活力[29]。此外,《三評(píng)改革》強(qiáng)調(diào),要提高項(xiàng)目評(píng)審的質(zhì)量和效率,合理確定專家的評(píng)審項(xiàng)目數(shù)量和總時(shí)長(zhǎng)等工作量[21]。一些項(xiàng)目評(píng)審輔助系統(tǒng)的研究成果也致力于減輕專家的評(píng)審工作負(fù)擔(dān)[30]。綜上,為評(píng)審專家提供更加人性化、高效率的評(píng)審輔助服務(wù),進(jìn)一步減輕專家的評(píng)審負(fù)荷,提高評(píng)審效率和質(zhì)量,使專家更加愿意參與項(xiàng)目評(píng)審工作,是項(xiàng)目管理專業(yè)機(jī)構(gòu)亟待實(shí)現(xiàn)的一個(gè)重要目標(biāo)。
專家?guī)斓慕ㄔO(shè)質(zhì)量是保障項(xiàng)目評(píng)審公正性的重要前提,但目前對(duì)于專家?guī)斓馁|(zhì)量還缺乏評(píng)估標(biāo)準(zhǔn)[31]。當(dāng)前,國(guó)家科技計(jì)劃專家?guī)熘械膶<移毡閬?lái)源于兩種途徑:一是向各高校院所或企業(yè)等集中征集,由專家本人提出申請(qǐng)及單位批量審核;二是將獲得項(xiàng)目資助的負(fù)責(zé)人直接轉(zhuǎn)為評(píng)審專家。一方面,通過(guò)這兩種方式入庫(kù)的專家通常為國(guó)內(nèi)專家;另一方面,針對(duì)第一種途徑,能否將各領(lǐng)域所有符合評(píng)審條件的專家全部入庫(kù),取決于各單位能否將有關(guān)專家征集的通知送達(dá)每一位潛在的候選專家,以及每一位候選專家是否在規(guī)定時(shí)間內(nèi)提出申請(qǐng)。作為專業(yè)機(jī)構(gòu),不應(yīng)被現(xiàn)有的專家推薦方式以及國(guó)界所局限,而應(yīng)化被動(dòng)為主動(dòng),在全球范圍內(nèi)海量征集符合條件的專家。尤其是對(duì)于偏冷門的學(xué)科或前沿交叉領(lǐng)域,小同行專家數(shù)量緊缺,更加需要探索多樣化的專家入庫(kù)渠道。
此外,有關(guān)國(guó)家科技計(jì)劃專家?guī)旖ㄔO(shè)的系統(tǒng)研究較少,如在庫(kù)專家的分布特點(diǎn)及其優(yōu)化對(duì)策等。2018年,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《三評(píng)改革》強(qiáng)調(diào)應(yīng)進(jìn)一步實(shí)現(xiàn)國(guó)家科技專家?guī)斓囊?guī)范統(tǒng)一,并細(xì)化專家的所在研究領(lǐng)域和方向,便于項(xiàng)目與專家的學(xué)術(shù)專長(zhǎng)進(jìn)行更精準(zhǔn)的匹配[21];2020年,教育部和科技部印發(fā)了《關(guān)于規(guī)范高等學(xué)校SCI論文相關(guān)指標(biāo)使用 樹立正確評(píng)價(jià)導(dǎo)向的若干意見(jiàn)》,鼓勵(lì)相關(guān)部門對(duì)專家的實(shí)際評(píng)審表現(xiàn)等方面進(jìn)行相應(yīng)評(píng)價(jià),并以此建立專家信譽(yù)制度[22];2021年,科技部等13部門聯(lián)合發(fā)布了《關(guān)于支持女性科技人才在科技創(chuàng)新中發(fā)揮更大作用的若干措施》,其中強(qiáng)調(diào)在各類評(píng)審工作中提高女性專家的參與比例,鼓勵(lì)更多符合評(píng)審條件的女性專家入庫(kù)[32]。由此可見(jiàn),隨著學(xué)科領(lǐng)域不斷交叉、新興學(xué)科的發(fā)展壯大,評(píng)審活動(dòng)也愈發(fā)頻繁和復(fù)雜,對(duì)于專家?guī)斓慕ㄔO(shè)提出了更高的要求,對(duì)以上政策文件所提及的專家領(lǐng)域及研究方向劃分、專家反評(píng)估和性別比例等方方面面都應(yīng)進(jìn)行系統(tǒng)全面的分析、總結(jié)與改進(jìn),從而更好地實(shí)施專家?guī)靹?dòng)態(tài)化管理。
國(guó)外的ChatGPT和星火認(rèn)知大模型是類ChatGPT模型的典型代表,其具體介紹如下。
ChatGPT是美國(guó)OpenAI人工智能實(shí)驗(yàn)室推出的生成式人工智能模型,于2022年11月上線僅僅兩個(gè)月就突破了一億用戶,成為歷史上用戶數(shù)量增長(zhǎng)最快的應(yīng)用程序[15]。其先后經(jīng)歷了多個(gè)版本的技術(shù)演變,于2023年3月正式發(fā)布ChatGPT4.0版本,相對(duì)于以前的版本,其數(shù)據(jù)規(guī)模更大、理解能力和文本生成能力等更勝一籌[33]。ChatGPT的成功受益于人類反饋強(qiáng)化學(xué)習(xí)的訓(xùn)練方法、超強(qiáng)的算力以及龐大的數(shù)據(jù)規(guī)模,不僅支持上下文理解和連續(xù)多輪對(duì)話,而且具備強(qiáng)大的邏輯推理能力,敢于質(zhì)疑和拒絕、承認(rèn)無(wú)知和錯(cuò)誤,在機(jī)器翻譯、對(duì)話問(wèn)答、文本理解與生成(包括小說(shuō)、劇本和論文等)、語(yǔ)法糾錯(cuò)、文本摘要以及程序代碼生成等方面都展現(xiàn)出優(yōu)異的性能,幾乎可以賦能各個(gè)行業(yè),吸引了無(wú)數(shù)的潛在用戶[33-37]。其巨大的發(fā)展?jié)摿κ沟酶鞔笃髽I(yè)巨頭瞄準(zhǔn)這一商機(jī),如國(guó)外的谷歌、微軟以及國(guó)內(nèi)的百度、阿里巴巴、科大訊飛等均在類ChatGPT大模型領(lǐng)域加快布局并已取得飛速進(jìn)展,這將極大推動(dòng)類ChatGPT模型及相關(guān)產(chǎn)業(yè)全面落地開花[15]。
雖然ChatGPT具備較好的智慧功能,但調(diào)用國(guó)外大模型面臨潛在的政治、經(jīng)濟(jì)及網(wǎng)絡(luò)安全等風(fēng)險(xiǎn),這預(yù)示著我國(guó)自主研發(fā)安全可控的通用認(rèn)知大模型勢(shì)在必行[18]。2023年5月6日,科大訊飛正式發(fā)布星火認(rèn)知大模型,經(jīng)歷了V1.5、V2.0版本之后,于2023年10月24日正式發(fā)布星火認(rèn)知大模型V3.0,其文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等七大核心能力持續(xù)提升[38]。國(guó)務(wù)院發(fā)展研究中心國(guó)研經(jīng)濟(jì)研究院的測(cè)評(píng)報(bào)告顯示,星火大模型V3.0的綜合能力達(dá)到了國(guó)內(nèi)領(lǐng)先水平,甚至達(dá)到了國(guó)際一流水平[39]。與ChatGPT相比,星火認(rèn)知大模型對(duì)于中國(guó)用戶來(lái)說(shuō)沒(méi)有任何注冊(cè)門檻和訪問(wèn)門檻,數(shù)據(jù)隱私方面也相對(duì)更安全。并且,星火認(rèn)知大模型的助手中心和插件功能十分強(qiáng)大。
綜合以上有關(guān)國(guó)家科技計(jì)劃項(xiàng)目評(píng)審工作的政策分析和所面臨的問(wèn)題,利用類ChatGPT模型的強(qiáng)大功能對(duì)項(xiàng)目管理工作賦能,逐一探討其在項(xiàng)目評(píng)審環(huán)節(jié)中的潛在應(yīng)用(圖1)??紤]到國(guó)家科技計(jì)劃項(xiàng)目評(píng)審的數(shù)據(jù)安全問(wèn)題,以下將使用國(guó)內(nèi)的類ChatGPT代表——星火認(rèn)知大模型對(duì)相關(guān)的內(nèi)容舉例論證。
圖1 類ChatGPT在國(guó)家科技計(jì)劃項(xiàng)目評(píng)審中的潛在應(yīng)用
張洪亮等[31]表示,評(píng)審專家由于缺乏項(xiàng)目管理經(jīng)驗(yàn),想要對(duì)整個(gè)資助體系或各項(xiàng)改革措施深入了解需要花費(fèi)較長(zhǎng)時(shí)間,否則很難充分理解評(píng)審程序以及評(píng)審要義,因此對(duì)評(píng)審專家開展系統(tǒng)性培訓(xùn)十分必要。更重要的是,評(píng)審專家作為國(guó)家科技計(jì)劃項(xiàng)目的“把關(guān)人”,一旦對(duì)評(píng)審的責(zé)任義務(wù)認(rèn)識(shí)不清,或在個(gè)人利益和作為受托者代表的國(guó)家利益選擇上發(fā)生信念搖擺甚至信念缺失,極容易影響項(xiàng)目評(píng)審的公正性。因此,通過(guò)建立系統(tǒng)有效的教育培訓(xùn)機(jī)制,讓專家徹底認(rèn)清參與評(píng)審的真正使命,重視規(guī)范自己的評(píng)審行為,才能更好地自我監(jiān)督,有助于形成公正的評(píng)審環(huán)境。
在現(xiàn)實(shí)生活中,評(píng)審專家可能很難找到合適的交談對(duì)象,來(lái)探討有關(guān)評(píng)審使命、評(píng)審行為等敏感、嚴(yán)肅而有深度的話題。類ChatGPT能夠提供高度擬人化的對(duì)話問(wèn)答模式,在評(píng)審專家教育培訓(xùn)機(jī)制的建立過(guò)程中作為教育培訓(xùn)助手,發(fā)揮人文啟蒙以及情感調(diào)節(jié)的作用,使專家在輕松愉快的互動(dòng)過(guò)程中潛移默化地接受教育培訓(xùn)[40]。這種擴(kuò)展能夠觸動(dòng)評(píng)審專家新的人文思考,如善意、公正、教養(yǎng)、理性交往等,影響當(dāng)下的認(rèn)知和道德狀況,甚至主導(dǎo)專家的評(píng)審態(tài)度與行為,促使評(píng)審專家客觀理性地看待評(píng)審工作,樹立正確的評(píng)審觀念。圖2演示了評(píng)審專家與星火認(rèn)知大模型探討“如何更好地拒絕請(qǐng)托行為”的對(duì)話過(guò)程。整個(gè)對(duì)話內(nèi)容不僅展現(xiàn)出評(píng)審專家拒絕請(qǐng)托行為所存在的憂慮,而且證明了模型本身?yè)碛卸噍唽?duì)話的記憶功能和正確的三觀,其再三強(qiáng)調(diào)評(píng)審專家應(yīng)遵守職業(yè)道德和誠(chéng)信原則,引導(dǎo)評(píng)審專家必須公正評(píng)審,有助于營(yíng)造風(fēng)清氣正的評(píng)審環(huán)境。此外,未來(lái)還可能通過(guò)類ChatGPT來(lái)收集不同群體個(gè)性化特征的大數(shù)據(jù),發(fā)掘不同評(píng)審專家群體在不同階段的需求,從而提供針對(duì)性和有效性的教育培訓(xùn)服務(wù)。
圖2 星火認(rèn)知大模型與評(píng)審專家進(jìn)行互動(dòng)的示例
ChatGPT作為世界上最先進(jìn)的AI語(yǔ)言模型之一,盡管不是專門為翻譯而設(shè)計(jì)的,但其擁有超級(jí)海量、地道的外文資源,能夠進(jìn)行順暢對(duì)話的語(yǔ)種超過(guò)數(shù)百種,并已從自然語(yǔ)言文本的語(yǔ)法或句法處理的初級(jí)階段升級(jí)到邏輯、語(yǔ)義和情感處理的高級(jí)階段,提供遠(yuǎn)超傳統(tǒng)翻譯工具的靈活性和可靠性[41]。張重毅等[12]對(duì)ChatGPT的中英文翻譯表現(xiàn)方面進(jìn)行了測(cè)試,發(fā)現(xiàn)其翻譯結(jié)果與專業(yè)人工翻譯的整體質(zhì)量不相上下,內(nèi)容完整準(zhǔn)確、表達(dá)清晰流暢、語(yǔ)法標(biāo)準(zhǔn)規(guī)范,擁有比商業(yè)翻譯軟件更自然更出色的實(shí)時(shí)語(yǔ)言轉(zhuǎn)換能力,并且還能通過(guò)專業(yè)詞匯和學(xué)科基礎(chǔ)原理的預(yù)訓(xùn)練微調(diào),獲得領(lǐng)域?qū)S玫恼Z(yǔ)言轉(zhuǎn)換器,使跨語(yǔ)種學(xué)術(shù)交流成為可能。
由此可見(jiàn),類ChatGPT給項(xiàng)目管理工作帶來(lái)了更多的機(jī)遇。在其幫助之下,語(yǔ)言將不再成為外籍專家參與中國(guó)國(guó)家科技計(jì)劃項(xiàng)目管理工作的溝通障礙,它將被用作翻譯助手,對(duì)中文項(xiàng)目申請(qǐng)書等重要文件進(jìn)行多語(yǔ)種翻譯,指派給不同國(guó)家的評(píng)審專家進(jìn)行評(píng)閱,從而實(shí)現(xiàn)國(guó)際化評(píng)審。不僅如此,評(píng)審專家還可以利用類ChatGPT對(duì)評(píng)審過(guò)程中想要查閱的外文資料進(jìn)行翻譯,更加高效高質(zhì)地完成項(xiàng)目評(píng)審工作。圖3所示為本文第一作者上傳的博士學(xué)位論文部分中文摘要,要求星火認(rèn)知大模型將其分別翻譯成英文和法語(yǔ)。可以看出,翻譯內(nèi)容的語(yǔ)法標(biāo)準(zhǔn)規(guī)范、語(yǔ)句完整流暢??偠灾?類ChatGPT將助力國(guó)家科技計(jì)劃項(xiàng)目管理工作走向國(guó)際化,打造一支開放包容、實(shí)力雄厚、具有全球競(jìng)爭(zhēng)力的國(guó)際專家隊(duì)伍。
圖3 星火認(rèn)知大模型為評(píng)審專家提供英語(yǔ)和法語(yǔ)翻譯的示例
評(píng)審專家的反饋意見(jiàn)是項(xiàng)目申請(qǐng)人改進(jìn)課題研究設(shè)計(jì)、啟發(fā)科研思維的寶貴資源。然而,想要為項(xiàng)目申請(qǐng)者或其研究課題提供負(fù)責(zé)任、有較高參考價(jià)值的評(píng)審意見(jiàn),評(píng)審專家必須花費(fèi)較多的精力和時(shí)間通讀和把握申請(qǐng)書的精髓,對(duì)于不確定或是不熟悉的研究背景需盡快查找相關(guān)文獻(xiàn)加以理解。上述工作對(duì)于科研任務(wù)本就繁重的評(píng)審專家來(lái)說(shuō),無(wú)異于進(jìn)一步加重了工作負(fù)擔(dān)。
有了類ChatGPT的幫助,評(píng)審專家可以通過(guò)提問(wèn)的形式,要求類ChatGPT對(duì)申請(qǐng)書和相關(guān)文獻(xiàn)提煉核心要點(diǎn)、解釋專有名詞的概念,甚至解答一些綜合性的問(wèn)題[18]。以本文第一作者的博士學(xué)位論文《基于滾環(huán)擴(kuò)增技術(shù)的DNA水凝膠的構(gòu)建及其應(yīng)用》為例,這篇論文在2019年經(jīng)過(guò)了4位評(píng)審專家的盲審,得到的分?jǐn)?shù)分別是93(優(yōu))、92(優(yōu))、85(良)和77(良)。向星火認(rèn)知大模型詢問(wèn)DNA(脫氧核糖核酸)水凝膠的最新進(jìn)展,它將DNA水凝膠的研究進(jìn)展高度凝練為6點(diǎn),即自修復(fù)和自適應(yīng)功能、藥物輸送系統(tǒng)、細(xì)胞培養(yǎng)和組織工程、生物傳感、基因編輯、3D打印技術(shù)。這些基本是DNA水凝膠近年來(lái)的研究熱點(diǎn),使用戶對(duì)DNA水凝膠的概念、功能或應(yīng)用有快速、清晰的認(rèn)識(shí)。此外,類ChatGPT還能提供輔助評(píng)審以及評(píng)審意見(jiàn)潤(rùn)色修改的功能。如圖4(a)所示,星火認(rèn)知大模型對(duì)該論文給出了較為中肯的評(píng)審意見(jiàn),對(duì)于每一項(xiàng)評(píng)價(jià)都能給出充分的理由,與論文盲審的大部分評(píng)審意見(jiàn)具有較高的一致性。但如果能針對(duì)論文的不足之處給出更加具體、可操作性強(qiáng)的指導(dǎo)意見(jiàn)會(huì)更好。需要注意的是,模型本身一直在更新迭代,不是完美的,所提供的答案無(wú)法保證百分百正確,需要用戶有辨別的能力。例如,由于其自身的局限性,對(duì)論文規(guī)范性的理解存在瑕疵,對(duì)原本正確的文本可能產(chǎn)生誤判,即第4條關(guān)于“亞甲基藍(lán)(Methylene Blue, MB),阿霉素(doxorubicin,DOX) ”的內(nèi)容實(shí)際上是正確的。隨后,從4位評(píng)審專家的評(píng)審意見(jiàn)中挑出一份語(yǔ)言錯(cuò)誤比較多的評(píng)審意見(jiàn),讓該模型進(jìn)行潤(rùn)色修改,結(jié)果如圖4(b)所示。該模型不僅修正了多處明顯的語(yǔ)法和標(biāo)點(diǎn)符號(hào)錯(cuò)誤,而且還對(duì)個(gè)別詞語(yǔ)進(jìn)行了合并或替換,讀起來(lái)更加流暢,如將“多邊形DNA水凝膠,軟刷型DNA水凝膠以及蜘蛛網(wǎng)型DNA水凝膠”中的3個(gè)DNA水凝膠合并為1個(gè),并將逗號(hào)改為頓號(hào)。
圖4 星火認(rèn)知大模型為評(píng)審專家提供輔助評(píng)審以及評(píng)審意見(jiàn)修改服務(wù)的示例
為被評(píng)項(xiàng)目精準(zhǔn)匹配評(píng)審專家是保障同行評(píng)議質(zhì)量的關(guān)鍵,AI在專家遴選方面的應(yīng)用尤為矚目且備受期待。然而,由于AI技術(shù)本身難度大且應(yīng)用的實(shí)際情況復(fù)雜,國(guó)內(nèi)外的項(xiàng)目管理智能化探索尚處于起步階段。自2012年,基金委開始嘗試多種AI方法對(duì)已入庫(kù)的評(píng)審專家和項(xiàng)目進(jìn)行匹配,目前已通過(guò)建立全學(xué)科大規(guī)模知識(shí)圖譜、申請(qǐng)書/評(píng)審專家多維學(xué)術(shù)畫像、基于指派效果反饋的評(píng)審專家多層級(jí)匹配策略,利用AI實(shí)現(xiàn)專家遴選工作[42]。結(jié)果表明,AI對(duì)學(xué)術(shù)前沿和關(guān)鍵科學(xué)問(wèn)題的了解更加深入,顯著提高了專家指派效率、評(píng)審項(xiàng)目共識(shí)度和上會(huì)率[43]。與其他AI技術(shù)不同的是,類ChatGPT能夠使項(xiàng)目管理者通過(guò)限定研究領(lǐng)域、國(guó)籍等條件,在全球范圍內(nèi)遴選候選專家并獲取其公開的個(gè)人信息,而不僅僅限于已入庫(kù)的專家。如圖5所示,星火認(rèn)知大模型根據(jù)提問(wèn)的要求,推薦了與納米材料研究相關(guān)的單位和學(xué)者,同時(shí)提供了相應(yīng)的簡(jiǎn)介。其中,圖5(b)的兩個(gè)問(wèn)題主要區(qū)別在于國(guó)籍的限定。如果限定了中國(guó)籍,那么所推薦的是中國(guó)學(xué)者或者華裔學(xué)者;如果沒(méi)有限定中國(guó)籍,那么就所推薦的學(xué)者來(lái)自全球不同的國(guó)家。這對(duì)于評(píng)審專家的遴選工作有較大的參考價(jià)值。如果對(duì)所推薦的專家不滿意,還可以通過(guò)多輪對(duì)話的形式提出進(jìn)一步的要求,讓類ChatGPT不斷推薦符合項(xiàng)目申請(qǐng)書的候選專家,而無(wú)須傾注大量心血組織各單位在全國(guó)范圍內(nèi)征集專家或者建立復(fù)雜的模型匹配專家,顯著降低專家?guī)旃芾沓杀镜耐瑫r(shí)提高工作效率。
圖5 星火認(rèn)知大模型為專業(yè)機(jī)構(gòu)推薦評(píng)審單位和評(píng)審專家的示例
此外,專業(yè)機(jī)構(gòu)應(yīng)加強(qiáng)對(duì)專家?guī)煨畔⒌母櫿{(diào)研,在建立評(píng)價(jià)標(biāo)準(zhǔn)的情況下,一方面從整個(gè)專家?guī)斓娜藬?shù)、性別比例、單位類別、領(lǐng)域劃分、反評(píng)估結(jié)果以及信息更新情況等方面定期評(píng)估專家?guī)斓慕ㄔO(shè)質(zhì)量,另一方面可參考全球最大的同行評(píng)議平臺(tái)Publons,盡量豐富專家個(gè)人數(shù)據(jù),如對(duì)每一位專家的項(xiàng)目評(píng)審數(shù)量、命中率和離散率等反評(píng)估情況進(jìn)行分析比較和記錄存檔[31]。針對(duì)這類專家?guī)旃芾淼墓ぷ?可以利用類ChatGPT生成相應(yīng)的PPT(微軟演示文稿文件)模板,節(jié)約PPT的構(gòu)思時(shí)間,提高專業(yè)機(jī)構(gòu)管理人員的工作效率。如圖6所示,只提出讓星火認(rèn)知大模型制作一份國(guó)家重點(diǎn)研發(fā)計(jì)劃專家組成分析的PPT模板,模型就能生成一份27頁(yè)的PPT模板,連報(bào)告的名稱都能自動(dòng)生成,甚至在沒(méi)有任何提示的情況下,就生成了PPT目錄下的6個(gè)板塊內(nèi)容,包括國(guó)家重點(diǎn)研發(fā)計(jì)劃的概述、專家團(tuán)隊(duì)在國(guó)家重點(diǎn)研發(fā)計(jì)劃中的角色、專家團(tuán)隊(duì)的構(gòu)成和選拔、專家團(tuán)隊(duì)的工作模式和方法、專家團(tuán)隊(duì)的成果和影響、專家團(tuán)隊(duì)的未來(lái)發(fā)展和展望,每個(gè)板塊下還有對(duì)應(yīng)的小標(biāo)題、文字描述以及插圖。這些內(nèi)容的設(shè)計(jì)能夠清晰地展現(xiàn)、提示和指引用戶在專家?guī)旃芾砉ぷ髦行枰瓿傻墓ぷ魅蝿?wù),給工作任務(wù)的規(guī)劃者和執(zhí)行者帶來(lái)很大的啟發(fā)。2023年3月16日,微軟公司推出 Microsoft 365 Copilot,即將GPT4.0全面接入Office全套商業(yè)軟件,開啟全新的工作方式,通過(guò)該技術(shù)可以將專家?guī)斓母黝悢?shù)據(jù)使用自然語(yǔ)言生成 PPT、在 Excel 中輕松進(jìn)行趨勢(shì)分析、創(chuàng)建可視化圖表等,大大提升工作效率,助力專家?guī)旄咝?dòng)態(tài)管理[44]。
圖6 星火認(rèn)知大模型為專業(yè)機(jī)構(gòu)制作專家?guī)旃芾硭璧腜PT模板的示例
類ChatGPT在教育培訓(xùn)、翻譯、評(píng)閱和專家?guī)旃芾淼炔煌瑘?chǎng)景的應(yīng)用,將大幅提升項(xiàng)目評(píng)審工作的效率和質(zhì)量。但是,類ChatGPT技術(shù)如同一把雙刃劍,強(qiáng)大的功能之下還隱藏著危機(jī)和挑戰(zhàn)。下文從不同角度分別論述并提出相應(yīng)的對(duì)策。
類ChatGPT以極低的時(shí)間成本為項(xiàng)目管理者和評(píng)審專家提供各種便利,與此同時(shí),極易導(dǎo)致他們對(duì)類ChatGPT的過(guò)度依賴,從而弱化參與評(píng)審工作的主觀能動(dòng)性和創(chuàng)造性。例如,項(xiàng)目管理者利用類ChatGPT批量搜索并生成某個(gè)研究領(lǐng)域的專家名單及其相應(yīng)的專家信息,便依據(jù)此名單邀請(qǐng)專家參與評(píng)審,可能導(dǎo)致項(xiàng)目管理者忽視對(duì)學(xué)科分類、研究方向以及項(xiàng)目背景的細(xì)節(jié)進(jìn)行深入理解和區(qū)分,從而錯(cuò)失了更優(yōu)化的專家匹配效果;或者評(píng)審專家借助類ChatGPT搜索與項(xiàng)目申請(qǐng)相關(guān)的文獻(xiàn)并提取核心內(nèi)容,爭(zhēng)取在短時(shí)間內(nèi)了解領(lǐng)域前沿,可能會(huì)缺少只有認(rèn)真研讀文獻(xiàn)才能帶來(lái)的深刻感悟與啟發(fā)。因此,類ChatGPT為使用者提供便利的同時(shí),也容易導(dǎo)致評(píng)審工作趨向固化,削弱評(píng)審相關(guān)人員進(jìn)一步思考、探索和創(chuàng)新的動(dòng)力。
針對(duì)類似的情況,使用者要清楚地認(rèn)識(shí)到,人類有情感、主動(dòng)性和創(chuàng)造力,而AI只是模擬和拓展人的智能,始終無(wú)法完全替代人腦。因此,應(yīng)當(dāng)對(duì)類ChatGPT的應(yīng)用場(chǎng)景和范圍進(jìn)行限定。例如,可以將一些基礎(chǔ)煩瑣的事務(wù)交給類ChatGPT來(lái)完成,而一旦涉及想象力、創(chuàng)新性或者需要深入思考的任務(wù)則由人類來(lái)完成,以此明確人與類ChatGPT的分工,營(yíng)造人機(jī)高度協(xié)同的最佳工作模式。唯有一邊主動(dòng)順應(yīng)新的技術(shù)變革以尋找突破,一邊堅(jiān)守“以人為本”的核心價(jià)值,才能真正促進(jìn)評(píng)審工作的持續(xù)發(fā)展。
實(shí)際上,類ChatGPT的準(zhǔn)確性遠(yuǎn)高于傳統(tǒng)搜索引擎,但由于類ChatGPT的數(shù)據(jù)源來(lái)自海量互聯(lián)網(wǎng)數(shù)據(jù),包括維基百科、書籍、期刊、社交媒體網(wǎng)站以及網(wǎng)頁(yè)爬蟲等,且其本質(zhì)上仍是根據(jù)提示詞概率分布關(guān)系生成關(guān)聯(lián)內(nèi)容的語(yǔ)言模型,難以保證其所提供的內(nèi)容全部是真實(shí)可靠的[18, 45]。再者,即便類ChatGPT的答案是錯(cuò)誤的,但它回答問(wèn)題的語(yǔ)氣卻十分自信,因此使用者在采納類ChatGPT的答案時(shí),應(yīng)具有一定的辨別和取舍能力。例如,盡管類ChatGPT具有內(nèi)置道德模型,但其仍可能因?yàn)樘釂?wèn)形式不同而繞過(guò)模型甚至通過(guò)有效捕捉網(wǎng)絡(luò)上各種真?zhèn)坞y辨的信息,偏離對(duì)評(píng)審專家進(jìn)行培訓(xùn)的初衷。此外,類ChatGPT所提供的答案或道德建議不具有一致性,也可能對(duì)評(píng)審專家的認(rèn)知、道德決策等多方面都造成不良影響或嚴(yán)重沖擊[46]。
從使用者的角度來(lái)看,不僅需要對(duì)類ChatGPT所提供的答案保持時(shí)刻警醒,而且需要加強(qiáng)批判性思維和倫理意識(shí),在正式采納類ChatGPT生成的內(nèi)容之前,花費(fèi)一些時(shí)間和精力進(jìn)行溯源性審查,確保不被其所誤導(dǎo)。此外,在構(gòu)建數(shù)據(jù)集時(shí),應(yīng)過(guò)濾篩選掉權(quán)威性較低的數(shù)據(jù)源,如一些社交網(wǎng)站或開放式問(wèn)答社區(qū)。
類ChatGPT尚未成為成熟的產(chǎn)品,難以保障用戶的隱私安全和數(shù)據(jù)安全。OpenAI 官方提示,人工訓(xùn)練師可能會(huì)查看人們與類ChatGPT的對(duì)話,以改進(jìn)系統(tǒng)和模型。但是,從事項(xiàng)目評(píng)審工作的重要前提是具備保障項(xiàng)目評(píng)審安全的意識(shí),如基金委印發(fā)了《國(guó)家自然科學(xué)基金項(xiàng)目評(píng)審回避與保密管理辦法》,規(guī)定其相關(guān)的工作人員和評(píng)審專家應(yīng)當(dāng)對(duì)評(píng)審工作的一些重要信息履行保密義務(wù),包括評(píng)審專家名單及基本情況、評(píng)審意見(jiàn)、評(píng)審結(jié)果等。尤其是國(guó)外的類ChatGPT模型,很可能導(dǎo)致政府信息和個(gè)人信息的大規(guī)模泄露,甚至威脅國(guó)家安全。
AI技術(shù)研發(fā)是一項(xiàng)高風(fēng)險(xiǎn)、高投入的工作,需要市場(chǎng)的長(zhǎng)期努力和支持。從政策支持上,國(guó)家需要選拔一批為夢(mèng)想而堅(jiān)持研發(fā)的人才,鼓勵(lì)他們從事中國(guó)版ChatGPT的研發(fā)從而降低國(guó)外技術(shù)依賴,實(shí)現(xiàn)技術(shù)自主可控性;從管理監(jiān)督上,應(yīng)當(dāng)加強(qiáng)對(duì)AI技術(shù)的風(fēng)險(xiǎn)數(shù)據(jù)實(shí)時(shí)監(jiān)控并定期進(jìn)行安全風(fēng)險(xiǎn)評(píng)估,同時(shí)做好用戶反饋工作,更好地保護(hù)用戶隱私和國(guó)家數(shù)據(jù)安全,確保類ChatGPT的安全性和可控性。此外,使用者在對(duì)話過(guò)程中應(yīng)避免提及敏感信息或重要數(shù)據(jù),有效防范數(shù)據(jù)外泄。
以ChatGPT為代表的AI技術(shù)爆發(fā)的時(shí)代,催化新一輪科技革命和產(chǎn)業(yè)變革,成為各行各業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的重要驅(qū)動(dòng)力。國(guó)家科技計(jì)劃項(xiàng)目管理工作中還存在著一些亟待突破的瓶頸,AI技術(shù)的出現(xiàn)將成為這些問(wèn)題的突破口,以顛覆傳統(tǒng)項(xiàng)目管理的模式,使項(xiàng)目管理者和評(píng)審專家從基礎(chǔ)、繁重的事務(wù)性勞動(dòng)中解脫出來(lái),擁有更多的時(shí)間投身自己感興趣、充滿探索性和創(chuàng)新性的工作任務(wù)中,以進(jìn)一步挖掘自身的潛能,促進(jìn)個(gè)人的可持續(xù)發(fā)展。
以ChatGPT為代表的AI模型掀起技術(shù)狂潮之下,帶來(lái)的不只是高效便捷,尚有一些技術(shù)性、倫理性和不確定性的難題亟待解決。因此,使用者應(yīng)始終堅(jiān)持新興技術(shù)的工具價(jià)值和客體地位,通過(guò)理性、辯證地看待背后的危機(jī)和風(fēng)險(xiǎn),明確使用限度,充分發(fā)揮類ChatGTP的正向價(jià)值,規(guī)避不利后果,使AI技術(shù)能夠更好地服務(wù)于國(guó)家科技計(jì)劃項(xiàng)目評(píng)審工作。