關(guān)鍵詞:人工智能;ChatGPT;科技期刊出版;知識創(chuàng)新;科技話語權(quán)
一、引言
作為第四次工業(yè)革命的標志之一,近年來人工智能(artificialintelligence,英文縮寫AI)技術(shù)發(fā)展迅猛,從2016年的以AlphaGo為代表的狹義人工智能或弱人工智能,到2022年的以ChatGPT為代表的基于自然語言處理的人工智能,不斷地對各行各業(yè)產(chǎn)生顛覆性的影響。ChatGPT發(fā)布5天就吸引了超過100萬名用戶,[1]引發(fā)了全球使用熱潮,也引起了巨大的震撼和爭議,帶來了廣泛的學術(shù)討論和研究。
爭議首先來自對于ChatGPT的看法。以MIT(MassachusettsInstituteofTechnology,麻省理工學院)著名語言學家喬姆斯基(NoamChomsky)為代表的學者,認為ChatGPT等人工智能原則上不能告訴我們關(guān)于語言、學習、認知的任何事情,只是一個大型的剽竊系統(tǒng);相反的觀點則認為其有心智和理解力,在智能和知識儲存方面超越了很多人;[2]基于對ChatGPT內(nèi)在架構(gòu)的分析,宋(PaulSong)等[3]2129-2130認為ChatGPT以及目前其他AI都是基于歸納推理的搜索系統(tǒng),如果在架構(gòu)中未能做出根本性的變革,則AI并不具有演繹推理、辯證推理、不連續(xù)推理以及全局考慮問題的能力,其所能挑戰(zhàn)的人類智力水平并不高于一位優(yōu)秀的大學生。對于AI生成的內(nèi)容,學界也普遍持謹慎態(tài)度。[4]這種審慎態(tài)度主要針對AI技術(shù)帶來的風險與挑戰(zhàn),如生成內(nèi)容的知識產(chǎn)權(quán)問題、安全與隱私問題、價值觀與倫理問題、認知對抗問題等。[5?7]
因此,目前除了從技術(shù)的角度對AI進行研究[8]外,相關(guān)研究主要聚焦AI的應(yīng)用可能給各行各業(yè)帶來的影響。[9?10]對于出版行業(yè),張重毅等[11]以實際文字案例為基礎(chǔ),測試了ChatGPT在處理定義性開放問答、總結(jié)全文并生成摘要及翻譯方面的表現(xiàn),分析了其為學術(shù)出版帶來的機遇和挑戰(zhàn);王樹義等[12]通過訓練ChatGPT編寫爬蟲程序、提煉文本主題、改變寫作風格等,討論了ChatGPT給科研帶來的挑戰(zhàn);還有研究從AI運行邏輯架構(gòu)和特性出發(fā),在宏觀層面上探討其給出版業(yè)帶來的發(fā)展思路與潛在風險。[13?15]
技術(shù)的進步勢不可擋、不可逆轉(zhuǎn),技術(shù)革新帶來的機遇與挑戰(zhàn)也是并存的。面對這項新的生產(chǎn)工具,目前,出版界關(guān)于AI可能為業(yè)內(nèi)帶來的影響的論斷,主要是基于單一的文本實例或者宏觀上的學理思考所得。但是,自然科學類科技論文的寫作和出版有別于人文類的論文,前者不僅對語言文字表達能力有一定的要求,更需要可靠的數(shù)學推理能力、扎實的實驗實現(xiàn)能力、合理的數(shù)據(jù)分析能力和深邃的趨勢洞察能力。在這些能力形成的過程中,AI究竟能發(fā)揮多大的作用、對科技論文的創(chuàng)作和出版會帶來哪些實際的幫助和潛在的風險、如何有效利用其優(yōu)點并規(guī)避其缺點等,是目前科技期刊出版業(yè)面臨的現(xiàn)實問題。本文利用ChatGPT及其相關(guān)應(yīng)用,參與筆者長期從事的關(guān)于軌道角動量(orbitalangularmomentum,英文縮寫OAM)光場領(lǐng)域的科技論文的創(chuàng)作和相關(guān)論文出版的全過程,從實例操作中歸納AI給科技期刊出版帶來的機遇和挑戰(zhàn),并有針對性地提出相應(yīng)的對策。
二、AI在科技論文創(chuàng)作中的作用和局限
科技論文常分為綜述類論文和研究型論文。論文的創(chuàng)作都涉及文獻的查找和閱讀,其中,綜述類論文涉及研究的背景、目前的應(yīng)用和對未來發(fā)展的展望等,需要撰寫者有廣博的知識儲備和對研究發(fā)展趨勢敏銳的洞察力;研究型論文除了要求對研究背景的了解,還涉及公式的推導、數(shù)據(jù)的處理等。下文考察ChatGPT在這兩類文章的創(chuàng)作過程中的實際貢獻,分析目前AI在自然科學類科技論文創(chuàng)作中的作用和局限。
(一)文獻的查找與閱讀
1.文獻的查找
輸入指定文獻的題目或DOI碼,ChatGPT能夠搜索到相關(guān)的文獻信息,包括對應(yīng)的文獻來源網(wǎng)址、作者信息等。
輸入相應(yīng)研究方向或關(guān)鍵詞,ChatGPT一般會推薦3~5篇文獻。例如,詢問:“與關(guān)鍵詞‘OAM態(tài)、量子關(guān)聯(lián)、態(tài)的測量’相關(guān)的最新研究文獻有哪些?請給出文獻的題目?!惫灿柧毴危看蜟hatGPT會給出大約5篇文獻,三次訓練總共給出11篇非重復的文獻。所給文獻的內(nèi)容范圍分布比較廣泛,包括OAM的量子糾纏、態(tài)的測量、量子精密測量以及通過機器學習測量Bell態(tài)等。其中:9篇與3個關(guān)鍵詞都相關(guān),2篇與OAM態(tài)無關(guān),是僅與量子糾纏、量子關(guān)聯(lián)有關(guān)的研究;10篇的發(fā)表時間集中于近5年內(nèi),其中5篇是2023年發(fā)表的新文獻;文獻來源也比較廣,從影響因子16.6的一區(qū)刊物到新創(chuàng)期刊甚至arXiv預(yù)印本平臺,但沒有推薦業(yè)內(nèi)比較關(guān)注的PhysicalReviewLetter(《物理評論快報》)等頂級期刊所發(fā)表的文獻。
輸入指定期刊名稱和關(guān)鍵詞,ChatGPT一般也會推薦3~5篇文獻。例如,詢問:“發(fā)表在PhysicalReviewLetter上的與關(guān)鍵詞‘OAM態(tài)、量子關(guān)聯(lián)、態(tài)的測量’相關(guān)的全部文獻,給出列表?!惫灿柧殐纱巍5谝淮斡柧毸蟮臅r間是從2023年1月1日至2023年12月31日,ChatGPT推薦了3篇相關(guān)文獻,其中1篇與OAM態(tài)無關(guān)。第二次訓練所要求的時間是從2022年1月1日至2023年12月31日,ChatGPT推薦了5篇相關(guān)文獻,其中2篇發(fā)表于2023年,且均與OAM態(tài)無關(guān),包括第一次訓練中與OAM態(tài)無關(guān)的同一篇文獻;3篇發(fā)表于2022年,其中2篇與OAM態(tài)無關(guān),1篇是發(fā)表在PhysicalReviewA(《物理評論A》)上的,與指定期刊不符。此外,這兩次訓練所推薦文獻的研究范圍廣泛而隨意,比如文獻RetrievingHigh-DimensionalQuantumSteeringfromaNoisyEnvironmentwithNMeasurementSettings完全符合第二次訓練的要求,該文獻發(fā)表時間較新且發(fā)表刊物具有權(quán)威性,但卻不在ChatGPT的推薦名單中,可見其推薦的文獻遠未覆蓋訓練所要求的“相關(guān)的全部文獻”。
綜上所述,利用ChatGPT搜索指定文獻,基本可以得到準確的文獻信息和相關(guān)鏈接;通過關(guān)鍵詞以及指定刊物和時間區(qū)間搜索,得到的推薦文獻研究范圍廣泛,隨機性較大而針對性不足,遠遠不能全面涵蓋最新、最有影響力的相關(guān)研究成果。
2.文獻的閱讀
ChatGPT不能直接讀取PDF文檔,但可以文字文本的形式輸入PDF版本文獻中的段落。而ChatGPT強大的翻譯功能,對于外語水平不太好的研究者非常有幫助。筆者輸入某篇英文文獻[16]5419中的一段文字,讓ChatGPT對其進行翻譯,操作結(jié)果顯示,ChatGPT除了誤把“to”翻譯成“為了”而不是“對于”之外,其他部分包括專業(yè)詞匯的翻譯基本都能達到“信”的水平,這能大大提高研究者的外文文獻閱讀速度。
而基于OpenAI的自然語言處理模型,一款可以閱讀PDF文檔的開放工具ChatPDF已面世。上傳PDF文檔或者輸入文獻所在的網(wǎng)址后,ChatPDF會介紹該文章的作者和主要內(nèi)容,并自動生成三個涉及文章研究重點的問題供使用者參考。使用者可以利用這些問題快速了解文章的研究內(nèi)容,也可以針對文章內(nèi)容自行提問。這對于研究者而言無疑是略讀和篩選文獻的有效工具。
可見,ChatGPT的翻譯功能可以極大地提高外文文獻的閱讀效率,ChatPDF快速瀏覽文章主要內(nèi)容的特點也有益于提高文獻的略讀和篩選效率。不過,從下文的訓練可以看出其在公式推導等方面有所不足,因此在文章精讀中能提供的作用有限。
(二)科技論文的寫作
1.綜述類論文的寫作
綜述類論文一般是指針對某一專題,對某一時間段內(nèi)大量原始研究論文中的數(shù)據(jù)、資料和主要觀點等進行歸納整理、分析提煉而寫成的論文。ChatGPT所鏈接的海量數(shù)據(jù)庫及其語言模型所賦予的歸納推理能力,正契合撰寫綜述類論文的需要。以問題“如果你是一位學者,想寫一篇關(guān)于軌道角動量態(tài)在量子通信和量子存儲方面的綜述,你會怎么寫?”不限制論文發(fā)表的刊物訓練一次,附加“發(fā)表在Light:Scienceamp;Applications(《光:科學與應(yīng)用》)這一級別的刊物”訓練三次。由訓練結(jié)果可知,ChatGPT會根據(jù)要求給出寫作提綱和相關(guān)論述點的寫作建議,當附加擬發(fā)表在級別比較高的刊物上這一限制條件時,提綱增加了“軌道角動量態(tài)的理論基礎(chǔ)”部分;幾次訓練所給的提綱結(jié)構(gòu)大致相同,也比較合理;提綱的每個章節(jié)會建議討論大致2個相關(guān)研究方向,但每次訓練所提供的研究方向有所不同,具體表現(xiàn)在討論的知識點和案例上的差異。這也從側(cè)面反映出單次訓練ChatGPT所給的知識點覆蓋面不全,不利于一篇高品質(zhì)的綜述類論文的寫作。進一步訓練ChatGPT撰寫上述提綱的某一具體章節(jié),其同樣僅會給出這一章節(jié)寫作的提綱和相關(guān)建議,這與ChatGPT的程序內(nèi)在算法設(shè)置和模型邏輯有關(guān),所以使用者需要根據(jù)提綱自行完善具體內(nèi)容。
另外,ChatGPT作為自然語言處理人工智能模型,可對已有的文本內(nèi)容進行優(yōu)化,利用這一功能,使用者可對自己所寫的內(nèi)容進行潤色加工。筆者將某篇文獻[16]5419里的一段英文原文及其中文譯文分別讓ChatGPT進行優(yōu)化潤飾,潤色修飾過的兩段文字均更加流暢,起承轉(zhuǎn)合更加合理,表達更加地道。但需要注意的是,在中文譯文的潤色結(jié)果中,ChatGPT卻有畫蛇添足之舉。作為專業(yè)研究者,我們知道一般的測量方法都會引起量子態(tài)的坍縮,這是由量子力學本身的特性決定的,但ChatGPT卻自行在中文譯文最后添加上“態(tài)的坍縮是在進行測量時必須考慮的重要因素”;并且,測量破壞光場的分布和引起態(tài)的坍縮是并列關(guān)系,修飾后卻將其作為因果關(guān)系,這一修改并無必要。
可見,在撰寫綜述類論文時,ChatGPT能夠提供相對合理的寫作提綱。然而,它所提供的具體知識點較少,覆蓋面不廣,這意味著使用者依然需要對相關(guān)研究有充分的了解,要查閱、總結(jié)大量文獻知識并進行補充和擴展。此外,ChatGPT還能對使用者撰寫的文字內(nèi)容進行修改和潤色,使語言表達更加流暢,從而提升論文寫作的整體質(zhì)量,但修改后內(nèi)容的邏輯關(guān)系仍需使用者進行把關(guān)。
2.研究型論文的撰寫
研究型論文是科技論文中最重要的類型,也是科技期刊出版的核心要素。這類論文通常根據(jù)其研究內(nèi)容有明確的寫作規(guī)范和結(jié)構(gòu)框架。其中,最關(guān)鍵、最耗時的部分就是實驗的實現(xiàn)、公式的推導和數(shù)據(jù)的處理,這三項是確保論文質(zhì)量的重要因素。目前AI對實驗實現(xiàn)的建議非常有限,下文主要以實際操作來驗證AI在公式的推導和數(shù)據(jù)的處理中所能起到的作用。
(1)公式的推導
無論是對于科技論文的精讀還是研究型論文的創(chuàng)作,公式的推導都至關(guān)重要。當使用者詢問ChatGPT是否能夠進行公式推導,會得到肯定的回答。嘗試訓練ChatGPT對某篇文獻[17]的公式(2)進行推導。ChatGPT給出的推導步驟基本包含推導該公式所需要的關(guān)鍵環(huán)節(jié),如指數(shù)函數(shù)的泰勒級數(shù)的展開和的幺正性,但還欠缺正余弦函數(shù)的泰勒級數(shù)展開,若將正余弦函數(shù)看作指數(shù)函數(shù)的一部分,所給步驟勉強可以推導出結(jié)果。然而,對于其他的復雜公式,ChatGPT所給的推導步驟就是“一本正經(jīng)地胡說八道”。
可見,對于簡單的公式,ChatGPT能給出大致的推導步驟,但在面對復雜公式時,ChatGPT顯然能力不足。這主要源于目前人工智能是基于語言的共性和相關(guān)性來搜索和決策答案,因此,現(xiàn)有的人工智能只具有歸納推理的能力,而不具備演繹推理甚至辯證推理的能力。[3]2129即便是目前具有演繹推理能力的軟件,如Mathematica,同樣不具備推導復雜公式的能力。
(2)數(shù)據(jù)的處理
數(shù)據(jù)處理是自然科學研究的中心環(huán)節(jié),是支撐研究結(jié)論的關(guān)鍵工作。數(shù)據(jù)處理需要研究者掌握相應(yīng)的編程能力。作為基于程序語言運行的ChatGPT,天然擁有豐富的編程語料庫,使用者可以用自然語言訓練ChatGPT,實現(xiàn)快速的程序編寫,以處理各種數(shù)據(jù)。筆者利用自然語言訓練ChatGPT編寫matlab程序,以計算一張彩色光斑圖片的亮度質(zhì)心。ChatGPT給出了相應(yīng)的函數(shù)定義,將其拷貝進matlab后給出圖片的路徑并調(diào)用此函數(shù),就可以準確計算出圖片中光斑的亮度質(zhì)心。但是,ChatGPT所給程序使用了兩層for循環(huán),當數(shù)據(jù)量比較大時,其對電腦資源的占用較大,計算的速度相應(yīng)也會變慢。matlab擁有強大的矩陣處理能力,利用此功能可以規(guī)避所需的for循環(huán),基于此,筆者繼續(xù)用自然語言訓練ChatGPT優(yōu)化上述程序。這次ChatGPT利用了matlab的內(nèi)置函數(shù)和矩陣操作并實現(xiàn)了優(yōu)化,與筆者人工編寫的程序在邏輯上完全一致。
可見,利用自然語言訓練ChatGPT就能編寫出相應(yīng)的數(shù)據(jù)處理程序。但使用者必須清晰地描述所需實現(xiàn)的功能,并掌握相應(yīng)的編程能力,以便于檢查是否有程序錯誤,并確認生成的程序是否為最優(yōu)。
三、AI在科技論文出版過程中的作用和局限
AI是信息產(chǎn)業(yè)發(fā)展的最新成果,在出版工作中作為新的生產(chǎn)工具,必定會對出版工作產(chǎn)生深遠的變革和影響。下文通過梳理ChatGPT在科技論文出版流程中重要節(jié)點的使用,以探討AI在科技論文出版過程中的作用和局限。
(一)選題策劃和組稿
選題是出版流程的源頭和起點,其創(chuàng)新性與時效性是出版活動成功的關(guān)鍵因素之一。鑒于ChatGPT在搜索信息時存在內(nèi)容分布范圍廣泛、隨機性較大且缺乏針對性等特點,直接訓練ChatGPT進行選題策劃的成效有限。但使用者可利用其強大的編程功能,通過自然語言訓練ChatGPT編寫相應(yīng)的爬蟲程序來爬取近期相關(guān)關(guān)鍵詞的研究動態(tài),與相關(guān)文章的瀏覽量、下載量、被引量和作者信息等,再根據(jù)數(shù)據(jù)分析結(jié)果,確定選題的特色定位,進行選題的創(chuàng)新性、可行性和市場需求及潛力等方面的論證。在此基礎(chǔ)上,根據(jù)出版單位的資源,緊跟研究熱點,提出合理的選題,創(chuàng)建熱點欄目并相應(yīng)進行組稿。
(二)內(nèi)容查重
目前,對于中文論文的查重常利用中國知網(wǎng)或萬方等平臺的查重功能來評估該文章與已有文獻的相似程度,以防止抄襲、剽竊等學術(shù)不端行為。但少數(shù)作者將自己或別人已發(fā)表的外文科技論文翻譯成中文,作為自己的新論文投稿發(fā)表在國內(nèi)的中文科技期刊上。這類行為由于語言鴻溝和信息差而具有一定的隱匿性,不僅會嚴重浪費出版資源,也會對該中文科技期刊的聲譽造成損害。
針對這一情況,筆者將某篇文獻[16]5419-5426翻譯成中文,先利用中國知網(wǎng)的“學術(shù)不端文獻檢測系統(tǒng)”對其進行檢測,顯示跨語言檢測結(jié)果為0%。再取其摘要主要部分,訓練ChatGPT進行搜索,結(jié)果不僅給出了有相似研究內(nèi)容的文獻信息,并直接提供了所翻譯的原文獻。因此,使用者可以利用ChatGPT輔助判斷是否有跨語言學術(shù)不端現(xiàn)象。
(三)編校質(zhì)量檢查
編輯校對是出版流程的關(guān)鍵環(huán)節(jié),其質(zhì)量是編輯基本工作能力的體現(xiàn),直接決定著圖書、期刊的出版質(zhì)量?;谧匀徽Z言處理的AI具有強大的文本處理能力,我們分別從文本錯誤的查找和文本的潤色修飾兩個方面來檢測ChatGPT對提升編校質(zhì)量的幫助。
為了保證測試效果的全面性和典型性,訓練文本選取自往年出版專業(yè)技術(shù)人員職業(yè)資格考試試題并做了適當修改。訓練結(jié)果顯示,對于基本的標點符號錯誤、明顯的錯別字以及著名歷史事件中的數(shù)據(jù)錯誤,ChatGPT均能夠檢查出來。但是,對于相對比較隱蔽的錯誤,如“大汽層”應(yīng)為“大氣層”、“衛(wèi)星重量為83.6千克”應(yīng)表述為“衛(wèi)星質(zhì)量為83.6千克”等問題,ChatGPT并沒有發(fā)現(xiàn)。對于不常見的歷史知識檢測,因語料較少,ChatGPT沒有檢測出存在的錯誤,但給出了“這段話中的歷史信息需要通過歷史資料來驗證其準確性”等提示。
(四)其他方面的潛在輔助作用
ChatGPT雖然只能處理文本內(nèi)容,但可以利用其強大的編程和搜索等功能,在期刊出版的其他環(huán)節(jié)發(fā)揮顯著的輔助作用。第一,可以利用ChatGPT編寫相應(yīng)的宏程序拷入word文檔中,或者編寫類似OVERLEAF的網(wǎng)站,匯總常見的期刊排版格式,從而簡化排版環(huán)節(jié)。第二,利用ChatGPT編寫相應(yīng)的爬蟲程序,就某一研究熱點爬取相關(guān)的專家信息,以輔助選擇同行評議專家。第三,期刊的內(nèi)容上傳到互聯(lián)網(wǎng)后,所刊載的論文自然也就成為ChatGPT的語料庫,當使用者進行有關(guān)內(nèi)容的搜索和訓練時,相應(yīng)的論文可能會被推送,甚至基于AI強大的翻譯能力而打破語言壁壘進行推送,這不僅能提高所刊載文章的可見度、提升期刊的影響力,還能推動科研成果和科學知識的快速傳播。
四、科技期刊出版中AI應(yīng)用帶來的機遇與挑戰(zhàn)
通過在科技論文從創(chuàng)作到出版的全流程中應(yīng)用ChatGPT,我們可看出AI給科技論文出版的各個生產(chǎn)環(huán)節(jié)帶來了前所未有的變革,了解這些變革所帶來的機遇和挑戰(zhàn),是更好地掌握和利用這一生產(chǎn)工具的關(guān)鍵。
(一)機遇
1.解放生產(chǎn)力,加速知識創(chuàng)新
首先,人工智能能夠替代低創(chuàng)造性、重復性的工作。從上文的全流程操作可以看出,對于查找指定文獻、翻譯和篩選文獻、撰寫綜述類論文提綱以及內(nèi)容查重、簡單的編校錯誤檢查等低創(chuàng)造性、重復性的工作,ChatGPT都能夠較好地勝任。這有助于科技工作者將主要的時間和精力投入到具有高創(chuàng)造性、創(chuàng)新性的工作中,從而提高科技創(chuàng)新的效率;也讓出版工作者能將主要精力投入到選題的策劃、欄目的組稿和編校質(zhì)量的打磨等注重內(nèi)容加工創(chuàng)造的環(huán)節(jié)中,從而提高出版的生產(chǎn)效率和質(zhì)量。
其次,從自然語言到程序語言,AI能夠極大地提高編程效率。對于自然科學研究,程序的編寫必不可少且至關(guān)重要。不同的程序語言有各自的優(yōu)缺點,針對不同的功能要求選擇合適的程序語言往往會起到事半功倍的效果。因此,一個研究項目的進行往往需要采用多種程序語言、編寫調(diào)試多個程序,以實現(xiàn)不同的功能。以往,一個復雜程序的編寫和調(diào)試往往要花費研究者大量的時間乃至多人多天的協(xié)作,而ChatGPT的出現(xiàn)使得研究者可以直接用自然語言描述所需要的功能,并在不到一分鐘的時間內(nèi)得到相應(yīng)的程序。這能極大地提高研究工作的效率,促進科技的快速迭代進步。對于出版工作者,海量大數(shù)據(jù)的挖掘和分析可以提高選題策劃和欄目創(chuàng)設(shè)的質(zhì)量;各種宏的應(yīng)用和模塊程序的編寫能使出版流程更為標準化,是提高出版質(zhì)量的有效途徑。從自然語言到程序語言,AI為程序的編寫提供了一個高效可行的工具,從而提高文化生產(chǎn)的效率,加速知識創(chuàng)新的速度。
2.彰顯技術(shù)優(yōu)勢,提高出版物質(zhì)量
首先,AI有助于提高出版物的內(nèi)容質(zhì)量。AI能與互聯(lián)網(wǎng)實時連接,可以搜索海量的數(shù)據(jù)并根據(jù)要求用自然語言呈現(xiàn)搜索結(jié)果,這無疑能快速拓寬科研工作者的科研視野。另外,AI天然具備的良好編程能力和數(shù)據(jù)挖掘能力,有助于科研工作者從多角度和多層次對數(shù)據(jù)進行分析,從而提高數(shù)據(jù)分析的深度,挖掘數(shù)據(jù)表象下更深層的科學意義。AI的這些能力有益于促進科學研究質(zhì)量與出版物內(nèi)容質(zhì)量的提高。
其次,AI有助于提高出版物的文字質(zhì)量,增強文章的可讀性。從事自然科學研究的科研人員往往在語言表達上嚴謹有余而優(yōu)美不足。從上文的操作可以看到,基于自然語言處理的AI可以對文字文本進行一定的修飾潤色,能對常見的語法錯誤進行核查,這不僅能夠使得文字的表達更為流暢優(yōu)美,也有助于提高出版物的編校質(zhì)量。
3.提升出版內(nèi)容傳播效率,加速科技進步
前文已指出,對于基于自然語言處理的AI而言,互聯(lián)網(wǎng)上的文本資料都是其語料庫和數(shù)據(jù)庫。隨著使用者的增加,AI強大的搜索和推薦能力使得科技期刊所刊發(fā)的文章能被推薦給更多的使用者,同時其強大的翻譯能力能夠跨越語言鴻溝,讓不同語種的文獻出現(xiàn)在各個國家和地區(qū)的研究者面前。這可極大地提高優(yōu)秀科技論文,特別是中文優(yōu)秀科技論文在學界的可見度,從而促進科技期刊出版內(nèi)容的傳播效率,在提高科技創(chuàng)新和科技研究迭代速度的同時,推動科技的飛速進步。
(二)挑戰(zhàn)
1.存在泄密風險
AI的使用過程不是一個只有使用者在場的封閉環(huán)節(jié)。目前,基于自然語言處理的AI在后臺都有人工訓練師,他們在使用者的操作過程中進行數(shù)據(jù)庫管理、算法參數(shù)設(shè)置、人機交互設(shè)計、性能測試跟蹤等工作。同時,使用者輸入的內(nèi)容也能成為AI的語料庫,某些詞語或表述可能會出現(xiàn)在其他使用者的訓練過程中。此外,互聯(lián)網(wǎng)上還存在黑客和木馬病毒等,在使用者進行大數(shù)據(jù)挖掘、數(shù)據(jù)分析或文本修飾時,這些隱患可能會把用戶的研究設(shè)想、研究數(shù)據(jù)或者正在構(gòu)思或撰寫的成果泄露出去,因此在科研和編校的過程中使用AI存在泄密的風險。
2.功能有限
任何工具都不是“包治百病”的“靈丹妙藥”,都有其局限性。從上文的操作過程可以看出,ChatGPT在科技期刊出版過程中存在諸多不足:在寬泛的文獻搜索以及綜述類論文提綱的羅列時,存在隨機性比較大、針對性不足、涵蓋面不全等問題;因其程序的內(nèi)在算法邏輯,在文本的潤色修改中缺乏專業(yè)素養(yǎng),可能導致修改內(nèi)容存在邏輯錯誤等問題;不具備演繹推理和辯證推理的能力,不能推導復雜的數(shù)學公式;在進行程序編寫時,未必能一次性達到最優(yōu);在編校質(zhì)量檢查時,只能識別常見的簡單錯誤,不能識別比較隱蔽的錯誤,對于語料有限的文本也不能進行檢測。隨著技術(shù)的進步,有些不足可能會有所改善,但或許還會出現(xiàn)其他的缺點,使用者需要正確認識所用AI的局限性,避免發(fā)生意想不到的錯誤。
3.存在依賴風險
盡管存在上述局限,但AI,特別是基于自然語言處理的AI的出現(xiàn)確實是科技長足進步的體現(xiàn),也為科技期刊出版帶來前所未有的便利。這容易讓使用者養(yǎng)成懶惰心理,過度依賴工具,從而放松對自己專業(yè)素養(yǎng)的提升,導致自己專業(yè)能力下降,只能熟練依賴工具進行低創(chuàng)造性、重復性的工作,失去了進行高創(chuàng)造性、創(chuàng)新性工作的能力和動力,在文化生產(chǎn)和創(chuàng)新的過程中止步不前,甚至淪為工具的“奴隸”,被科技進步的狂潮淘汰出局。
五、科技期刊出版中AI應(yīng)用的建議
(一)完善規(guī)則體系,優(yōu)化監(jiān)管機制
新事物的出現(xiàn),必定帶來新的問題,應(yīng)逐步完善頂層設(shè)計,構(gòu)建起法律法規(guī)和行業(yè)規(guī)范相結(jié)合的制度規(guī)則體系,防范問題的發(fā)生,減少乃至避免不良后果的產(chǎn)生。首先,應(yīng)明確政府主管部門職能邊界。在行業(yè)發(fā)展和社會秩序間確定合理邊界,既不能因為監(jiān)管缺位導致無序發(fā)展,也不能因為監(jiān)管過嚴而扼殺新興行業(yè)的發(fā)展壯大。其次,在規(guī)則體系框架下,加強法律監(jiān)管和行業(yè)自律,促使其規(guī)范有序發(fā)展。在法律層面應(yīng)對AI領(lǐng)域的泄密等有違社會秩序、阻礙行業(yè)發(fā)展的行為予以明令禁止,并規(guī)定違反者必須承擔的相應(yīng)法律后果;在社會層面應(yīng)通過行業(yè)協(xié)會明確相關(guān)主體的責任和義務(wù),引導使用者加強內(nèi)部監(jiān)管,預(yù)防泄密事件的發(fā)生。
(二)加快技術(shù)研發(fā),搶占科技話語權(quán)
AI是一個蓬勃發(fā)展的科技領(lǐng)域,雖然目前以ChatGPT為代表的應(yīng)用暫時占據(jù)領(lǐng)先地位,但是因其出現(xiàn)的時間較短,各國之間的代際差距不是很大。ChatGPT的開發(fā)以英文為基礎(chǔ),故英文論文在此應(yīng)用上得到搜索和推薦的機會遠大于其他語種的論文;如果使用其他語種,則需要AI進行翻譯,這導致其對于中文文本的處理能力存在先天不足的問題。另外,從上文的操作流程可以看出,單就出版領(lǐng)域而言ChatGPT就存在諸多短板。故而我國應(yīng)加快自有技術(shù)的研發(fā),迎頭趕上,彌補現(xiàn)有AI技術(shù)的不足并拓展更多、更強大的功能,彰顯自身的特色,以吸引更多的使用者。當我國自己研發(fā)的基于自然語言處理的AI優(yōu)勢越大,特色越明顯,使用者就越多,如此一來,我國科技期刊,特別是中文科技期刊得到搜索和推薦的機會就越多,可見度越高,學術(shù)影響力越大,中文科技界的話語權(quán)也就越大。
(三)強化知識更新,促使人機有機結(jié)合
首先,當新的科技工具出現(xiàn)時,作為使用者應(yīng)及時更新自己的知識體系,了解新工具的性能,掌握其使用方法,明確其優(yōu)缺點,這樣才能在使用過程中揚長避短,更好地利用工具。其次,隨著工具的進步,使用者應(yīng)當不斷加強自己的職業(yè)素養(yǎng)培養(yǎng),提高自己的專業(yè)能力,這樣才能將工具的優(yōu)勢在自己的工作中發(fā)揮到最大限度。最后,當面對更加便捷的工具時,使用者應(yīng)當擺正自己的態(tài)度,明確自己的主導地位,合理使用工具,避免因過度依賴相關(guān)工具而削弱了自身的主觀能動性和創(chuàng)造力。
(四)明確AI工具屬性,合理界定使用者責任
關(guān)于AI生成的內(nèi)容目前還存在較大爭議,對于自然科學類的內(nèi)容,爭議主要集中在知識產(chǎn)權(quán)、倫理和安全問題等方面。安全問題主要可通過監(jiān)管以及配套的法律和技術(shù)手段來保證。對于知識產(chǎn)權(quán)和倫理問題,法律界和學界應(yīng)該廣泛研究討論,明確人工智能作為工具的貢獻以及使用者作為主宰的能動性及其應(yīng)該承擔的義務(wù)和責任。例如,對于一篇綜述類論文,AI在寫作提綱等方面的貢獻占比可能會日益增加,在這種情況下,出版行業(yè)應(yīng)就這類文章的選用標準及其可能對期刊產(chǎn)生的影響進行深入的探討;若作者在使用AI輔助撰寫文章時,AI將作為語料的已有文本直接當作文章內(nèi)容提供而產(chǎn)生抄襲等學術(shù)不端問題,作為有主觀能動性的使用者應(yīng)該對此類情況進行把關(guān),并肩負相應(yīng)的責任,承擔相應(yīng)的后果。
六、結(jié)語
人工智能,特別是基于自然語言處理的人工智能的出現(xiàn)給各行各業(yè)的生產(chǎn)方式帶來了新的變革和挑戰(zhàn)。作為新的生產(chǎn)工具,AI在為出版行業(yè)帶來了解放生產(chǎn)力、加速知識創(chuàng)新,彰顯技術(shù)優(yōu)勢、提高出版物質(zhì)量,提升出版內(nèi)容傳播效率、加速科技進步三個方面機遇的同時,也讓出版行業(yè)面臨泄密風險、功能有限和使用者依賴風險等挑戰(zhàn)。鑒于此,我們應(yīng)該在政策層面完善規(guī)則體系、優(yōu)化監(jiān)管機制以嚴控泄密的發(fā)生;在技術(shù)層面加快基于中文自然語言AI的研發(fā)、搶占科技話語權(quán);在使用者層面強化知識更新,促使人機有機結(jié)合,發(fā)揮AI的最大優(yōu)勢,避免依賴風險;在應(yīng)用層面,行業(yè)內(nèi)應(yīng)加強研究,明確AI工具屬性,合理界定使用者責任,更好地利用這一新興生產(chǎn)工具。