張濟明 吳領葉 丁譯
[摘要]ChatGPT的一項重要功能是可以生成自然流暢的文本,對期刊出版的影響備受出版業(yè)關注。文章通過探討ChatGPT能否成為署名作者的爭議,對ChatGPT生成文本的版權歸屬問題進行了分析;通過探討ChatGPT出現(xiàn)后引發(fā)的科研誠信問題,對期刊編輯如何識別ChatGPT生成文本提出了具體建議;通過討論ChatGPT為期刊出版帶來的機遇,提出ChatGPT具有提高編輯工作效率、多語種出版等作用,在期刊出版領域具有廣闊的應用前景。
[關鍵詞]ChatGPT;期刊出版;機遇;挑戰(zhàn);學術不端
ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI公司研發(fā)的基于自然語言模型的聊天軟件,一經問世就在社交網絡迅速走紅。推出后僅短短5天,其注冊用戶數(shù)就突破100萬人[1],引發(fā)了各行各業(yè)的熱議。駱飛等認為以ChatGPT為代表的人工智能生成內容可以在知識生產、科學評價、快速傳播等方面發(fā)揮作用,但也可能造成責任分散、潛在歧視與信任危機[2]。鄭燕林等支持教育工作者以開放的心態(tài)、前瞻的視角理性分析人工智能在教育應用層面的價值以及可能帶來的風險與挑戰(zhàn)[3]。周智博認為ChatGPT能夠推動數(shù)字政府的親民化、高效化和智能化發(fā)展,但同時可能引發(fā)國家層面的數(shù)據(jù)主權安全風險、政府層面的行政公共性結構風險以及個人層面的數(shù)據(jù)權利侵犯風險[4]。陳楊園認為跨境電商行業(yè)在ChatGPT的幫助下可以“用三秒干一天的活”[5]。楊玲認為ChatGPT可以成為開展優(yōu)生工作的好幫手[6]。
ChatGPT的一項重要功能是可以生成自然流暢的文本,這將會給出版業(yè)帶來哪些影響?為了更好地理解ChatGPT,文章有必要回顧ChatGPT的發(fā)展歷史。
ChatGPT的發(fā)展歷程可以追溯到2018年,OpenAI在該年推出了第一個GPT模型。該公司在2019至2023年分別發(fā)布了GPT-2.0、GPT-3.0、GPT-3.5和GPT-4.0等版本。ChatGPT在GPT-3.5架構模型的基礎上,經過改進和優(yōu)化后最終形成,可以生成更加自然、流暢的文本,被用于解決更加復雜的自然語言處理任務。ChatGPT生成的文本具有哪些特性?與人類寫作的論文有何區(qū)別?ChatGPT是否可以真正寫作論文?ChatGPT的出現(xiàn)又將會給期刊出版帶來哪些影響?文章將對上述問題進行分析。
一、出版?zhèn)惱砗桶鏅鄦栴}
在科學研究領域,論文署名是一種非常重要的認可和評價方式,應遵循實際貢獻、順序、透明、責任和知識產權等原則,確保署名的公正、客觀和誠信,維護學術研究的科學性和可信度。值得一提的是,Nurse Education in Practice曾發(fā)表Open Artificial Intel-ligence Platforms in Nursing Education:Tools for Academic Progress or Abuse一文,將ChatGPT列為第二作者[7];
Oncoscience期刊發(fā)表的Rapamycin in the context of Pa-scal's Wager:generative pre-trained transformer perspective一文將ChatGPT列為第一作者[8],這些將ChatGPT列為作者的文章迅速引發(fā)出版業(yè)關于出版?zhèn)惱砗桶鏅嗟臒崃矣懻摚?-10]。
我國著作權法第二章第二節(jié)第十一條對作者的概念進行定義,創(chuàng)作作品的自然人是作者。由法人或者非法人組織主持,代表法人或者非法人組織意志創(chuàng)作,并由法人或者非法人組織承擔責任的作品,法人或者非法人組織視為作者。按照這一規(guī)定,署名作者包括兩類對象,一類是自然人,一類是法人或非法人組織,即作者應是具有獨立主體的自然人或者組織機構。作為機器學習模型,ChatGPT并非真正具有自我意識,它既非自然人,也非組織機構,因此,從我國著作權法的角度來說,將其列為作者并不合適。作品的署名應基于實際的貢獻,即只有對研究做出實際貢獻的人才能被列為作者。例如,設計研究方案、進行實驗、分析數(shù)據(jù)、提供重要的研究材料或設備等工作,都可以被視為實際貢獻。ChatGPT并沒有參與實際的研究工作或做出獨特的貢獻,其只作為一種技術工具和資源,用于協(xié)助人類完成相關工作。例如,大多數(shù)學工作者在撰寫論文時會使用許多軟件進行輔助,如數(shù)學軟件MATLAB可以用于數(shù)據(jù)分析、無線通信、深度學習、圖像處理與計算機視覺、信號處理等領域,那么是否可以把MATLAB也列為作者?從本質上講,ChatGPT與MATLAB一樣,都是輔助人類的應用軟件,因此將其作為共同作者署名并不合適。
ChatGPT生成文本的版權究竟應歸誰?答案基本有三種:研發(fā)ChatGPT的OpenAI公司;使用ChatGPT生成文本的自然人;ChatGPT本身。數(shù)學工作者通常會在論文中注明計算結果是應用MATLAB的某個版本在什么樣的硬件上得到的結果并進行相應的分析。而科研工作者通過提問或輸入相應命令生成的ChatGPT內容,與MATLAB軟件計算得到的結果類似,均為機器學習模型軟件生成的語言內容,因此這些內容在正文中應被加以標注或者說明。由于ChatGPT本身并不具有思想,也不具備寫作論文的動機,本質上的操作者還是自然人,因此應說操作ChatGPT或是提出論文思想的自然人才是真正的作者。
隨著ChatGPT在國內外被廣泛應用,未來人機協(xié)同進行科研創(chuàng)作或將成為一種普遍的狀態(tài)。因此,在使用ChatGPT等人工智能生成文章時,科研工作者需要充分考慮到其本質上只是一種技術工具和資源,對論文中ChatGPT等人工智能生成的內容必須進行相應的標注,說明使用了人工智能。
二、學術不端與科研誠信問題
學術出版是科研成果傳播的重要途徑,而科研誠信則是保障學術出版品質和權威性的重要基礎。隨著諸如ChatGPT等人工智能對中國用戶開放以及國內類似產品的開發(fā),未來我國學術期刊將面臨越來越普遍的人機協(xié)同和更復雜多元的寫作倫理、科研倫理以及其他不確定性和未知性課題[11]。如何應對以ChatGPT為代表的人工智能生成文本給學術出版帶來的巨大挑戰(zhàn),是出版業(yè)亟待思考的問題。目前,學術界使用的查重軟件有很多,但主要原理基本相同:當用戶將文章上傳至查重軟件后,軟件按照連續(xù)出現(xiàn)13個相同字符判為重復的標準來計算論文重復率,同時將論文分段處理,利用算法對每一個段落計算重復率,待全部查重完畢后,軟件會將論文的重復率、引用率、重復內容等自動記錄并生成查重報告。當前,國際上使用比較廣泛的英文學術論文查重軟件是CrossCheck,當論文相似度超過50%時系統(tǒng)會自動顯示黃色提醒,其被Elsevier、Wily、Springer Nature、Taylor&Francis
等出版集團旗下的期刊廣泛使用[12]。國內中文期刊使用較多的學術不端檢測軟件是中國知網開發(fā)的AMLC軟件,該軟件不斷采用新技術提升檢測能力,對大面積改寫以降低文字重復比例的論文,采用神經網絡方法,對觀點類似內容進行“意思抄襲檢測”[13]。但由ChatGPT等人工智能生成的內容,包含大量預訓練模型生成的文本,相關數(shù)據(jù)庫或網絡中并不存在完全相同的內容,因此目前的反剽竊軟件很難準確檢測到ChatGPT等人工智能生成的內容。
ChatGPT具有很強的自然語言生成能力,使用大規(guī)模的語言模型來進行訓練,因此其生成的文本通常不會出現(xiàn)明顯的語法錯誤或拼寫錯誤,但與人類寫作的語言還是會存在一些差異。第一,文本流暢度和自然度。通常人類寫作文本的語言表達更加流暢,而ChatGPT生成的文本可能會存在一些非常規(guī)的表達方式,甚至在某些情況下會產生模糊的回答。第二,文本邏輯性和連貫性。人類寫作文本通常有更好的邏輯性和連貫性,句子之間的連接更加自然,而ChatGPT生成的文本可能會出現(xiàn)邏輯性不強、句子之間轉換不夠自然的情況。第三,文本主題和細節(jié)表述。人類寫作文本通常能夠深入主題細節(jié),表述更加具體,而ChatGPT生成的文本可能只是對主題的概括性描述,缺少細節(jié)和具體表述。第四,深度語義理解和用詞準確性。ChatGPT能夠理解和學習單詞和短語的含義,但在深度理解語言方面如隱喻、比喻等會有些欠缺。因此,期刊編輯在判斷作者是否使用ChatGPT生成文本時,可從以上幾個方面仔細審查和驗證。
ChatGPT預訓練模型的數(shù)據(jù)源于互聯(lián)網,主要使用互聯(lián)網已有的知識進行深度排列組合,它并不具有真正創(chuàng)新的能力。因此,是否具有創(chuàng)新性可以說是ChatGPT生成文本與人類寫作文本的根本區(qū)別。ChatGPT生成的內容往往邏輯性不是很強,常常會出現(xiàn)文不符題的現(xiàn)象。例如,當筆者向ChatGPT提問“如何識別ChatGPT生成文本”時,其回答只涉及了ChatGPT生成文本與機器翻譯或填充式文本的區(qū)別。因此,期刊編輯要對ChatGPT生成內容具有高度敏感性,可以從文本的流暢度、邏輯性、用詞準確性、文本細節(jié)、深層語義等方面加以辨識。值得一提的是,相關企業(yè)機構正在不斷開發(fā)能夠識別ChatGPT生成文本的相關檢測軟件。例如:OpenAI推出的GPT-2 Output Detector就可以比較準確地識別ChatGPT生成的文本;國外學術檢測服務機構Turnitin表示,今年將推出合成文本檢測器,據(jù)說可以檢測由ChatGPT生成的97%的文本,誤報率為1%;普林斯頓大學生Edward Tian表示,目前已經設計出相關工具GPTZero用于辨認ChatGPT生成文本,來自哈佛大學、耶魯大學、羅德島大學和其他大學的6000多名教師已經注冊使用GPTZero。相信隨著科技的發(fā)展,利用專業(yè)軟件檢測人工智能生成的文本有望被推廣應用。
三、期刊出版面臨的機遇
以ChatGPT為代表的人工智能軟件在知識生產和傳播方面給出版業(yè)帶來了機遇和挑戰(zhàn),如何在出版工作中學會利用其強大的功能是每個期刊編輯面臨的課題。筆者認為,ChatGPT可以幫助期刊編輯提高工作效率,撰寫公文和改善讀者體驗。
(一)初步校對稿件,提高編輯工作效率
ChatGPT可以作為期刊編輯的智能助手,幫助編輯初步校對稿件,優(yōu)化文本內容。ChatGPT可以檢測文章中的語法錯誤、錯別字和標點符號等問題,并提出改進建議,從而幫助期刊編輯更快速地完成文章的校對和優(yōu)化。當前,只要在ChatGPT對話框輸入“請校對以下段落:……”就可以實現(xiàn)自動校對,較為明顯的錯誤均可以得到糾正。盡管ChatGPT可以幫助期刊編輯檢查錯誤,但其仍不能完全替代人類進行編輯和校對,機器學習模型仍然存在誤判的可能,而且機器學習模型難以感知文章的上下文和背景信息。因此,期刊編輯在使用ChatGPT進行文章編輯和校對時,需要結合自身經驗綜合判斷,才能取得最佳效果。
(二)多語種出版成為可能,增強不同國家讀者的母語閱讀體驗
ChatGPT具有強大的翻譯功能,幾乎可以翻譯所有領域的文章,包括但不限于科技、商業(yè)、醫(yī)學、法律、社科、人文等。此外,ChatGPT可以自動識別輸入的語言,并將其翻譯成多種語言,如將英語翻譯成法語、西班牙語、中文、日語等。ChatGPT強大的翻譯功能和極低的使用成本,使得多語種出版和推送成為可能。為了擴大期刊的影響力,許多出版社和期刊編輯部會進行郵件推送。但由于語言限制,多數(shù)中文期刊只能將發(fā)表的文章在國內推送,英文期刊雖然可以將發(fā)表的文章推送到不同的國家,但是非英語國家的讀者還是缺乏母語閱讀體驗。期刊編輯可以利用ChatGPT提供的多語言翻譯功能,將需要推送的文章翻譯成相應的語言針對不同國家進行推送。期刊編輯在推送時可以注明這是機器翻譯結果,讀者可以參考英文與母語一起閱讀,獲得較滿意的體驗。這種既節(jié)約經費又節(jié)省人力的多語種推送工作,可以幫助期刊擴大讀者群,提高國際化程度,豐富不同國家的讀者的母語閱讀體驗。
(三)幫助期刊編輯撰寫各類信函和郵件
ChatGPT可以生成自然流暢文本的能力給期刊出版帶來隱性的學術不端問題,但其強大的文本生成能力也可以用來進行公文寫作。期刊編輯每天需要與眾多作者、讀者、審稿人、編委聯(lián)系,需要發(fā)出大量的郵件,耗費大量的時間和精力。而通過ChatGPT,這些郵件完全可以由其代為書寫,期刊編輯只要輸入收件對象和信函主要內容,ChatGPT就可以撰寫標準的收稿函、審稿邀請函、錄用函、約稿函等各種郵件。
四、結語
ChatGPT作為一種全新的工具,給人類的生活和工作帶來便利,同時帶來前所未有的挑戰(zhàn)。在這樣的背景下,期刊編輯不僅要被動應對隨之產生的諸如版權歸屬等問題,還要堅守期刊的科研誠信,積極利用各種辦法對ChatGPT帶來的更加隱蔽的學術不端問題進行檢測。此外,ChatGPT可以為期刊出版帶來許多機遇,幫助期刊編輯提高工作效率和豐富讀者的體驗,同時可以幫助期刊降低成本和提升競爭力。當下,以ChatGPT為代表的人工智能發(fā)展迅速,期刊編輯要不斷提高人工智能素養(yǎng),在工作中主動利用ChatGPT來提高工作效率,做一名人工智能新時代的高水平期刊編輯。
[參考文獻]
[1]5天注冊用戶超100萬,ChatGPT讓谷歌百度坐不住了[EB/OL].(2023-02-03)[2023-10-28].https://baijiahao.baidu.com/s?id=1757139070445438265&wfr=spider&for=pc.
[2]駱飛,馬雨璇.人工智能生成內容(AIGC)對學術生態(tài)的影響與應對:基于ChatGPT的討論與分析[J/OL].現(xiàn)代教育技術:1-12[2023-10-30].http://kns.cnki.net/kcms/detail/11.4525.n.20230322.1635.002.html.
[3]鄭燕林,任維武.實踐觀視域下ChatGPT教學應用的路徑選擇[J].現(xiàn)代遠距離教育,2023(02):3-10.
[4]周智博.ChatGPT模型引入我國數(shù)字政府建設:功能、風險及其規(guī)制[J/OL].山東大學學報(哲學社會科學版):1-11[2023-10-30].http://kns.cnki.net/kcms/detail/37.1100.c.20230315.1052.002.html.
[5]陳楊園.ChatGPT引爆跨境電商行業(yè)“用三秒干一天的活”[N].第一財經日報,2023-03-21.
[6]楊玲.ChatGPT能成為優(yōu)生工作的好幫手嗎?[J].中國優(yōu)生與遺傳雜志,2023(03):431-432.
[7]OConnor S.Open Artificial Intelligence Platforms in Nursing Education:Tools for Academic Progress or Abuse?[J].Nurse Education in Practice,2022.
[8]ChatGPT Generative Pre-trained Transformer, Alex Zhavoronkov.Rapamycin in the context of Pascal's Wager:generative pre-trained transformer perspective[J].Oncoscience,2022(09):82-84.
[9]羅東.ChatGPT可以是“作者”?《科學》等學術期刊發(fā)投稿禁令[N].新京報,2023-02-07.
[10]張月紅.ChatGPT的感悟:既生瑜,何生亮?[EB/OL].(2023-02-24)[2023-10-30].https://mp.weixin.qq.com/s?__biz=Mzg4OTY3Njg4Mg%3D%3D&mid=2247486965&idx=1&sn=5afe759e76499cf579e7eb5f9e3b70d1&scene=45#wechat_redirect.
[11]李二斌.ChatGPT對學術期刊影響如何[N].中國社會科學報,2023-02-28.
[12]李小燕,鄭軍衛(wèi),張蕾春,等.學術不端檢測系統(tǒng)應用現(xiàn)狀及對我國科技期刊的啟示[J].中國科技期刊研究,2022(09):1178-1185.
[13]孫雄勇,耿崇,申艷.學術不端檢測的難點及對策[J].中國科技期刊研究,2019(01):14-18.