摘 要:以ChatGPT為代表的聊天機器人再次引發(fā)了人們對AIGC(人工智能生成內(nèi)容)的關(guān)注?!俺霭嬖傧胂螅篈I與內(nèi)容生產(chǎn)變革”研討會回應熱點,邀請來自學界業(yè)界的5位專家,從不同角度探討AIGC背景下出版的未來。厘清ChatGPT的技術(shù)原理及其可供性,辨析AIGC模式中的人機互動關(guān)系,是理解這場內(nèi)容生產(chǎn)范式轉(zhuǎn)換的前提。當前,AIGC已經(jīng)有一定程度的實踐應用,在提升內(nèi)容生產(chǎn)力方面表現(xiàn)出優(yōu)勢。對出版業(yè)而言,AIGC給產(chǎn)業(yè)發(fā)展帶來更大的不確定性,既提供了機遇,也帶來了挑戰(zhàn),出版人必須做好應對準備。
關(guān)鍵詞:AIGC;ChatGPT;出版變革;數(shù)字出版;智能出版
DOl: 10.3969/j.issn.2097-1869.2023.02.003
2022年年底,OpenAI公司推出了一款名為ChatGPT的人工智能產(chǎn)品,它基于大規(guī)模語料庫和生成式模型,具有十分強大的通用性能力和邏輯推理能力?;谧陨砑夹g(shù)路線,ChatGPT更加適合解決復雜的AIGC問題,這使得AIGC再一次成為學術(shù)熱點,并且還走向了大眾領(lǐng)域,引發(fā)了全民關(guān)注。在幾年前的討論高潮中,人們關(guān)注AIGC的可版權(quán)性和版權(quán)歸屬問題,以及它對內(nèi)容產(chǎn)業(yè)的沖擊和產(chǎn)業(yè)內(nèi)部的自我調(diào)適。今天,在全民狂歡于探索ChatGPT的應用邊界時,以此為引子,《數(shù)字出版研究》編輯部的討論進一步將ChatGPT應用延伸到出版專業(yè)領(lǐng)域,冷靜思考AIGC時代出版的未來向何處去。
在此背景下,2023年3月2日,由北京印刷學院主辦,北京印刷學院出版學院、《數(shù)字出版研究》編輯部、“學術(shù)志”平臺承辦的“出版再想象:AI與內(nèi)容生產(chǎn)變革”研討會在云端舉行。本次研討會由北京印刷學院出版學院講師劉廣東主持,邀請到5位相關(guān)領(lǐng)域的專家:
北京斯麥爾數(shù)字出版技術(shù)有限公司董事長鄭鐵男;北京網(wǎng)梯科技發(fā)展有限公司董事長張震;北京頡騰文化傳媒有限公司副總經(jīng)理李杰臣;中華醫(yī)學會雜志社新媒體部主任沈錫賓;中國音像與數(shù)字出版協(xié)會副秘書長李弘。
《數(shù)字出版研究》編輯部對這次研討會中的一些共性議題做了梳理和整合,希望借此為思考內(nèi)容生產(chǎn)的未來帶來啟發(fā)。
1 奇點來臨?ChatGPT的原理與想象
技術(shù)奇點假說認為,技術(shù)發(fā)展會在很短的時間內(nèi)發(fā)生極大的接近于無限的進步,技術(shù)的增長將會變得不可控制和不可逆轉(zhuǎn)?;诖笠?guī)模預訓練自然語言處理模型的人工智能,正在不斷沖擊人類對技術(shù)的既有認知,近期,人形機器人Ameca接入ChatGPT后,甚至產(chǎn)生了有“情緒”的對話,引起科技界甚至社會大眾的廣泛關(guān)注。以ChatGPT為代表的AIGC會是奇點到來的標志或者即將到來的前奏嗎?拆解其技術(shù)原理,有助于我們在集體技術(shù)焦慮中冷靜審視這場變革。
鄭鐵男:ChatGPT是人工智能技術(shù)驅(qū)動的自然語言處理工具,其核心是自然語言處理(Natural Language Processing, NLP)。自然語言處理是計算機科學領(lǐng)域與人工智能領(lǐng)域中的一個重要方向,主要應用于機器翻譯、輿情監(jiān)測、自動摘要、觀點提取、文本分類、問題回答、文本語義對比、語音識別、中文OCR等方面。國內(nèi)外都有成形的自然語言處理技術(shù)。ChatGPT并非一個新技術(shù),它能夠通過理解和學習人類的語言進行對話,還能根據(jù)聊天的上下文進行互動,真正像人類一樣聊天交流,甚至能完成撰寫郵件、編寫視頻腳本、編寫文案、翻譯、編代碼、寫論文等任務。
張震:在ChatGPT引發(fā)的這輪AIGC浪潮之前,AI在自然理解領(lǐng)域顯著落后于人類?,F(xiàn)在,我們看到它超越了大部分普通人,但是依然落后于專業(yè)人士。普通人覺得它很專業(yè),但有時候它的答案是“一本正經(jīng)地胡說八道”。即便如此,用“涌現(xiàn)”這個詞來描繪ChatGPT給人們帶來的震撼并不為過。AI也在不斷學習,其內(nèi)容更新速度很快,人類在體力工具、運輸工具外,終于在腦力工具上出現(xiàn)了一次質(zhì)的飛躍。
自然語言的理解和生成的突破可能開啟人工智能的奇點:以前只是模仿普通生物,如模仿基本的兩棲類動物,進行一些視覺模仿和基本的符號識別。但是真正的基于符號的思考和理解是人類突飛猛進的一個關(guān)鍵點,這個點在互聯(lián)網(wǎng)領(lǐng)域就是奇點。
如果從入口把水灌入迷宮,水只要一直不斷,它必然找到出口。水能走通迷宮是不是智能?我以前認為水能走通迷宮只是自然界的一種規(guī)律,現(xiàn)在我認為這就是智能。很多圖像生成類人工智能軟件能夠幫助用戶消除照片中的背景干擾,效果很好,但如果去原場景就會發(fā)現(xiàn),AI消除后新建的場景與實際相去甚遠。智能也許是自然界的普遍現(xiàn)象,人的大腦也是進化的產(chǎn)物,所以AI對很多問題隨機回答、腦補答案,是十分必要的。
OpenAI的工程師John Carmack堅信一個人能夠?qū)崿F(xiàn)整個人類大腦的核心源代碼,個人能夠編寫實現(xiàn)AIGC的源代碼。他提出,人類DNA信息量不足1 GB,而大腦只有40 MB的信息容量,并且其中存在大量的冗余和無效代碼;假設(shè)把冗余去掉,其工作量是一個程序員即可完成的。人類大腦這樣的核心代碼可能需要幾萬行,關(guān)鍵在于大量的用于學習的語料庫。孕育生命僅需要10個月,而人類大腦發(fā)育成熟則一般要到23歲,養(yǎng)育過程的成本遠遠大于生育過程的成本。對于AIGC,算法的代碼其實很少,但是教會算法需要付出巨大的代價,甚至有個說法:人工智能,有多少智能就有多少人工。OpenAI把大量的數(shù)據(jù)標引工作交給了肯尼亞的外包團隊,由該團隊做相關(guān)的數(shù)據(jù)標注和訓練。AlphaGo初期學習了大量的圍棋棋譜,之后就開始自己跟自己對弈了。在知識和語言領(lǐng)域,在出版領(lǐng)域,未來也可能出現(xiàn)這種情況,一旦AI學會人類語言的規(guī)律,就會進入自我進化階段,加速發(fā)展。
李弘:技術(shù)有遞歸性,《技術(shù)的本質(zhì)》一書中講到所有的技術(shù)都是一點一點從最原始的技術(shù)不斷疊加出來的,理解ChatGPT亦然。ChatGPT并不是技術(shù)革命,其采用的技術(shù)路線并未變化,而是應用上的重大突破,其意義在于大大加強了人類對于人工智能可用性的信心。ChatGPT處在展開期,任何一項技術(shù)的應用都有導入和展開的情境。
ChatGPT對于大規(guī)模文字模態(tài)的AIGC應用具有重要意義,在歸納性的文字類工作中有著優(yōu)異表現(xiàn)。ChatGPT有理解、學習、邏輯推理能力,這些能力對于研究咨詢、定題分析十分必要,因此其對于出版業(yè)有很強的支撐作用。此外,ChatGPT在道德、倫理方面有比較強的判斷,如有主動承認錯誤、敢于質(zhì)疑的“性格”,未來其在模仿人類能力方面可能還會有很大進步。ChatGPT的應用會產(chǎn)生一個較大的市場,隨著越來越多的企業(yè)和個人接入ChatGPT的開放接口,其應用可能會是下一個階段創(chuàng)新和創(chuàng)業(yè)的主戰(zhàn)場。
2 技術(shù)賦能:嵌入出版業(yè)的AIGC
無論是人類還是機器,其生產(chǎn)的內(nèi)容都是供人類消費的精神產(chǎn)品并可轉(zhuǎn)化為意義,出版的本質(zhì)屬性和價值追求并不因內(nèi)容生產(chǎn)主體的變化而變化。著眼于當下,如果以出版為視角,AIGC無疑是近年來十分重要的出版轉(zhuǎn)型升級的機遇之一。
鄭鐵男:出版行業(yè)是為知識服務的,無論是紙質(zhì)書還是在線教育平臺、知識數(shù)據(jù)庫等,其實都是提供知識服務的。出版行業(yè)正向知識服務轉(zhuǎn)向,為網(wǎng)民提供知識搜索、知識推薦的服務。出版業(yè)原來的用戶主要是消費紙質(zhì)書,現(xiàn)在則是知識圖譜,要通過自然語言處理的中間插件技術(shù)或ChatGPT的技術(shù)進行內(nèi)容的組織和生產(chǎn)。與ChatGPT不同,出版業(yè)大多是做縱深領(lǐng)域,切口小,類似于石油領(lǐng)域、化工領(lǐng)域、機械領(lǐng)域等,我們把行業(yè)的內(nèi)容數(shù)字化,進行知識圖譜的標引,這并不需要海量的數(shù)據(jù)去給用戶提供最后的服務,因為用戶需要得到的都是行業(yè)內(nèi)部的準確內(nèi)容。我們要使用ChatGPT還有自然語言處理這種中間的搜索引擎的插件技術(shù),由出版社編輯進行深度的標引,用人工+技術(shù)的方式對內(nèi)容進行分類聚類,組織形成產(chǎn)品,提供給用戶。
張震:ChatGPT將會改變傳統(tǒng)知識的出版和教授方式,讓個性化學習成為可能,人工智能將會成為抄襲者。ChatGPT的訓練過程和訓練成本基本上都是小公司、小團隊無法承擔的,所以大部分公司都會基于人工智能操作系統(tǒng)開發(fā)自己的相關(guān)產(chǎn)品和應用。對出版企業(yè)來說也一樣,可能是在別人已經(jīng)訓練好的預訓練模型上做一些簡單的學習和加工,打造自己的產(chǎn)品和應用。
國內(nèi)有人將一門管理學慕課課程視頻轉(zhuǎn)化成文字后輸入給ChatGPT,再拿考試題目做測試,結(jié)果ChatGPT成功通過了考試,拿到了號稱頒發(fā)給ChatGPT的第一張結(jié)業(yè)證書。未來,有可能每一個出版機構(gòu)都會訓練出自己的面向某一個專業(yè)領(lǐng)域的提供人工智能服務的具體應用。
AIGC對出版業(yè)的意義是,在生產(chǎn)環(huán)節(jié)會實現(xiàn)效率的極大提升,在專業(yè)能力環(huán)節(jié)會讓專業(yè)能力前置,以前專業(yè)人士才能達到的水平、掌握的技術(shù),未來有可能終端用戶比編輯水平還要高,所以可能會給出版行業(yè)帶來顛覆。未來有可能產(chǎn)生一些人類和AI共同打造的新書,生產(chǎn)速度越來越快、數(shù)量越來越多。在服務群眾的精神文化需求上,AIGC還將產(chǎn)生重大的價值和功能。
沈錫賓:通過我們的實際測試發(fā)現(xiàn),ChatGPT在醫(yī)療健康和科技出版方面的應用潛力巨大:它具備基本醫(yī)學、保險常識和多輪對話的能力,對中文的理解能力不弱;具備病例閱讀、理解和糾錯的能力;信息抽取和術(shù)語標準化的能力涉及強知識,且隨時間變化少,這兩個任務接近甚至超出基于大量標注的有監(jiān)督學習的效果,相當于自帶通識知識庫;具備簡單推理、肯定否定關(guān)系的識別能力;具備連續(xù)學習的能力,在不斷的訓練后,前后一個月的水平完全不同;具備一定的學術(shù)評價能力,但水平有限,結(jié)果不理想;結(jié)合知識圖譜和相關(guān)規(guī)則進行輸出,可大幅提升現(xiàn)有對話、推理能力;醫(yī)學類應用的特點是嚴謹,其提供的建議可以給出置信度,幫助使用者判斷答案是否可靠。
對出版商來說,傳統(tǒng)的基于知識圖譜構(gòu)建進行知識服務很煩瑣,因為這需要大量的專家介入,而且知識圖譜在不斷演進,短時間內(nèi)難以完成更新。對此,可以利用出版機構(gòu)已有的論文文檔、一些比較好的臨床病例和臨床指南去做大規(guī)模的預訓練,形成知識服務體系,以此向大眾提供比較通用的醫(yī)學咨詢服務。通過大量經(jīng)過同行評議的數(shù)據(jù)訓練AI,可以此面向臨床醫(yī)生提供更好的CDSS(臨床決策支持系統(tǒng))服務。
人工智能在科技界的應用分為五個方向:第一,在科研設(shè)計和論文寫作方向上,其可以幫助科研人員完成數(shù)據(jù)的組織、統(tǒng)計和文字修訂,可以協(xié)助作者開展科研設(shè)計、進行投稿指導;第二,在知識服務方向上,它可以為用戶提供個性化服務,幫助出版企業(yè)從內(nèi)容提供商向知識服務商過渡,提供解決問題的方案而非文檔;第三,在選題策劃方向上,可以協(xié)助編輯、專家開展選題策劃,從大量的稿件中遴選出更優(yōu)秀的和更具話題性的文章,也可以開展專家遴選、評價等;第四,在學術(shù)不端檢測方向上,它利用圖像識別技術(shù)進行圖片對比,利用自然語言處理技術(shù)實現(xiàn)文字相似性檢查,能有效避免抄襲情況的發(fā)生;第五,在傳播方向上,它可以提煉主題、擴展表現(xiàn)形式、提升網(wǎng)絡(luò)傳播效率,也可以基于自動翻譯功能實現(xiàn)多語種傳播,還可以基于用戶精準畫像實現(xiàn)內(nèi)容的精準分發(fā)與推送。
3 未來已來:AIGC在出版業(yè)的實踐
出版史已經(jīng)證明,技術(shù)是深刻影響出版發(fā)展的關(guān)鍵因素之一。以ChatGPT為代表的AIGC技術(shù)在出版界快速實踐,一定程度上證明了其在提升內(nèi)容生產(chǎn)力方面的價值。隨著技術(shù)的不斷普及,其應用空間還將進一步得到拓展。
鄭鐵男:近期,Springer Link已經(jīng)有作者和ChatGPT合作出書。2023年2月14日,每日經(jīng)濟新聞、澎湃新聞、上游新聞等多家媒體平臺宣布接入被稱為“中國版ChatGPT”的百度“文心一言”,成為其生態(tài)合作伙伴。這些都彰顯了以ChatGPT為代表的AIGC工具在出版領(lǐng)域的廣闊應用前景。
數(shù)字出版正在向數(shù)據(jù)出版階段發(fā)展。出版企業(yè)要構(gòu)建數(shù)智底座、數(shù)據(jù)中臺,做好內(nèi)容數(shù)據(jù)和用戶數(shù)據(jù)。出版企業(yè)現(xiàn)在只有PDF、方正排版或者InDesign的文件,要把內(nèi)容變成碎片化的XML原數(shù)據(jù),才能被ChatGPT或自然語言處理技術(shù)利用,重新組織形成數(shù)據(jù)庫或者變成OWL知識圖譜。為此,要在標準上做好準備。有關(guān)部門發(fā)布的《中央文化企業(yè)數(shù)字化轉(zhuǎn)型升級項目標準化工作方案》《中央文化企業(yè)數(shù)字化轉(zhuǎn)型升級規(guī)劃與實施方案》《出版資源內(nèi)容部件數(shù)據(jù)元》等方案、標準,對書刊加工、數(shù)據(jù)管理、資料管理等都設(shè)置了規(guī)范,出版社要參照國家標準做好數(shù)據(jù)處理。
提供知識服務將會成為出版業(yè)下一步轉(zhuǎn)型的目標。如國家開放大學出版社的口號是“為終身學習者提供知識服務”,該社的愿景就是通過人工智能等方式,為用戶提供支持服務,讓學習更有效。出版行業(yè)已經(jīng)開始利用技術(shù)對內(nèi)容進行碎片化重組,更新產(chǎn)品和服務。正如黑龍江科學技術(shù)出版社總編輯張東君所言,基于內(nèi)容的多形態(tài)出版才具有生命力。中國電力出版社、社科文獻出版社、中國法制出版社等眾多出版社已經(jīng)改變了生產(chǎn)流程,從排版起就與加工公司合作,僅需4天時間就可生成XML、PDF和Epub文件,生產(chǎn)周期很短。出版企業(yè)要轉(zhuǎn)換流程,構(gòu)建排版、加工質(zhì)檢、標引、成品提交體系,從排版文件到XML、再到知識圖譜,打造這樣的數(shù)據(jù)庫生產(chǎn)與發(fā)布模式。要不斷地重組內(nèi)容,利用各種數(shù)字技術(shù)形成新的數(shù)字產(chǎn)品。出版企業(yè)要從文獻服務向信息服務轉(zhuǎn)型,最后成為知識服務業(yè)。出版企業(yè)要做多種形態(tài)的產(chǎn)品,這樣才有生命力。出版企業(yè)也可以為各類客戶建立數(shù)據(jù)庫,如組織內(nèi)容、搭建平臺。
李杰臣:《ChatGPT:AI革命》是國內(nèi)首部利用ChatGPT創(chuàng)作的關(guān)于ChatGPT的圖書,通過復盤該書的創(chuàng)作和出版流程,能夠直觀感受出版業(yè)如何利用AIGC,以及AIGC對出版內(nèi)容生產(chǎn)的影響。
這本書的寫作時間是8天,速度較快:首先,寫作過程中提出的問題非常準確,ChatGPT能夠快速填充細節(jié)內(nèi)容;其次,這本書是用ChatGPT講ChatGPT,其回復相對準確。在這本書的出版過程中,人工干預得最多的是寫作框架和邏輯關(guān)系,否則輸出內(nèi)容的前后邏輯會比較混亂。該書從交稿到出藍圖的周期大概是7天,一是因為總體文字量不大,只有11萬字;二是根據(jù)一線編輯反饋的意見,AIGC的文字質(zhì)量是優(yōu)于絕大多數(shù)人類作者的。關(guān)于知識產(chǎn)權(quán)問題,OpenAI公司的官方說明中明確提出,通過個人提問所產(chǎn)生的答案,其知識產(chǎn)權(quán)歸屬于提問者。
沈錫賓:人工智能已經(jīng)給科技期刊界帶來了正向影響。2019年,中華醫(yī)學會與國際知名期刊服務商Wiley及其旗下公司Atypon簽約,共同研發(fā)中華醫(yī)學會開放獲取平臺。Atypon在特定領(lǐng)域提供知識服務,目前其主要服務基于人工智能技術(shù)從原始內(nèi)容中提取知識而展開,幫助用戶在冗長的文本中快速準確地找到信息。Atypon的機器學習技術(shù)在內(nèi)容提升、模式識別、信息檢索以及知識聚合方面都有很多應用和場景。他們認為,人工智能在科研設(shè)計與論文寫作、知識服務、選題策劃、學術(shù)不端檢測、傳播出版等五個方面有巨大潛力。
Atypon團隊研發(fā)的人工智能技術(shù)應用在自動摘要、信息提取以及從語音到文本、圖片的轉(zhuǎn)化等領(lǐng)域,團隊還在研發(fā)文章完整性檢測、高級篩選論文的功能,可以實現(xiàn)自動翻譯、跨語言檢索;可以基于中文文獻推薦英文文獻;可以從一些內(nèi)容中做實體識別、構(gòu)建知識圖譜、尋找疾病與藥物之間的關(guān)系、提取因果關(guān)系,做共病的共同基因的知識圖譜。基于文章內(nèi)容,它可以生成非結(jié)構(gòu)式的小型摘要和一句話摘要,這個功能便于論文在Google Scholar這種學術(shù)引擎中進行分發(fā)和傳播;在圖片方面,它可以把模糊的圖片變得高清;可以基于視頻發(fā)現(xiàn)平臺和AI轉(zhuǎn)換成文本做二次檢索。
4 歧路彷徨:出版業(yè)的“危”與“機”
AIGC所引發(fā)的是包括本體論、認識論和方法論等在內(nèi)的一場內(nèi)容生產(chǎn)范式轉(zhuǎn)換,這向既有的理論方法、政策工具和實踐路徑等的有效性提出了挑戰(zhàn),出版業(yè)未來的不確定性正在增強,出版人要做好迎接機遇與挑戰(zhàn)的兩方面準備。
張震:大部分人所從事的都是服務業(yè),包括出版社的編輯。服務業(yè)的本質(zhì)是表演——有人“表演”,有人“看表演”。出版業(yè)其實大部分都屬于出版服務業(yè),如中小學教輔材料,其中的腦筋急轉(zhuǎn)彎類型的內(nèi)容長期沒有變化,只是形式更加生動,更加寓教于樂,更復雜。ChatGPT能賦能大部分服務業(yè),服務行業(yè)不需要太精密,人工智能取代這些行業(yè)是一種必然趨勢。
清華大學梁斌教授早在2011年就提出,未來的網(wǎng)絡(luò)教育領(lǐng)域,教育、培訓、出版、咨詢、投資沒有邊界。沒有邊界會導致工業(yè)時代的分工、行業(yè)的大規(guī)模融合。出版行業(yè)的未來會怎么樣?出版行業(yè)會做教育、培訓、投資以及咨詢相關(guān)的業(yè)務。大部分的出版工作和咨詢工作,本質(zhì)上做的是輔導性的工作,我認為會被AIGC取代;而一些創(chuàng)造性、創(chuàng)新性的行業(yè),是人類從來沒有去做過的事情,AIGC可能會發(fā)揮一些輔助作用。人類大腦神經(jīng)元網(wǎng)絡(luò)的參數(shù)、模型和能量消耗,還遠遠小于各種人工智能的數(shù)據(jù)模型。ChatGPT會開啟新的人工智能時代,出版會成為中國未來在線教育的入口。
李杰臣:在人機協(xié)同過程中,應該注重體現(xiàn)人的主體性。首先,OpenAI公司明確說明ChatGPT作為一個模型是沒有自主意識的,其無法為錯誤信息承擔責任。出版物應該體現(xiàn)人的意志,而AI不是承擔責任的主體,這也是很多期刊不接受ChatGPT作為聯(lián)合署名者投稿的原因。其次,在利用ChatGPT進行創(chuàng)作的過程中,很多思想、觀點必須由人提出,否則它會反復出現(xiàn)一些口水話。AI時代強調(diào)“問商”,就是將人的思想和主體性體現(xiàn)成問題,去引導機器回答。做人機交互,無論是創(chuàng)作一篇文章還是創(chuàng)作一本書,最終的內(nèi)容還是人引導機器生產(chǎn)的,而非相反。
對于編輯個人來說,AIGC高效與否取決于其使用的熟練程度。當AIGC引發(fā)一個產(chǎn)業(yè)的整體生產(chǎn)模式變革后就能體現(xiàn)其優(yōu)勢。AIGC對于文字編輯而言是利好,因為它可以幫助修改文字表達;對于策劃編輯而言則喜憂參半,一方面是中低端作者+AIGC就能很好地實現(xiàn)選題,另一方面是未來策劃編輯可能要耗費大量精力去甄別AIGC的內(nèi)容。
對于作者而言,AIGC對作者的創(chuàng)新思維、邏輯思維和求證辨?zhèn)文芰Φ囊髸?。此外,AIGC會改變作者的一些常規(guī)創(chuàng)作。在提出更好的問題的基礎(chǔ)上,讓AIGC去生成約70%的普通內(nèi)容,在此基礎(chǔ)上再增加30%的人類見解和創(chuàng)新。另外是去中心化的創(chuàng)作方式,內(nèi)容的生產(chǎn)模式經(jīng)歷了從專家生產(chǎn)到用戶生產(chǎn)、再到人工智能生產(chǎn)的過程,領(lǐng)域?qū)<抑恍枰褍?nèi)容的結(jié)構(gòu)體系列出來,再通過AI填充細節(jié)。在未來的創(chuàng)作中,這種去中心化的創(chuàng)作方式或許還會迎來新變革。此外,AIGC對于中低端的作者影響很大,但是對高端作者影響有限,因為高端作者往往有個人的獨特見解。
沈錫賓:AIGC在帶來一系列利好的同時,也帶來了一些隱憂?!犊茖W》系列期刊已經(jīng)明確,由ChatGPT(或任何其他人工智能工具)生成的文本不能用于科學作品中,圖像或圖形也不能是此類工具的產(chǎn)品,人工智能的程序不能成為作者;違反這些政策將構(gòu)成學術(shù)不端行為,與修改圖像或抄襲等不端行為沒有區(qū)別;當然,在研究論文中有許多由AI生成的合法數(shù)據(jù)集(而不是論文的文本)不包括在這次政策的更改中。《細胞》和《柳葉刀》則表示,不能使用人工智能工具取代作者完成關(guān)鍵性任務,作者還必須在論文中詳細解釋他們是如何使用人工智能工具的。然而,AIGC與人類創(chuàng)作的文本是難以區(qū)分的。AIGC還會涉及數(shù)據(jù)造假問題,計算機科學家已經(jīng)發(fā)現(xiàn),如果軟件沒有接觸到足夠的訓練數(shù)據(jù)來生成正確的回答,它通常會編造一個答案。如果被某些不法機構(gòu)利用,可能產(chǎn)生大量的混雜了假數(shù)據(jù)的“水文”,會極大地擾亂科技期刊的同行評議機制,造成公共資源的浪費。對此,需要研發(fā)相關(guān)的檢測工具,例如為DeepFake生成的換臉視頻加上特殊水印,AIGC的文字內(nèi)容也可以參考這種方式,以避免意外風險。
李弘:2022年關(guān)于元宇宙的討論很多,但元宇宙的發(fā)展已經(jīng)開始“退燒”。這給我們一個很強的警醒:這些技術(shù)與出版是何關(guān)系?出版業(yè)如何跟進新技術(shù)?出版業(yè)不該盲從技術(shù),尤其是以虛擬技術(shù)為代表的元宇宙技術(shù),因為對于出版業(yè)來說,其技術(shù)框架包括相關(guān)應用還十分遙遠。但ChatGPT基于大模型人工智能技術(shù),對出版業(yè)會有比較大的影響,它是離出版最近的風口,出版融合創(chuàng)新需要解決如何利用ChatGPT技術(shù)的框架及其相關(guān)應用的問題。如果不利用ChatGPT的相關(guān)技術(shù)來做好市場的、專業(yè)領(lǐng)域的出版轉(zhuǎn)型,出版發(fā)展就可能面臨越來越大的壓力。
推動出版融合必須厘清技術(shù)和內(nèi)容之間的矛盾關(guān)系,這要求我們在一個技術(shù)框架里、在一個更強的法律環(huán)境里重新理解出版。談論出版的本質(zhì),必須考慮其技術(shù)本質(zhì),否則在實踐中就會遇到困境。例如,關(guān)于專業(yè)出版的困境,實質(zhì)是投入問題。基于語音、圖像、文本的人工智能應用與出版有很大的重合度。一方面,這對出版可能會造成沖擊;另一方面,也給出版帶來了發(fā)展機遇,出版業(yè)要加大研發(fā)投入,讓人工智能技術(shù)為我所用,加大技術(shù)對內(nèi)容的支撐。出版實踐中對于數(shù)據(jù)、信息等出版客體的價值創(chuàng)造關(guān)注不夠。ChatGPT對于同樣問題的回應并不相同,其會根據(jù)問題描述情況調(diào)整回答。如果有足夠的語料,它就能在某一個專業(yè)領(lǐng)域給出更精確的檢索結(jié)果,這對于改善內(nèi)容質(zhì)量、提高檢索精準性是十分必要的。但這樣做在某種意義上是不合規(guī)的,雖然能優(yōu)化其模型和輸出結(jié)果,但是存在版權(quán)問題和數(shù)據(jù)安全問題。對此,需要盡快建立一個數(shù)據(jù)安全機制和內(nèi)容合規(guī)框架,使這類技術(shù)為出版所用、為產(chǎn)業(yè)賦能。
AI的突破對于人類的角色和管理效能的提升有很大幫助,對于ChatGPT的下一步技術(shù)創(chuàng)新,出版主管部門要做一些課題,重點實驗室要主動承擔責任,行業(yè)協(xié)會、高等院校、研究機構(gòu)都要開展研究,共同探討ChatGPT如何與出版結(jié)合。只有在政產(chǎn)學研各方合力推動之下,出版融合發(fā)展的技術(shù)創(chuàng)新和模式創(chuàng)新才有可能成功。
(實習生周洋對此文亦有貢獻。)
作者簡介
劉廣東,男,北京印刷學院出版學院講師。研究方向:出版基礎(chǔ)理論、數(shù)字出版新模式和學術(shù)出版。
Abstract: Chatbots, represented by ChatGPT, have attracted peoples attention to AIGC once again. The seminar of “Publishing Re-Imagination: AI and Content Production Transformation”, in response to the hot topics, invited five experts either from academia or industry to discuss the future of publishing in the context of AIGC. To understand this paradigm shift in content production transformation, the technical principles and availability of ChatGPT should be investigated and the relationship between man and machine in their interaction in the mode of AIGC must be identified. AIGC has been applied in practice to a certain extent, showing advantages in enhancing content productivity. For the publishing industry, AIGC brings greater uncertainty to industrial development, including both opportunities and challenges, for which publishers should prepare.
Keywords: AIGC; ChatGPT; Publishing transformation; Digital publishing; Intelligent publishing