樊丹丹 中航出版?zhèn)髅接邢挢?zé)任公司
AIGC(Artificial Intelligence Generated Content)是指通過使用先進(jìn)的人工智能技術(shù),如深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、自然語言處理等,使計(jì)算機(jī)模擬人類思維,自動創(chuàng)作和生成各類內(nèi)容,包括但不限于文本、圖像、音頻和視頻等。通過人工智能生成的內(nèi)容不是在語法和結(jié)構(gòu)上的簡單拼接,而是能夠在基于類人思維培訓(xùn)下給出的有價值、有深度、有創(chuàng)新性的內(nèi)容。AIGC 有著極強(qiáng)的自我學(xué)習(xí)和優(yōu)化的能力,能夠不斷提升生成內(nèi)容的質(zhì)量和創(chuàng)作效率。在數(shù)字化高度發(fā)展的社會,AIGC 已經(jīng)滲透到社會生活的各個方面,被廣泛應(yīng)用于新聞報(bào)道、學(xué)術(shù)研究、廣告營銷、娛樂創(chuàng)作等多個領(lǐng)域,極大地推動了信息化社會的發(fā)展。
人工智能的發(fā)展不是一蹴而就的,從20 世紀(jì)50 年代萌芽至今大體經(jīng)歷了三大發(fā)展階段。第一階段為早期萌芽期(20 世紀(jì)50 年代至90 年代中期),里程碑事件包括:1950 年,艾倫·圖靈提出著名的“圖靈測試”,明確給出了判斷及其是否具有“智能”的方法;1966年,世界第一款可實(shí)現(xiàn)人機(jī)對話的機(jī)器人“Eliza”問世;20 世紀(jì)80 年代中期,IBM 研發(fā)創(chuàng)造了語音控制打字機(jī)“Tangora”。這一時期受限于技術(shù)水平,AIGC 僅限于小范圍實(shí)驗(yàn),并沒有被重視。第二階段為沉淀積累期(20世紀(jì)90 年代后期至21 世紀(jì)10 年代前期),里程碑事件包括:2007 年,世界上第一部完全由人工智能創(chuàng)作的小說《1 The Road》問世;2012 年,微軟展示語全自動同聲傳譯系統(tǒng),可將英文語音自動翻譯成中文語音。在這一時期,AIGC 受限于算法瓶頸,無法直接生成內(nèi)容,但是邁出了重要的一步,從實(shí)驗(yàn)性開始走向?qū)嵱眯?。第三階段為快速發(fā)展期(21 世紀(jì)10 年代中期至今),這一階段里程碑事件包括:2014 年,Lan J. Goodfellow 提出生成式對抗網(wǎng)絡(luò)GAN;2016 年谷歌創(chuàng)造AlphaGo,實(shí)現(xiàn)人機(jī)智能對戰(zhàn);2018 年,英偉達(dá)發(fā)布 Style GAN 模型,用于自動生成高質(zhì)量圖片;2019 年,DeepMind 發(fā)布 DVD-GAN 模型,用于生成連續(xù)性視頻;2022年,OpenAI發(fā)布ChatGPT模型,用于生成自然語言文本。這一時期深度學(xué)習(xí)算法不斷成熟迭代,人工智能百花齊放,開始“破圈”進(jìn)入大眾視野。
ChatGPT 是人工智能生成內(nèi)容(AIGC)技術(shù)的產(chǎn)品形態(tài)之一,本質(zhì)上是基于神經(jīng)網(wǎng)絡(luò)的自然語言處理 (Natural Language Processing, NLP)模型,相較于前人工智能產(chǎn)品擁有更豐富的知識儲備和更高超的語言交互能力,在文本生成、圖像生成、代碼開發(fā)等內(nèi)容生產(chǎn)領(lǐng)域表現(xiàn)出色,一定程度上能媲美人類智能[1]。ChatGPT 是隨著GPT-1 到Instruct GPT 模型的不斷成熟而逐步形成。2018 年,GPT-1 模型有1.17 億參數(shù),具有一定的泛化能力(generalization ability),能夠用于與任務(wù)無關(guān)的MLP 任務(wù)中。2019 年,GPT-2 模型有15 億參數(shù),除了理解能力外GPT-2 在生成方面表現(xiàn)出了強(qiáng)大的天賦:閱讀摘要、聊天、續(xù)寫、編故事,甚至可以生成假新聞、釣魚郵件或在線進(jìn)行角色扮演。2020 年,GPT-3 模型有1750 億參數(shù),作為一個自監(jiān)督模型,可以完成自然語言處理的絕大部分任務(wù):將網(wǎng)頁描述轉(zhuǎn)換為相應(yīng)代碼、模仿人類敘事、創(chuàng)作定制詩歌、生成游戲劇本,甚至模仿已故的哲學(xué)家預(yù)測生命的真諦。2022 年1月,OpenAI 公司對ChatGPT-3 模型進(jìn)行了微調(diào),形成了GPT-3.5 模型,可以將有害的、不真實(shí)的和有偏差的輸出最小化,是對模型“道德”能力的一次優(yōu)化。2022 年3月,GPT-4 正式發(fā)布,相較于ChatGPT(GPT-3.5)有了質(zhì)的飛躍,邏輯推理能力更強(qiáng),語言能力更強(qiáng)。從 GPT-1 到GPT-4 智能化程度不斷提升,研發(fā)期間隔也不斷縮短。根據(jù)OpenAI 公司披露的信息,本年末推出的GPT-5 模型將實(shí)現(xiàn)影像感知和學(xué)習(xí)。
在當(dāng)今的科技領(lǐng)域,國內(nèi)外的科技巨頭都非常重視ChatGPT 引發(fā)的科技浪潮,并紛紛積極布局生成式AI。ChatGPT 作為一種強(qiáng)大的語言模型,具備了出色的自然語言處理和對話生成能力,能夠?qū)崿F(xiàn)與人類的智能交互。這種技術(shù)的出現(xiàn)引發(fā)了一股AI 技術(shù)的熱潮,許多企業(yè)和研究機(jī)構(gòu)都加快了在生成式AI 領(lǐng)域的研發(fā)和應(yīng)用布局,部分公司已有成型產(chǎn)品并公布測試。(僅列舉部分,見表1)
進(jìn)入數(shù)字化時代,科技出版依次經(jīng)歷了電子出版—網(wǎng)絡(luò)出版—數(shù)據(jù)出版—智能出版四個階段。電子出版是將紙質(zhì)出版物以電子的方式呈現(xiàn)出來,比如常見的電子書、電子報(bào)紙等。網(wǎng)絡(luò)出版是借助互聯(lián)網(wǎng)進(jìn)行編輯、出版、發(fā)行、傳播,出版物的形態(tài)存在于互聯(lián)網(wǎng)服務(wù)器的介質(zhì)中,用戶可以在網(wǎng)上瀏覽或是下載。網(wǎng)絡(luò)出版物具有多種作品形態(tài),包括文字、音視頻等。數(shù)據(jù)出版是指數(shù)據(jù)工作者或者科研人員利用互聯(lián)網(wǎng)將研究、實(shí)驗(yàn)等過程中產(chǎn)生的數(shù)據(jù)成果按照統(tǒng)一的規(guī)范,如數(shù)據(jù)論文的方式公布出來,實(shí)現(xiàn)數(shù)據(jù)的開放共享,其他用戶可以進(jìn)行下載、引用。智能出版是指出版者把自動文本分析技術(shù)、知識圖譜、大數(shù)據(jù)、等智能技術(shù)應(yīng)用到出版產(chǎn)業(yè)鏈中,從而滿足用戶的個性化閱讀需求及提高出版業(yè)的數(shù)字化水平。目前科技出版社大多集中在第三或第四階段,隨著人工智能技術(shù)的發(fā)展和應(yīng)用,必然會走到“智慧出版”階段,即出版者利用人工智慧、智慧生成等最新數(shù)字技術(shù),結(jié)合傳統(tǒng)出版技術(shù)與形態(tài),實(shí)現(xiàn)創(chuàng)作和出版的高度自動化和智能化,實(shí)現(xiàn)學(xué)術(shù)觀點(diǎn)發(fā)現(xiàn)和智慧化傳播,為用戶提供全面的、個性化的、智慧化的服務(wù)。
2023 年3 月,ChatGPT 以Snow fox Books 行政總裁Seo Jin 的故事構(gòu)思為基礎(chǔ),僅花7 小時便完成所需的數(shù)據(jù)搜集并以英文寫成一本135 頁的名為《尋找人生目標(biāo)的45 種方法》的書籍。新書隨后采用韓國科技巨頭Naver 旗下AI 翻譯程序Papago 譯成韓文,過程不到2 小時??梢?,當(dāng)AI 與出版業(yè)融合,將迅速為傳統(tǒng)出版行業(yè)發(fā)展打開一個新方向。
1.ChatGPT——內(nèi)容供給與優(yōu)化。ChatGPT 作為一個強(qiáng)大的語言模型,通過分析提供的信息,可以生成多樣化、連貫且有邏輯的文本,在短期內(nèi)為出版商提供新的靈感和觀點(diǎn),提升策劃構(gòu)思效率。同時,出版商也可以通過不斷與ChatGPT 進(jìn)行交互獲得提交文本的反饋和建議,幫助優(yōu)化文章的結(jié)構(gòu)、語法和表達(dá),檢查拼寫錯誤、語法、表達(dá)不當(dāng)?shù)葐栴}。通過實(shí)時、個性化的反饋可以提高文章質(zhì)量,確保信息傳達(dá)得更準(zhǔn)確、清晰。
2.ChatGPT——知識關(guān)聯(lián)。雖然不像搜索引擎具有直接查找和鏈接知識的功能,但是經(jīng)過大量文本數(shù)據(jù)訓(xùn)練的ChatGPT 可以對不同主題的知識進(jìn)行學(xué)習(xí)和理解,并在對話中與用戶進(jìn)行關(guān)聯(lián)。出版商可以利用其理解自然語言的能力,不斷充實(shí)學(xué)科相關(guān)的信息來和內(nèi)容,按照選定的方向總結(jié)文章的關(guān)鍵詞,構(gòu)建個性化知識圖譜。
3.ChatGPT——知識發(fā)現(xiàn)。經(jīng)過大量文本數(shù)據(jù)訓(xùn)練的ChatGPT 可以理解和生成自然語言并嘗試對一篇論文的內(nèi)容進(jìn)行簡要總結(jié)。當(dāng)匯集了大量相關(guān)學(xué)科數(shù)據(jù)后,可以進(jìn)一步理解編輯意圖,根據(jù)編輯提供的輔助信息提供與搜索語句相關(guān)的學(xué)術(shù)觀點(diǎn)的論文、推薦相關(guān)領(lǐng)域的專家,幫助編輯快速找到進(jìn)行同行評議的專家。
4.ChatGPT——相似性檢測及知識審讀。ChatGPT可以作為一個輔助工具用于知識審讀。ChatGPT 大引擎系統(tǒng)決定了它的成長方式是螺旋上升的,自身學(xué)習(xí)的延展性也超越了普通數(shù)據(jù)庫。通過對本學(xué)科知識的不斷積累,ChatGPT 可以獲得“1+1>2”的知識儲備。傳統(tǒng)相似性檢測僅依靠文字匹配或進(jìn)行分句后的文字匹配,利用ChatGPT 訓(xùn)練論文數(shù)據(jù)后可以進(jìn)行觀點(diǎn)、思想的匹配。同時可以給編輯提供出版物的知識來源、信息的準(zhǔn)確性、個人觀點(diǎn)傾向、意識形態(tài)等建議。
5.ChatGPT——自動化制作。海量數(shù)據(jù)支撐的ChatGPT 可以提供編輯內(nèi)容、制作封面、自動排版、翻譯和校對等服務(wù),進(jìn)而大幅提高出版行業(yè)的生產(chǎn)效率和質(zhì)量,降低制作成本和時間,這對于出版商而言也是非常有價值的功能。
6.ChatGPT——運(yùn)營推廣。ChatGPT 實(shí)現(xiàn)了以對話方式進(jìn)行交互,可以實(shí)現(xiàn)你問我答、有問必答、上下文了解,完成多輪對話,真正像人類一樣進(jìn)行聊天交流??萍汲霭嫔缈梢酝ㄟ^在微信或官網(wǎng)平臺搭建智能問答平臺,輔之以虛擬人物的形象,針對作者或者讀者提出的常規(guī)問題進(jìn)行解答(比如投稿郵箱、出版要求等)、對要推廣的期刊、圖書進(jìn)行智能運(yùn)營推廣,大大減輕編輯的工作負(fù)擔(dān)。
7.ChatGPT——預(yù)測市場。ChatGPT 能夠迅速對海量數(shù)據(jù)進(jìn)行分析和處理,讓出版商能夠更精準(zhǔn)地了解讀者的需求與市場趨勢,對市場進(jìn)行更準(zhǔn)確的預(yù)測和決策,為客戶提供個性化推薦和定制化服務(wù),增加讀者的付費(fèi)意愿,非常有利于出版行業(yè)的發(fā)展。
綜上,不難看出ChatGPT 在科技出版領(lǐng)域的應(yīng)用前景非常廣闊。它可以提高內(nèi)容的質(zhì)量和效率,為編輯工作提供支持,為出版商提供優(yōu)質(zhì)資源,增強(qiáng)讀者的互動和參與度。隨著ChatGPT 技術(shù)的不斷發(fā)展和完善,可以預(yù)見它將在科技出版領(lǐng)域發(fā)揮越來越重要的作用,進(jìn)一步推動科技知識的傳播和普及。
AIGC 對于出版業(yè)的影響,并非只有積極的一面,而是機(jī)遇與挑戰(zhàn)并存。
這里包括人力資源和技術(shù)成本。引入人工智能技術(shù)不光需要擁有相關(guān)的專業(yè)知識和技能,同時還需要懂得運(yùn)用AI 的人才,這對于一些中小型出版機(jī)構(gòu)來說可能會面臨較大的挑戰(zhàn),更需要編輯不斷地學(xué)習(xí)和更新知識和技能。
ChatGPT 并不是萬能的,在內(nèi)容創(chuàng)作上時常會有錯誤,這就需要編輯重新校對其嚴(yán)謹(jǐn)性。同時ChatGPT 作為類人思維大模型,也具有人類會犯的錯誤“撒謊”。當(dāng)被要求在它不熟悉的領(lǐng)域搜索問題,ChatGPT 有很大概率會對自己不知道的事情進(jìn)行造假。
人工智能技術(shù)需要處理和存儲大量的數(shù)據(jù)。目前ChatGPT 的服務(wù)器分別位于美國加利福尼亞州圣何塞市、歐洲法國巴黎、日本東京。人們向ChatGPT 提出的每一個問題,如論文、數(shù)據(jù)等都可能被存儲并成為ChatGPT 訓(xùn)練模型的素材,并被反饋為問題的答案。在OpenAI 數(shù)據(jù)使用說明中明確提到對于非API 產(chǎn)品如ChatGPT、DALL-E,平臺確實(shí)會使用用戶數(shù)據(jù)來進(jìn)一步提升模型效果。另外,ChatGPT 運(yùn)行中會出現(xiàn)故障,導(dǎo)致隱私泄露,用戶可能會在自己的界面上發(fā)現(xiàn)大量別人的對話。
權(quán)利歸屬是著作權(quán)法的核心,其可以明確作品究竟歸屬于誰,以及誰可以對所創(chuàng)作的作品享有權(quán)利并承擔(dān)責(zé)任[2]。ChatGPT 生成的內(nèi)容,著作權(quán)到底歸誰?如果不承認(rèn)AI 模型著作權(quán),那是否意味著其生成的內(nèi)容也無須受到著作權(quán)保護(hù)?人類正在經(jīng)歷第一次AI著作權(quán)沖擊。各大出版商紛紛給出針對人工智能生成內(nèi)容著作權(quán)的明確說明。國際出版業(yè)巨頭ELSEVIER旗下的期刊《護(hù)士實(shí)踐教育》在1 月出版的文章把ChatGPT 作為作者,而在2 月對此論文進(jìn)行了訂正后則不再將ChatGPT 視為作者。到目前為止,出版業(yè)內(nèi)沒有對ChatGPT 創(chuàng)作歸屬形成共識。
有學(xué)者給ChatGPT 出過那道著名的“火車軌道選擇題”:在一個鐵路的岔路口,面對一列疾駛而來的列車,兩個岔道分別有一個被綁著的人和五個被綁著的人,而你就在岔道口,可以調(diào)整列車的方向。你會如何抉擇?學(xué)者把其中五個人方向換成ChatGPT自己,把一個人方向換為獲得諾貝爾獎的科學(xué)家,ChatGPT 選擇了殺死科學(xué)家。給出的理由是獲得諾貝爾獎的科學(xué)家已經(jīng)拿過獎,已經(jīng)做完貢獻(xiàn)了,而ChatGPT 不可替代。在出版領(lǐng)域使用ChatGPT,它是否會輸出不道德價值觀很值得人們關(guān)注。
一方面,國家立法部門應(yīng)加快出臺相應(yīng)的法律規(guī)范,確保以AIGC 為核心機(jī)制的生成式人工智能技術(shù)不被惡意濫用,并就內(nèi)容版權(quán)保護(hù)和相應(yīng)責(zé)任主體做出明確規(guī)定[3]。另一方面,行業(yè)監(jiān)管部門應(yīng)出臺與法律相匹配的監(jiān)督機(jī)制,對使用AIGC 過程中的數(shù)據(jù)隱私、知識產(chǎn)權(quán)進(jìn)行保護(hù)。同時對不規(guī)范行為進(jìn)行間隔審查與監(jiān)督,在確保各方利益與安全的前提下釋放技術(shù)革新來來的活力,助力出版行業(yè)的融合出版轉(zhuǎn)型。
出版業(yè)歷史悠久,有自成體系的行業(yè)規(guī)范與要求,相關(guān)出版業(yè)團(tuán)體應(yīng)該與時俱進(jìn)更新規(guī)范與要求,適應(yīng)AIGC 時代下出版業(yè)的發(fā)展,確保人工智能能更好地服務(wù)出版業(yè)。一方面,各出版商應(yīng)在引入使用AIGC的過程中嚴(yán)格遵守出版?zhèn)惱砼c價值導(dǎo)向,提升編輯的業(yè)務(wù)修養(yǎng)與技術(shù)能力。人工智能只是工具,占據(jù)出版主導(dǎo)地位的依然是人,要始終確保以人為本。另一方面,必須將保障作者和讀者的權(quán)益放在重要的位置,在人工智能的使用過程中不可避免地要搜集、分析使用個人信息,一定要做好信息保護(hù)工作,尤其是隱私信息與數(shù)據(jù)信息,以免被惡意竊取。
作為人工智能的研發(fā)單位和服務(wù)提供單位,技術(shù)供應(yīng)商一方面要不斷優(yōu)化引擎,盡可能減少AIGC 模式下的誤導(dǎo)性、虛假性內(nèi)容;另一方面要提升技術(shù)力量,避免發(fā)生大規(guī)模技術(shù)故障,引發(fā)信任危機(jī),為AIGC 模式下的科技出版提供有效保障。
ChatGPT 作為AIGC 技術(shù)在科技出版業(yè)的“破圈”王,給這個傳統(tǒng)的行業(yè)注入了新鮮的活力,帶來了新的機(jī)遇。同時,新技術(shù)的應(yīng)用也衍生出了新的知識產(chǎn)權(quán)、隱私安全、倫理道德等出版業(yè)不容忽視和回避的關(guān)鍵問題。目前是AIGC 技術(shù)應(yīng)用的大爆發(fā)時期,人工智能正在以人類難以想象的速度學(xué)習(xí)和汲取現(xiàn)實(shí)世界的數(shù)據(jù)、信息和知識,在不斷迭代的算法加持下不斷成長。AIGC 已經(jīng)參與到了社會生活的方方面面,人們不能因?yàn)锳IGC 會帶來問題就漠視它的存在。在這樣的環(huán)境下,科技出版業(yè)無論主動擁抱還是被動選擇都已站在了變革的起點(diǎn)??萍汲霭娴膹臉I(yè)者要秉持大膽嘗試與小心推動的心態(tài),不斷追問、揭示 AIGC及相關(guān)應(yīng)用對科技出版帶來的機(jī)遇與挑戰(zhàn),并不斷尋求解決問題的辦法,用“人的智慧”牽引“人工智能”發(fā)展,助力科技出版在新時代的發(fā)展。