人工智能生成內(nèi)容(AIGC)技術(shù)在出版領(lǐng)域的應用已經(jīng)帶來了深遠的影響?,F(xiàn)探討AIGC技術(shù)對出版行業(yè)的影響,如提高生產(chǎn)效率、降低成本、個性化內(nèi)容推薦等。然而,AIGC技術(shù)也面臨一些挑戰(zhàn),如信息真實性、版權(quán)問題和創(chuàng)意保護等。針對這些挑戰(zhàn),提出構(gòu)建生態(tài)、信息流程重塑、先研究后實踐、決策前充分討論商業(yè)模式得失等對策建議,以確保AIGC技術(shù)在出版領(lǐng)域的健康發(fā)展,并促進人類與AI共同創(chuàng)造更具創(chuàng)意和價值的內(nèi)容。
關(guān)于人工智能,進化論相關(guān)研究中側(cè)枝盲端的理念比較符合ChatGPT,它像不斷成長的魔法箱,也像人類真正的大腦,能夠?qū)ν饨绲妮斎耄ㄌ崾驹~)產(chǎn)生輸出(猜測)。了解AIGC與大模型的基本原理和發(fā)展過程,是應用大模型技術(shù)和AIGC工具的前提條件。智能時代的背景下,以算力、算法和應用構(gòu)筑的大模型生態(tài)已見雛形,未來的路線清晰可見。
在出版業(yè),利用AIGC工具增強信息采集能力,能幫助編輯快速獲取特定主題數(shù)據(jù),高效歸納總結(jié),支持選題策劃,正逐漸成為行業(yè)的應用趨勢。出版社運用AIGC與大模型的基本原理(如下圖),能對出版技術(shù)、內(nèi)容創(chuàng)作、內(nèi)容審核和數(shù)字化產(chǎn)生積極的推動作用。
AIGC的概念及發(fā)展歷程
AIGC(Artificial Intelligence Generated Content)是指生成式人工智能。從計算智能、感知智能到認知智能的進階發(fā)展來看,AIGC已經(jīng)為人類社會打開了認知智能的大門。通過單個大規(guī)模數(shù)據(jù)的學習訓練,AI具備了多個不同領(lǐng)域的知識,只需要對模型進行適當?shù)恼{(diào)整修正,就能完成真實場景的任務。AIGC把數(shù)據(jù)要素提到時代核心資源的位置,在一定程度上加快了整個社會的數(shù)字化轉(zhuǎn)型進程。
AIGC的發(fā)展總結(jié)和預測可分為4個階段。第一階段是1970—1990年,基于規(guī)則的推理,并未具備學習和歸納能力,是有效的老式人工智能,即啟發(fā)式的專家系統(tǒng)。第二階段是2000—2017年,基于統(tǒng)計學習,擅長學習和感知,但推理和創(chuàng)造能力不佳,僅對文字語言聲音和視覺進行處理,即神經(jīng)網(wǎng)絡、CNN和RNN系統(tǒng)。第三階段是2020—2030年,即預測生成階段,在感知、學習、推理、歸納上表現(xiàn)出色,開始具備創(chuàng)造能力,即能更好地適應、解釋和決策,能用自然語言進行交談,在監(jiān)督下自我學習和進行小樣本的數(shù)據(jù)訓練。第四階段是2030年之后,即類人智能階段,能完成人類所有智能工作,甚至超越人類大腦,具有超智慧。
AIGC浪潮與產(chǎn)業(yè)結(jié)合的特征和影響
AIGC與出版產(chǎn)業(yè)結(jié)合的特征
AIGC與出版產(chǎn)業(yè)結(jié)合的特征主要表現(xiàn)在三方面。第一,淺入淺出,開發(fā)難、投資大,但產(chǎn)品應用非常容易,產(chǎn)業(yè)使用不難。第二,落地生根,科技周期大幅縮短,投資周期與應用周期重疊。第三,相向而行,與以往產(chǎn)業(yè)所關(guān)聯(lián)的技術(shù)不同,賦能與顛覆效應并存。
文本類AIGC工具使用情況
大模型類工具使用對比。即使在中文領(lǐng)域,國內(nèi)大模型工具的使用效果仍與ChatGPT有較大差距。國內(nèi)的大模型工具更偏向于某一領(lǐng)域的專精(如下表)。例如,“文心一言”擅長內(nèi)容創(chuàng)作、智能辦公,“訊飛星火”擅長中文語境處理、邏輯推演,“通義千問”更擅長效率類、生活類和娛樂類,“豆包”則更擅長撰寫軟文。
當前,ChatGPT版本已經(jīng)可以免注冊使用,其能滿足大多數(shù)使用場景。更強大的4.0、4.5版本(4.5turbo)已經(jīng)完全可以作為生產(chǎn)工具,不僅能根據(jù)文本提示創(chuàng)造圖像,還能對現(xiàn)有圖像進行編輯和改進,甚至可以僅憑一張網(wǎng)頁截圖就能生成完整的網(wǎng)頁代碼,可以為編輯的日常工作節(jié)省大量時間成本。
AIGC對出版產(chǎn)業(yè)的影響
第一,流程重塑,即對現(xiàn)有信息技術(shù)的重寫。主要體現(xiàn)在對生產(chǎn)流程和運營流程的重塑。生產(chǎn)和運營是傳統(tǒng)出版的兩個核心環(huán)節(jié)。在數(shù)字化領(lǐng)域,內(nèi)容生產(chǎn)表現(xiàn)在智能校對、圖文和富媒體內(nèi)容生成方面;內(nèi)容運營表現(xiàn)在宣傳文案一鍵生成、虛擬人生成、數(shù)據(jù)庫多輪對話、閱讀App、知識社區(qū)(檢索)等方面。
第二,價值重塑,即出版內(nèi)容的增值,是知識價值的體現(xiàn),也是企業(yè)的重要資產(chǎn)之一。主要體現(xiàn)在內(nèi)容通過Token語義存儲資產(chǎn)化、通過訓練與收入分成價值化、通過數(shù)據(jù)標引促進紙質(zhì)書籍銷售。
第三,負面影響,即AIGC內(nèi)容對著作權(quán)的影響。目前,部分觀點認為,其侵犯了著作權(quán),也有觀點認為AIGC生產(chǎn)的產(chǎn)品著作權(quán)弱化。主要表現(xiàn)在對專業(yè)出版社、科技社的零售市場造成巨大沖擊,加速了數(shù)字資源的“被動使用”和傳統(tǒng)出版、數(shù)字出版的內(nèi)容服務形成“競爭”關(guān)系的同時,也給稿件來源的甄別帶來很大壓力。
出版機構(gòu)搭建垂直模型的方法
出版企業(yè)應用大模型主要有兩種方式,其一是進行API調(diào)用,基于現(xiàn)有通用大模型的接口進行應用的二次開發(fā),從而對外提供服務;其二是自建垂直領(lǐng)域大模型,利用大模型的技術(shù)力量對自有數(shù)據(jù)進行二次學習,通過訓練與微調(diào)后形成具有自身特色的大模型基座,對外提供服務。目前,出版社普遍采用自建垂直領(lǐng)域大模型的方式。垂直大模型有三種自建方式。
利用開源模型,購買GPU與工作站開展自我訓練
目前,國內(nèi)大部分的大模型公司均以開源模型為基礎(chǔ)進行二次開發(fā)和調(diào)優(yōu)。此方法雖然理論上可行,但對于不以技術(shù)擅長的出版企業(yè)而言,此方法基本行不通。難度不在于硬件的購買(硬件購買的成本并不太高,以馬斯克的Grok-1為例,8個A100加一些輔助設(shè)備即可以跑通,以目前GPU的成本測算大約在250萬—300萬),而在于跑通后的數(shù)據(jù)調(diào)優(yōu)和應用開發(fā)需要專業(yè)技術(shù)人員,且其后續(xù)的成長性嚴重不足(受限于初始開源模型的參數(shù))。歸根結(jié)底,出版企業(yè)并不是技術(shù)性企業(yè),此方法的選擇需慎之又慎。
利用現(xiàn)有通用大模型的API接口,開發(fā)相應的工具與應用
從以上步驟可以看出,如果出版企業(yè)要進行通用大模型的API調(diào)用,必須請專業(yè)公司按照需求進行開發(fā)。這種調(diào)用基本不涉及自身數(shù)據(jù)的二次訓練,是在通用大模型的基礎(chǔ)上進行有針對性地應用開發(fā)。其優(yōu)勢是隨著通用大模型能力的提升,所開發(fā)應用的智能化程度也會相應增加,劣勢是在完全依托于API調(diào)用的邏輯下出版企業(yè)的自身數(shù)據(jù)特色不明顯,且調(diào)用成本不低。
與大模型公司合作,開發(fā)出版垂直大模型
與大模型公司合作開發(fā)垂直模型,一般是利用大模型公司的通用模型能力以及云算力,對出版企業(yè)的自有數(shù)據(jù)進行二次學習,所開發(fā)出來的垂直模型具備一定的通用性能,也具備和自身出版數(shù)據(jù)高度契合的特色。另外,隨著基座能力的提升,也可以持續(xù)迭代進化。在此過程中,出版社除了提出垂直模型的應用需求外,還需要提供自身的內(nèi)容數(shù)據(jù),并盡量按照大模型的要求做好數(shù)據(jù)標記以便學習所用。而大模型公司則主要提供模型基座(通用大模型基座)和算力支持(一般是云算力,類似于云服務,也可以購買與大模型匹配的算力硬件。目前,算力硬件一類以英偉達為代表,另一類以國產(chǎn)化的華為鯤鵬、晟騰為代表)。
AIGC應用的技術(shù)邏輯與風險
技術(shù)應用邏輯
第一,循序漸進。絕大部分先進技術(shù)的應用始于偏娛樂領(lǐng)域,先進技術(shù)的應用會先出現(xiàn)在游戲和電影等領(lǐng)域,縱向觀察技術(shù)在其他領(lǐng)域的應用程度,再判斷切入的時間點,也是一種選擇。第二,萬事俱備。任何數(shù)字產(chǎn)品均由技術(shù)鏈而非單一技術(shù)構(gòu)成,如果技術(shù)鏈基本成熟,則需要開始做介入準備;如果技術(shù)鏈還有大量短板,即便產(chǎn)品能勉強開發(fā)出來,也不是好的切入節(jié)點。第三,成本壁壘。任何新技術(shù)在產(chǎn)業(yè)中的應用在初期均存在較高的成本壁壘,初期的商業(yè)變現(xiàn)基本在B端。因此,在具體的應用過程中,出版社要結(jié)合自身的實際情況綜合考量,如B端的滲透能力。
五種風險
1.數(shù)據(jù)安全風險
除了簡單的文生圖和多模態(tài)內(nèi)容生成外,出版社在與大模型公司開展內(nèi)容的深度合作時,通常需要將自身的數(shù)據(jù)通過接口方式提供給對方,即便對方承諾只是私域部署,也存在數(shù)據(jù)泄露的可能。出版社在開展AIGC技術(shù)研究時可以充分研究如GPT、Midjourney等工具。但如果要有針對性地對全社內(nèi)容開展大規(guī)模訓練,則應盡量選擇與國產(chǎn)大模型合作。
2.數(shù)據(jù)應用風險
出版社擁有出版物特定年限內(nèi)的專有出版權(quán)和專有信息網(wǎng)絡傳播權(quán)。目前,信息網(wǎng)絡傳播權(quán)中主要的出版形態(tài)為電子書和有聲書,這些出版物本身與原著作內(nèi)容高度一致。理論上出版社可以向第三方授權(quán)許可使用(包括翻譯、出版、展覽、廣播、放映、攝制、改編、匯編、制作光盤等)的有關(guān)事宜,但相關(guān)合同需另行簽訂。目前,大模型公司開展語料庫訓練或者出版社利用大模型開展語料訓練,對內(nèi)容的使用和改編、匯編雖然有相似之處,但從實際使用上看,是完全不同的概念。即便從法律上將改編、匯編和語料庫的訓練進行概念合并,出版社也需要征得作者的同意,重新簽訂協(xié)議方可,這一過程的工作量較大。
3.內(nèi)容甄別與AI倫理
模型技術(shù)日趨成熟,會帶來內(nèi)容的極大豐富,也會造成內(nèi)容的AI化比率攀升。學術(shù)出版是內(nèi)容出版領(lǐng)域的“明珠”,對所出版內(nèi)容的合規(guī)性審校(關(guān)注AI內(nèi)容生成甄別工具)應慎之又慎,盡量降低來稿內(nèi)容的AI化程度。
4.技術(shù)風險
通用大模型的成長迅速,其囊括的數(shù)據(jù)量可能已經(jīng)包含出版社自身的大部分數(shù)據(jù)。發(fā)展到通用大模型的高階階段,垂直大模型的應用效果極可能出現(xiàn)跟不上通用大模型發(fā)展的情況。如果出版社過早投入,會出現(xiàn)前期的投入效率低下的情形。當前,國內(nèi)通用大模型的整體水平落后于國外,出于數(shù)據(jù)安全性考慮,出版社不能夠進行大規(guī)模的國外大模型API調(diào)用。而國內(nèi)模型的“明日之星”,當前階段尚未顯現(xiàn)。過早選擇合作商開展垂直領(lǐng)域大模型訓練,存在未來技術(shù)全面落后的風險。
5.商業(yè)風險
到目前為止,大模型公司的商業(yè)變現(xiàn)方式主要有四種。第一,會員收入,如GPT4和MJ等。第二,API調(diào)用,按Token計費,如國內(nèi)的文心一言和訊飛星火。第三,垂直領(lǐng)域的商業(yè)合作。第四,大模型能力下沉到產(chǎn)品層,通過產(chǎn)品的差異化競爭優(yōu)勢而變現(xiàn)。
出版社應用大模型,要有相對清晰的商業(yè)考量,并擺正自身的位置,即出版社是AIGC的應用商而非技術(shù)開發(fā)商。從商業(yè)變現(xiàn)來看,在降本增效層面短期可以考慮購買相應的服務,如智能校對、智能翻譯、虛擬人等。在產(chǎn)品服務層面,應該著重將大模型下沉到現(xiàn)有的出版物,如紙質(zhì)出版物和數(shù)據(jù)庫、社區(qū)等產(chǎn)品。
AIGC應用在出版領(lǐng)域的應對策略
持續(xù)研究,準確時變,構(gòu)建生態(tài)
從發(fā)展趨勢來看,在做好當下出版業(yè)務的同時,出版單位還應持續(xù)密切關(guān)注大語言模型的發(fā)展動態(tài),及時開展AIGC相關(guān)專題研討部署,進一步分析AIGC產(chǎn)品給出版行業(yè)帶來的短期影響、長期影響以及有利影響、不利影響,做好預判預測,便于提前應對。
從內(nèi)容數(shù)據(jù)訓練與內(nèi)容輸出角度看,出版社和大模型公司之間的關(guān)系較為微妙。一方面,大模型公司需要出版社的高質(zhì)量語料持續(xù)供給;另一方面,通用大模型在未來的內(nèi)容輸出會在一定程度上搶占出版社的內(nèi)容服務市場。在AIGC浪潮中,出版內(nèi)容的數(shù)字資產(chǎn)化能否落地,絕大程度取決于行業(yè)和大模型公司之間的磨合和博弈,目前雙方的訴求不在同一維度,這時更需要行業(yè)主管單位發(fā)聲,推動機構(gòu)“抱團取暖”。
積極利用AI工具,信息流程重塑
在應用信息技術(shù)提質(zhì)增效的過程中,絕大部分出版社采用“打補丁”和分領(lǐng)域采購相應工具的方式,之后再集成并貫通。在AIGC時代,除極個別實力雄厚的出版社外,絕大部分出版機構(gòu)可能需要延續(xù)此方式,根本原因在于出版社自身的定位為大模型應用的使用方,對于生產(chǎn)和流程中的一些輔助性應用開發(fā)的專業(yè)性不足,且過早全面涉入,存在成本過高、投入產(chǎn)出較低的問題。
充分研究后開展實踐,不急于一時
于出版機構(gòu)而言,有些風險是不可控的,如數(shù)據(jù)應用的政策風險、通用大模型高速成長帶來的技術(shù)風險等。規(guī)避這些風險的最好方式是充分研究,如成本研究、技術(shù)研究、交互設(shè)計研究等,并耐心等待。另外,AIGC浪潮的特征之一是開發(fā)難、投入大,但其應用相對簡單,不用太擔心因為實踐較晚而出現(xiàn)較高的準入門檻。
決策之前應充分討論商業(yè)模式的得失
模型高速發(fā)展,已進入應用階段。在此階段,開展任何產(chǎn)品設(shè)計與開發(fā)的過程中,都應充分考慮產(chǎn)品商業(yè)模式的可行性,并綜合考慮開發(fā)成本和應用成本。
從數(shù)字內(nèi)容的消費與服務到內(nèi)容的跨界融合,再到內(nèi)容元宇宙,這是數(shù)字出版的發(fā)展階段。期待數(shù)字產(chǎn)業(yè)能在新模式與新生態(tài)中尋求更高的定位,讓內(nèi)容服務更好地融入社會的方方面面,真正推動全球范圍內(nèi)的文化大交融,推動世界文明的發(fā)展。