【摘 要】以文本生成、語音合成、文生視頻為代表的生成式人工智能技術(shù)與數(shù)字出版的融合,提升了數(shù)字出版對(duì)信息多模態(tài)、產(chǎn)業(yè)融合化、流程自動(dòng)化以及服務(wù)交互性的需求,也帶來了知識(shí)創(chuàng)新性、信息準(zhǔn)確性和行為可負(fù)責(zé)性的問題和風(fēng)險(xiǎn)。在數(shù)字出版的智能化發(fā)展中,出版機(jī)構(gòu)應(yīng)加強(qiáng)同網(wǎng)絡(luò)平臺(tái)和科技企業(yè)的合作以促進(jìn)數(shù)字出版產(chǎn)業(yè)深度融合,運(yùn)用生成式人工智能技術(shù)豐富數(shù)字出版產(chǎn)品形態(tài)的多模態(tài)發(fā)展,優(yōu)化數(shù)字出版用戶服務(wù)及其個(gè)性化與即時(shí)性的交互需求,保障智能化出版業(yè)務(wù)流程中必要的人工干預(yù)并明確責(zé)任歸屬。
【關(guān) 鍵 詞】數(shù)字出版;融合出版;智能出版;生成式人工智能;AIGC
【作者單位】匡文波,中國人民大學(xué)新聞學(xué)院;姜澤瑋,中國人民大學(xué)新聞學(xué)院。
【中圖分類號(hào)】G230.7 【文獻(xiàn)標(biāo)識(shí)碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2024.14.003
近十年來,互聯(lián)網(wǎng)傳播正在逐步邁向智能化階段,智能傳播的基本生態(tài)環(huán)境已初具規(guī)模,并在理論與實(shí)踐中發(fā)生多重連鎖反應(yīng)[1]。尤其是近兩年來,隨著以ChatGPT、Sora為代表的生成式人工智能技術(shù)及其社會(huì)化應(yīng)用的迅猛發(fā)展,人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)正在全方位滲透與影響著互聯(lián)網(wǎng)信息傳播的多個(gè)領(lǐng)域與不同層次,有望帶來新一輪的傳媒行業(yè)變革。在此背景下,發(fā)展多模態(tài)信息、自動(dòng)化流程、融合化產(chǎn)業(yè)、交互性服務(wù)的數(shù)字出版將迎來全新的機(jī)遇與挑戰(zhàn),如何有效運(yùn)用生成式人工智能技術(shù)賦能數(shù)字出版的智能化發(fā)展,成為目前出版業(yè)備受關(guān)注的問題。
一、數(shù)字出版的業(yè)態(tài)現(xiàn)狀:多模態(tài)、融合化、自動(dòng)化、交互性
隨著信息技術(shù)和網(wǎng)絡(luò)傳播環(huán)境的發(fā)展與其對(duì)社會(huì)生產(chǎn)生活的影響深化,以及我國媒體融合戰(zhàn)略的持續(xù)推進(jìn),傳統(tǒng)出版業(yè)與數(shù)字出版的深度融合近年來越發(fā)明顯。目前,數(shù)字出版的業(yè)態(tài)發(fā)展集中體現(xiàn)為多模態(tài)信息、融合化產(chǎn)業(yè)、自動(dòng)化流程和交互性服務(wù)四個(gè)特征。
1.信息的多模態(tài)
數(shù)字出版的多模態(tài),指出版工作的客體在形態(tài)上由紙質(zhì)媒介中的圖文信息向互聯(lián)網(wǎng)媒介中的文本、圖像、語音、視頻等多種信息形態(tài)發(fā)展。在傳統(tǒng)出版業(yè)環(huán)境中,出版作品主要以文字信息為主,出版業(yè)務(wù)需要處理的信息模態(tài)相對(duì)單一。隨著數(shù)字出版的發(fā)展,以及受網(wǎng)絡(luò)傳播中用戶知識(shí)獲取與閱讀習(xí)慣變化的影響,出版工作的客體正向文本、圖像、語音與視頻的多模態(tài)發(fā)展。數(shù)字出版多模態(tài)的變化,本質(zhì)上是順應(yīng)讀者、消費(fèi)者以及網(wǎng)絡(luò)用戶行為發(fā)展的產(chǎn)物,同時(shí)也對(duì)編輯出版工作的人才、技術(shù)、經(jīng)營提出了新的要求。
近年來,短視頻和有聲書成為我國數(shù)字出版實(shí)踐中的兩大重點(diǎn)應(yīng)用領(lǐng)域,極大豐富了用戶對(duì)書籍及其相關(guān)知識(shí)獲取的感官體驗(yàn)和信息接收?qǐng)鼍?。如抖音等短視頻媒介憑借高度的用戶黏性、靈活的使用場(chǎng)景以及較強(qiáng)的沉浸感和觀看慣性等特質(zhì),已成為當(dāng)下大眾獲取信息與知識(shí)的主流媒介,出版社、雜志社、報(bào)社等傳統(tǒng)出版機(jī)構(gòu)也十分重視短視頻的內(nèi)容生產(chǎn)與傳播效果。在有聲出版方面,微信讀書等閱讀客戶端也在紛紛增強(qiáng)書籍的有聲化服務(wù)功能,優(yōu)化技術(shù)以提升有聲書的質(zhì)量,豐富閱讀活動(dòng)的多元場(chǎng)景與感官體驗(yàn)。
2.產(chǎn)業(yè)的融合化
數(shù)字出版的融合化,指出版業(yè)務(wù)與新興技術(shù)和管理創(chuàng)新融為一體的新型出版形態(tài)[1] 。數(shù)字出版的融合化正在業(yè)務(wù)、渠道、技術(shù)、管理等各方面進(jìn)行,豐富多元的傳播渠道及與互聯(lián)網(wǎng)商業(yè)平臺(tái)的合作是目前產(chǎn)業(yè)融合的基本特征。雖然紙質(zhì)閱讀仍然占據(jù)重要地位,但數(shù)字化閱讀、聽書、講書等閱讀渠道的重要性也在不斷提升。
根據(jù)2024年4月第二十一次全國國民閱讀調(diào)查結(jié)果,綜合性閱讀和數(shù)字化閱讀方式的接觸率最高,手機(jī)閱讀在各類閱讀方式中的接觸率和接觸時(shí)長(zhǎng)均位居第一;聽書和視頻講書越來越受到我國國民喜愛,三成以上的國民有聽書的習(xí)慣,移動(dòng)有聲APP、微信公眾號(hào)或小程序、智能音箱、廣播和有聲閱讀器或語音讀書機(jī)是目前用戶聽書時(shí)主要采用的形式[2]??梢?,數(shù)字出版產(chǎn)業(yè)正與各類互聯(lián)網(wǎng)平臺(tái)及其他社會(huì)化傳播主體開展密切合作,市場(chǎng)化和商業(yè)化的重視程度不斷提升。如科技期刊出版越來越多地使用網(wǎng)絡(luò)首發(fā)并開通了微信、微博、抖音等平臺(tái)賬號(hào),圖書出版也越發(fā)重視手機(jī)閱讀客戶端的傳播效果,通過直播、短視頻、有聲書等方式進(jìn)行知識(shí)產(chǎn)品的二次創(chuàng)作與宣傳營銷。
3.流程的自動(dòng)化
數(shù)字出版的自動(dòng)化,指編輯出版的微觀業(yè)務(wù)流程在計(jì)算機(jī)軟件與人工智能技術(shù)的影響下不斷趨于自動(dòng)化,以提升編輯出版工作的效率和準(zhǔn)確性。傳統(tǒng)的編輯出版業(yè)務(wù)內(nèi)容較為單一和重復(fù),并且對(duì)細(xì)節(jié)要求非常嚴(yán)謹(jǐn),從自動(dòng)化與人工智能技術(shù)對(duì)社會(huì)各領(lǐng)域勞動(dòng)的替代性來看,重復(fù)性與模式化越高的工作越有可能被機(jī)器所替代,或更多地使用機(jī)器來減輕人力勞動(dòng)的負(fù)擔(dān),從而使人力能夠最大限度投入富有創(chuàng)造性價(jià)值和實(shí)現(xiàn)生產(chǎn)者自我滿足的工作之中。
從2015年左右機(jī)器人寫作在傳媒領(lǐng)域的應(yīng)用開始,各種自動(dòng)化寫作、編輯和校對(duì)軟件就陸續(xù)在出版業(yè)選題策劃、內(nèi)容提供、編輯、制作、市場(chǎng)推廣、信息反饋等多個(gè)環(huán)節(jié)中得到應(yīng)用[3]。隨著人工智能技術(shù)的進(jìn)步,編輯出版流程的自動(dòng)化水平也隨著媒體融合智能化發(fā)展不斷提升,更先進(jìn)的自然語言處理模型以及更為準(zhǔn)確和全面的大數(shù)據(jù)資源,為自動(dòng)化流程的實(shí)現(xiàn)不斷注入動(dòng)力。此外,在自動(dòng)化的編輯出版工作中,也正在生成新型的人機(jī)交互和人機(jī)關(guān)系,人與機(jī)器的合作、學(xué)習(xí)、協(xié)同等問題正在對(duì)編輯出版業(yè)務(wù)產(chǎn)生越來越大的影響。
4.服務(wù)的交互性
數(shù)字出版的交互性,指出版主體的讀者服務(wù)或用戶服務(wù)在互聯(lián)網(wǎng)媒介中呈現(xiàn)更加靈活、即時(shí)與個(gè)性化的互動(dòng)關(guān)系。出版活動(dòng)是面向社會(huì)公眾的知識(shí)服務(wù),其目的不只是作品的發(fā)行,還需要為用戶提供各種配套性服務(wù)以提升傳播效果。在傳統(tǒng)出版活動(dòng)中,出版社的讀者服務(wù)種類比較單一且缺乏即時(shí)的雙向互動(dòng)性。數(shù)字出版則要求在用戶關(guān)系和用戶服務(wù)上作出變革,以適應(yīng)網(wǎng)絡(luò)傳播的即時(shí)性、互動(dòng)性等特征;強(qiáng)調(diào)優(yōu)化與拓展用戶服務(wù),重視用戶對(duì)出版產(chǎn)品的體驗(yàn)感,加強(qiáng)用戶關(guān)系的建設(shè),拓展產(chǎn)品營銷方式。
但目前仍有許多出版機(jī)構(gòu)不夠重視數(shù)字出版中的用戶服務(wù)和用戶體驗(yàn),這一是受到紙媒出版時(shí)代形成的定式思維影響,即出版機(jī)構(gòu)對(duì)出版物內(nèi)容質(zhì)量的關(guān)注與重視要?jiǎng)龠^用戶服務(wù)與用戶體驗(yàn),二是受技術(shù)條件的制約,致使用戶服務(wù)和用戶體驗(yàn)仍是現(xiàn)階段數(shù)字出版的短板[4]。此外,用戶的個(gè)性化需求也對(duì)數(shù)字出版的用戶服務(wù)提出了更高要求,即不僅要建立出版主體與用戶之間的交互關(guān)系,還要盡可能地滿足不同類型用戶在不同閱讀場(chǎng)景下的需求。
二、數(shù)字出版中的三類生成式人工智能技術(shù)應(yīng)用
生成式人工智能技術(shù),是指計(jì)算機(jī)運(yùn)用大規(guī)模數(shù)據(jù)資源和特定的算法與模型生產(chǎn)出原創(chuàng)性信息產(chǎn)品的技術(shù),其產(chǎn)品被稱為人工智能生成內(nèi)容,目前主要以文本生成技術(shù)、語音合成技術(shù)和文生視頻技術(shù)為代表。在數(shù)字出版活動(dòng)中,文本生成技術(shù)主要應(yīng)用于編輯出版流程中的業(yè)務(wù)工作場(chǎng)景以及出版機(jī)構(gòu)和用戶之間的服務(wù)場(chǎng)景,語音合成技術(shù)重點(diǎn)應(yīng)用于有聲書傳播場(chǎng)景,文生視頻技術(shù)重點(diǎn)應(yīng)用于短視頻傳播場(chǎng)景,從而進(jìn)一步滿足數(shù)字出版對(duì)多模態(tài)信息、產(chǎn)業(yè)融合發(fā)展、自動(dòng)化工作流程以及更為豐富的用戶交互性需求。
1.文本生成技術(shù)的應(yīng)用
文本生成技術(shù)是計(jì)算機(jī)系統(tǒng)根據(jù)使用者輸入的指令生成相應(yīng)文本內(nèi)容的技術(shù)。隨著可供機(jī)器學(xué)習(xí)的大數(shù)據(jù)資源的豐富以及算法模型的迭代升級(jí),以ChatGPT為代表的生成式預(yù)訓(xùn)練大語言模型(large language models,LLM)應(yīng)用,近年來取得了明顯的效果,國內(nèi)市場(chǎng)也推出了類似文心一言、通義千問等文本生成的應(yīng)用產(chǎn)品,其中部分產(chǎn)品還具有文生圖像的功能。
在傳媒產(chǎn)業(yè)的應(yīng)用中,文本生成技術(shù)可以應(yīng)用于非交互式和交互式兩種場(chǎng)景。前者通常以工具型的軟件界面出現(xiàn),以機(jī)器人寫作、編輯、翻譯等應(yīng)用為代表,應(yīng)用于諸多媒體的內(nèi)容生產(chǎn)與編輯環(huán)節(jié);后者以對(duì)話式的聊天機(jī)器人為代表,人工智能程序通常以擬人化的傳播主體身份出現(xiàn),模擬網(wǎng)絡(luò)人際傳播的用戶交互界面與用戶進(jìn)行連續(xù)性的自然語言對(duì)話,并完成各類開放式的工作任務(wù)。
對(duì)數(shù)字出版而言,文本生成技術(shù)主要應(yīng)用于編輯工作場(chǎng)景與用戶服務(wù)場(chǎng)景。在編輯出版業(yè)務(wù)流程中,基于自然語言處理和文本生成的人工智能技術(shù),可以進(jìn)一步提升數(shù)字出版的自動(dòng)化水平,發(fā)揮科技創(chuàng)新驅(qū)動(dòng)力以優(yōu)化生產(chǎn)要素和生產(chǎn)結(jié)構(gòu),減輕編輯工作的重復(fù)性勞動(dòng),提升編輯工作的效率與準(zhǔn)確性,縮短編輯出版的周期和經(jīng)濟(jì)成本等,這也是出版業(yè)新質(zhì)生產(chǎn)力中最直接與具象的體現(xiàn)。在用戶服務(wù)場(chǎng)景中,可交互的人工智能語言模型可以提升出版主體與用戶之間的交互性,尤其是對(duì)用戶個(gè)性化需求的滿足。如ChatGPT在編輯出版中可以依據(jù)不同的閱讀場(chǎng)景以及不同讀者的個(gè)體化需求生成千人千面的文本信息,滿足網(wǎng)絡(luò)傳播中的長(zhǎng)尾效應(yīng),提升用戶的滿意度和忠誠度,實(shí)現(xiàn)出版機(jī)構(gòu)的傳播效果[5]。
2.語音合成技術(shù)的應(yīng)用
語音合成技術(shù)指計(jì)算機(jī)系統(tǒng)將輸入的文本信息轉(zhuǎn)化為語音信息的技術(shù),也被稱為文語轉(zhuǎn)換技術(shù),被廣泛應(yīng)用于新聞、書籍、影視、短視頻等多種產(chǎn)品中的朗讀配音工作中。語音合成技術(shù)在數(shù)字出版中主要應(yīng)用于有聲書傳播場(chǎng)景,近年來有聲書與有聲出版逐漸成為數(shù)字出版多模態(tài)與融合化發(fā)展中的重要領(lǐng)域,市場(chǎng)規(guī)模持續(xù)擴(kuò)大。相關(guān)調(diào)查數(shù)據(jù)顯示,2023年中國在線音頻市場(chǎng)規(guī)模達(dá)250億元,近5年年均復(fù)合增長(zhǎng)率達(dá)35.12%,2023年有36.3%的成年國民通過聽書的方式進(jìn)行閱讀[6]。
目前我國有聲書市場(chǎng)存在內(nèi)容同質(zhì)化且質(zhì)量不高的問題,大部分有聲書以通俗讀物、網(wǎng)絡(luò)文學(xué)內(nèi)容為主,高質(zhì)量作品稀缺。這主要是因?yàn)橛烧嫒伺湟舻挠新晻谱鞒杀据^高,且需要較長(zhǎng)的時(shí)間周期及專業(yè)的設(shè)備和團(tuán)隊(duì)運(yùn)營,僅僅依靠人工朗讀遠(yuǎn)遠(yuǎn)不能滿足海量書籍的有聲化需要。而語音合成技術(shù)可以在很大程度上縮短書籍內(nèi)容有聲化的制作周期,降低制作成本,真正實(shí)現(xiàn)有聲書市場(chǎng)的長(zhǎng)尾效應(yīng)。目前,許多大型技術(shù)公司提供的AI語音模型已經(jīng)能夠滿足用戶自然流暢聽書的基本需求。市場(chǎng)上的有聲書產(chǎn)品也形成了基于人類語音的說書、講書和基于AI語音的全文朗讀兩種模式,二者之間并不存在人機(jī)競(jìng)爭(zhēng)的替代性關(guān)系。智能語音技術(shù)在有聲出版中的應(yīng)用,極大發(fā)揮了拓展業(yè)務(wù)功能和用戶使用場(chǎng)景的作用。
近年來,我國科技公司不斷對(duì)人工智能語音合成技術(shù)進(jìn)行優(yōu)化,其產(chǎn)品制作水平也不斷提升。如微信讀書的AI朗讀從最開始的男聲和女聲兩種類型,發(fā)展出語音質(zhì)量更高的男女聲音“Pro版”以及“中年版”“催眠版”等不同類型,以適應(yīng)不同的用戶個(gè)體需求。國內(nèi)人工智能企業(yè)提供的AI語音類型則更為豐富,可以為客戶提供數(shù)十種甚至上百種不同類型的選項(xiàng)。未來隨著技術(shù)進(jìn)步與產(chǎn)業(yè)擴(kuò)張,AI有聲書領(lǐng)域?qū)⒕哂懈蟮氖袌?chǎng)前景。
3.文生視頻技術(shù)的應(yīng)用
文生視頻技術(shù)是計(jì)算機(jī)系統(tǒng)通過使用者輸入的描繪視頻場(chǎng)景的文本信息,自動(dòng)化生成相應(yīng)視頻內(nèi)容的技術(shù)。隨著2024年初OpenAI又一項(xiàng)著名產(chǎn)品Sora的出現(xiàn),文生視頻領(lǐng)域正受到互聯(lián)網(wǎng)與傳媒業(yè)的高度關(guān)注。Sora的關(guān)鍵性技術(shù)突破體現(xiàn)在視頻生成時(shí)長(zhǎng)、視頻質(zhì)量和對(duì)現(xiàn)實(shí)世界的模擬能力上,其不僅可以制作超過60秒的視頻且具有多角度、多鏡頭的切換能力,還能夠模擬真實(shí)物理世界中的物體移動(dòng)、習(xí)性以及相互作用[7]。從Sora等人工智能文生視頻的技術(shù)與傳播特征可以看出,短視頻領(lǐng)域?qū)⒊蔀槲纳曨l技術(shù)的重點(diǎn)應(yīng)用場(chǎng)景。相對(duì)于專業(yè)大型影視作品而言,短視頻傳播具有較短的時(shí)長(zhǎng)、更為簡(jiǎn)單的敘事和情節(jié)、適合手機(jī)終端的小屏幕播放和更低的制作成本等特征,這使得AI文生視頻技術(shù)的應(yīng)用難度和門檻大大降低。
隨著數(shù)字出版的多模態(tài)與融合化發(fā)展,短視頻傳播的重要性越來越受到出版業(yè)的重視,但目前我國大部分出版機(jī)構(gòu)對(duì)于視頻內(nèi)容的生產(chǎn)技術(shù)、條件、人力資源、經(jīng)濟(jì)成本及重視程度仍然不足,而且存在制作周期較長(zhǎng)、內(nèi)容種類單一、缺乏穩(wěn)定與常態(tài)化的短視頻制作與發(fā)布模式等短板[8]。在當(dāng)前用戶信息接收與知識(shí)消費(fèi)過程中,短視頻仍然是現(xiàn)階段最為重要的用戶使用場(chǎng)景之一,這意味著出版機(jī)構(gòu)制作與發(fā)布的短視頻產(chǎn)品將面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng)。在生成式人工智能環(huán)境下,新一代的文生視頻技術(shù)憑借自動(dòng)化生產(chǎn)、多樣態(tài)輸出、廣泛的適用范圍、便捷的操作性和較低的制作成本等優(yōu)勢(shì),在數(shù)字出版的短視頻領(lǐng)域具有可觀的應(yīng)用前景。盡管目前這一領(lǐng)域的市場(chǎng)化應(yīng)用程度有限,但從近年來生成式人工智能技術(shù)的創(chuàng)新擴(kuò)散速度來看,文生視頻技術(shù)將進(jìn)一步賦能數(shù)字出版在視頻領(lǐng)域的發(fā)展。
三、生成式人工智能技術(shù)在數(shù)字出版應(yīng)用中的風(fēng)險(xiǎn)
生成式人工智能技術(shù)在賦能數(shù)字出版發(fā)展的同時(shí),也會(huì)滋生相應(yīng)的伴隨性問題與風(fēng)險(xiǎn)。從現(xiàn)階段的技術(shù)發(fā)展水平及行業(yè)應(yīng)用現(xiàn)狀來看,主要集中在知識(shí)的創(chuàng)新性、信息的準(zhǔn)確性和行為的可負(fù)責(zé)性三個(gè)方面。
1.知識(shí)的創(chuàng)新性
在知識(shí)創(chuàng)新性方面,大規(guī)模人工智能知識(shí)生產(chǎn)可能會(huì)制約出版的高質(zhì)量發(fā)展和創(chuàng)新性。出版活動(dòng)本質(zhì)上是圍繞人類社會(huì)知識(shí)生產(chǎn)與傳播的活動(dòng),高質(zhì)量作品對(duì)出版活動(dòng)具有不言而喻的作用,但生成式人工智能技術(shù)在知識(shí)生產(chǎn)層面受限于計(jì)算智能的技術(shù)原理,存在創(chuàng)造性短板與知識(shí)平庸性問題。業(yè)界對(duì)于AIGC是否真正具有生產(chǎn)原創(chuàng)性作品的能力一直存在爭(zhēng)議。雖然機(jī)器學(xué)習(xí)和人類學(xué)習(xí)的過程都是建立在對(duì)既有信息資源的使用之上,但從已有知識(shí)到新知識(shí)的轉(zhuǎn)化過程中,基于計(jì)算機(jī)規(guī)則的人工智能很難還原極其復(fù)雜的人腦思維,尤其是人類創(chuàng)造性思維過程中的靈感、頓悟、抽象化等能力。
從AIGC的既有實(shí)踐也可以看出,雖然人工智能作品和人類作品之間的差異性越來越小,但充其量只是處于人類智能的平均水平。AIGC的優(yōu)勢(shì)更偏向于對(duì)既有信息的識(shí)別與整合,而非高水平的原創(chuàng)知識(shí)生產(chǎn)。如ChatGPT雖然可以做到和用戶進(jìn)行連續(xù)性的對(duì)話并生成自然流暢的內(nèi)容,其掌握的信息量也遠(yuǎn)超于常人,但其生成內(nèi)容的邏輯和框架仍然是比較固定的模式,在觀念與思想上的內(nèi)容生成多為總結(jié)式的分點(diǎn)闡述,極少能夠給出顛覆性的創(chuàng)新觀點(diǎn),并且對(duì)于觀點(diǎn)的闡述力度及其篇幅也非常有限。因此,現(xiàn)階段的人工智能生成內(nèi)容不免會(huì)進(jìn)入一種“平庸”或“庸?!钡臓顟B(tài),當(dāng)生成式人工智能技術(shù)被越來越多地用于知識(shí)產(chǎn)品的創(chuàng)作和生產(chǎn),就會(huì)在一定程度上增加平庸與重復(fù)性知識(shí)產(chǎn)品的體量,從而進(jìn)一步加大出版業(yè)對(duì)內(nèi)容質(zhì)量的篩選、編輯與把關(guān)方面的難度。
2.信息的準(zhǔn)確性
在信息準(zhǔn)確性方面,生成式人工智能的算法模型及其訓(xùn)練數(shù)據(jù)仍然存在片面與偏差,從而導(dǎo)致技術(shù)應(yīng)用中產(chǎn)生一定比率的誤差和事實(shí)性錯(cuò)誤。同時(shí),在編輯流程中應(yīng)用人工智能技術(shù),還會(huì)弱化人工編輯的把關(guān)責(zé)任和把關(guān)能力等。雖然生成式人工智能技術(shù)在編輯出版業(yè)務(wù)流程中的應(yīng)用可以起到優(yōu)化生產(chǎn)力的作用,但不宜夸大其自主性。
人工智能生成內(nèi)容的過程在本質(zhì)上是一種基于概率和規(guī)則的計(jì)算過程,計(jì)算機(jī)只能夠在信息符號(hào)的形式層面進(jìn)行計(jì)算,而無法和人類一樣對(duì)信息的意義作出理解。在未經(jīng)人工干預(yù)和審查的情況下,應(yīng)用于知識(shí)服務(wù)領(lǐng)域的生成式人工智能技術(shù)往往會(huì)產(chǎn)生事實(shí)性錯(cuò)誤、邏輯性錯(cuò)誤、證據(jù)性錯(cuò)誤或價(jià)值觀偏頗等問題[9],而其在形式上卻顯得“合乎邏輯”,這可能會(huì)加劇虛假信息、偽知識(shí)對(duì)于大多數(shù)不了解人工智能技術(shù)原理或傳播特點(diǎn)的普通民眾的誤導(dǎo)。
從目前我國的互聯(lián)網(wǎng)知識(shí)服務(wù)現(xiàn)狀不難發(fā)現(xiàn),無論是應(yīng)用了AIGC的對(duì)話式聊天機(jī)器人,還是將AIGC系統(tǒng)嵌入搜索引擎中的AI智能回答、AI智能搜索等應(yīng)用,都存在不少的信息與知識(shí)質(zhì)量問題。當(dāng)AIGC應(yīng)用于數(shù)字出版活動(dòng)時(shí),如果出版機(jī)構(gòu)出于對(duì)技術(shù)的過于信任而讓渡內(nèi)容的審核、把關(guān)和人工干預(yù)權(quán),就有可能造成低質(zhì)量信息的傳播,甚至產(chǎn)生誤導(dǎo)讀者認(rèn)知、態(tài)度和行為的嚴(yán)重后果。
3.行為的可負(fù)責(zé)性
在主體責(zé)任方面,由于人工智能主體在出版活動(dòng)中的法律與社會(huì)責(zé)任尚未清晰界定,這將對(duì)出版主體、作品創(chuàng)作主體以及融合出版過程中涉及的其他相關(guān)主體的責(zé)任歸屬產(chǎn)生影響,導(dǎo)致隱蔽性剽竊行為、作品署名爭(zhēng)議、主體責(zé)任界定、數(shù)據(jù)安全與信息隱私等法律與倫理問題越來越多[10]。
由于人工智能技術(shù)在傳播與社會(huì)研究中扮演著“擬主體”“傳播者”或“行動(dòng)者”的角色,這使其不同于過往的傳播媒介或生產(chǎn)工具,機(jī)器與人之間的屬性、角色、功能在不斷趨近。但從現(xiàn)實(shí)產(chǎn)業(yè)活動(dòng)與社會(huì)管理的角度來看,人工智能技術(shù)的主體性尚缺乏相應(yīng)的法律規(guī)定、責(zé)任歸屬以及能夠推行的基本保障條件,現(xiàn)階段如果在實(shí)踐活動(dòng)中承認(rèn)人工智能的主體性無疑會(huì)引發(fā)諸多社會(huì)問題。當(dāng)前,生成式人工智能技術(shù)應(yīng)用產(chǎn)生的諸多法律與倫理問題和爭(zhēng)議,均指向AIGC生產(chǎn)活動(dòng)中行為主體的責(zé)任及其可負(fù)責(zé)性,并影響了AIGC在數(shù)字出版中的應(yīng)用。
首先是AIGC介入作品創(chuàng)作后的知識(shí)產(chǎn)權(quán)爭(zhēng)議,主要包括AIGC的可版權(quán)性和知識(shí)產(chǎn)權(quán)歸屬,出版機(jī)構(gòu)在生成式人工智能環(huán)境下將面對(duì)構(gòu)成與來源更為復(fù)雜且不確定的作品。其次是已出版作品的知識(shí)產(chǎn)權(quán)保護(hù)更加困難,主要包括隱性剽竊、學(xué)術(shù)不端、商業(yè)侵權(quán)等問題,已出版的作品很有可能在未經(jīng)版權(quán)所有者許可的情況下被用于生成式人工智能的模型訓(xùn)練以及內(nèi)容生成。最后是編輯出版工作中涉及的主體責(zé)任。AIGC同時(shí)用于作品的創(chuàng)作以及出版機(jī)構(gòu)的編輯校對(duì)工作中,即在一定程度上替代了作者與編輯兩種出版活動(dòng)中的行為主體,其是否能達(dá)成“負(fù)責(zé)任人工智能”的目標(biāo),仍然具有高度不確定性。此外,還可能導(dǎo)致相關(guān)行為主體在承擔(dān)責(zé)任方面的主觀意愿弱化,甚至刻意利用技術(shù)來規(guī)避責(zé)任的問題。
四、生成式人工智能環(huán)境下的數(shù)字出版智能化發(fā)展路徑
1.加強(qiáng)同網(wǎng)絡(luò)平臺(tái)及科技企業(yè)的合作,推進(jìn)數(shù)字出版產(chǎn)業(yè)深度融合
數(shù)字出版智能化發(fā)展的目標(biāo)是進(jìn)一步提升出版業(yè)融合發(fā)展的水平。生成式人工智能技術(shù)在網(wǎng)絡(luò)傳播環(huán)境中的應(yīng)用對(duì)出版業(yè)的融合化提出更高要求,數(shù)字出版不能再延續(xù)傳統(tǒng)的生產(chǎn)鏈條,而要在更大程度上和其他互聯(lián)網(wǎng)傳播主體、機(jī)構(gòu)、企業(yè)、平臺(tái)進(jìn)行深度合作。數(shù)字出版走向智能化階段后,需要通過各種合作形式參與人工智能內(nèi)容生產(chǎn)的全流程,在編輯、制作、加工、把關(guān)等多個(gè)環(huán)節(jié)上實(shí)現(xiàn)出版機(jī)構(gòu)的主體價(jià)值。
目前,掌握生成式人工智能技術(shù)的主體主要是科技公司和互聯(lián)網(wǎng)公司,二者同出版機(jī)構(gòu)之間應(yīng)當(dāng)建立一種相互依賴、合作共贏的關(guān)系。技術(shù)公司在研發(fā)中需要獲得出版機(jī)構(gòu)的內(nèi)容資源,以幫助機(jī)器迭代學(xué)習(xí)生成新的知識(shí);這些新知識(shí)又會(huì)反饋給出版機(jī)構(gòu),從而形成螺旋式發(fā)展關(guān)系[11]。在多元主體合作、引進(jìn)新興技術(shù)、產(chǎn)品二次加工創(chuàng)作、市場(chǎng)營銷和用戶服務(wù)等融合出版過程中,出版機(jī)構(gòu)也要注意可能產(chǎn)生的主體地位消解、權(quán)力讓渡或者參與度不高等問題,以確保出版業(yè)在數(shù)字化與智能化過程中對(duì)知識(shí)與作品的編輯權(quán)、把關(guān)權(quán)、傳播權(quán)以及相應(yīng)的社會(huì)影響力。
2.運(yùn)用生成式人工智能技術(shù),促進(jìn)數(shù)字出版產(chǎn)品形態(tài)的多模態(tài)發(fā)展
生成式人工智能技術(shù)為數(shù)字出版產(chǎn)品的多模態(tài)發(fā)展提供了必要的技術(shù)條件支持,使知識(shí)呈現(xiàn)從單一模態(tài)變?yōu)槎嗄B(tài)交互[12],這既是數(shù)字出版智能化發(fā)展中重要的新質(zhì)生產(chǎn)力,也是提升數(shù)字出版創(chuàng)造力與想象力的契機(jī)。
一方面,出版機(jī)構(gòu)在制作與傳播視聽多模態(tài)內(nèi)容時(shí),可以綜合使用文本生成技術(shù)、語音合成技術(shù)以及文生視頻技術(shù),彌補(bǔ)視聽內(nèi)容生產(chǎn)中的人力資源短板。另一方面,出版機(jī)構(gòu)可以和人工智能技術(shù)公司開展更多合作,為已有的文字出版物制作更多高質(zhì)量的配套產(chǎn)品。從現(xiàn)階段我國知識(shí)傳播的現(xiàn)狀來看,大量的傳統(tǒng)書籍、期刊等信息仍然缺少相應(yīng)的多模態(tài)傳播產(chǎn)品,與用戶對(duì)知識(shí)消費(fèi)中多樣化的需求及數(shù)字出版的發(fā)展現(xiàn)狀不匹配,生成式人工智能技術(shù)的應(yīng)用將進(jìn)一步促進(jìn)數(shù)字出版的多模態(tài)發(fā)展。
此外,數(shù)字出版的多模態(tài)發(fā)展不應(yīng)局限于現(xiàn)有的短視頻與有聲書領(lǐng)域,在更具想象力的未來,現(xiàn)實(shí)空間中的具身性智能設(shè)備以及虛擬空間中的元宇宙環(huán)境,將進(jìn)一步豐富未來傳播形態(tài)及用戶的多元感官體驗(yàn),使數(shù)字出版從規(guī)范化發(fā)展時(shí)期進(jìn)入多模態(tài)與跨模態(tài)內(nèi)容的新階段[13]。
3.優(yōu)化數(shù)字出版中的用戶服務(wù),及其個(gè)性化與即時(shí)性的交互需求
生成式人工智能技術(shù)以聊天機(jī)器人等形式嵌入可交互的人機(jī)傳播實(shí)踐,為數(shù)字出版中的用戶服務(wù)交互性需求及其個(gè)性化體驗(yàn)提供了更多可能,數(shù)字出版的智能化發(fā)展應(yīng)當(dāng)利用生成式人工智能技術(shù)拓展傳播主體和用戶之間的互動(dòng)渠道以及個(gè)性化交互形式。如在閱讀類客戶端中a/fhzEKjlJkfZKNNxBPgmvhbmHpsuOKiDqJg1bXv4b4=使用對(duì)話式的人工智能應(yīng)用,通過按照個(gè)體需求檢索與推薦書籍信息,根據(jù)用戶提問回答有關(guān)書籍內(nèi)容的問題,對(duì)書籍知識(shí)進(jìn)行概括、整理與摘要,匯總用戶對(duì)書籍的意見與建議并向出版社進(jìn)行反饋等方式,為用戶獲取書籍信息及進(jìn)一步的知識(shí)服務(wù)提供多樣化選擇。
近年來,客服機(jī)器人在各類新媒體客戶端中已得到不同程度的應(yīng)用,但既有的對(duì)話式機(jī)器人主要是根據(jù)固定的簡(jiǎn)單程序進(jìn)行運(yùn)作,其交互性體驗(yàn)、傳播效果與智能化程度往往不及人類客服。而基于GPT(Generative Pre-Trained,一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓(xùn)練的文本生成深度學(xué)習(xí)模型)技術(shù)的對(duì)話機(jī)器人,可以更智能地理解用戶的語言及需求,提供生成內(nèi)容更加豐富、應(yīng)用場(chǎng)景更加廣泛、互動(dòng)過程更為人性化的服務(wù)。尤其是在與出版物相關(guān)的知識(shí)服務(wù)領(lǐng)域,人工智能的信息儲(chǔ)存量及其對(duì)信息的調(diào)用、整合和處理能力要超過人類智能的水平,在很多時(shí)候可以發(fā)揮遠(yuǎn)超傳統(tǒng)用戶服務(wù)工作的作用。
4.保障智能化出版業(yè)務(wù)流程中必要的人工干預(yù)并明確責(zé)任歸屬
生成式人工智能技術(shù)在網(wǎng)絡(luò)傳播中的應(yīng)用,提出了可解釋的內(nèi)容生產(chǎn)過程、可信任的媒介產(chǎn)品以及可負(fù)責(zé)的傳播效果的總體規(guī)范性要求[14]。面對(duì)AIGC在數(shù)字出版應(yīng)用中可能帶來的知識(shí)創(chuàng)新性、信息準(zhǔn)確性及行為可負(fù)責(zé)性方面的風(fēng)險(xiǎn),出版機(jī)構(gòu)需要在智能化出版業(yè)務(wù)流程中進(jìn)行必要的人工干預(yù)并明確責(zé)任歸屬。
首先,對(duì)機(jī)器的人工干預(yù)需要切實(shí)體現(xiàn)在數(shù)字出版生產(chǎn)流程中,明確不同編輯出版工作的流程和環(huán)節(jié)特點(diǎn),及其對(duì)AIGC的需求和技術(shù)應(yīng)用的程度,并制定針對(duì)不同環(huán)節(jié)和具體工作場(chǎng)景的人工干預(yù)方式、位置和條件。任何獨(dú)立開展工作的人工智能應(yīng)用程序都應(yīng)明確到具體的責(zé)任人主體,編輯從業(yè)者也需要在身份與技能上作出轉(zhuǎn)型和調(diào)整[15]。
其次,對(duì)于出版活動(dòng)中的個(gè)體精神作品及其創(chuàng)作過程和創(chuàng)作主體而言,出版機(jī)構(gòu)應(yīng)當(dāng)掌握與辨別AIGC的介入程度,既不應(yīng)簡(jiǎn)單地一概否定或拒絕AIGC作品,也不能忽視AIGC作品的風(fēng)險(xiǎn)以及用戶知情權(quán),而應(yīng)做好AIGC內(nèi)容標(biāo)識(shí)工作,明確AIGC作品在出版發(fā)行中的相關(guān)責(zé)任。
最后,隨著數(shù)字出版智能化發(fā)展中出版機(jī)構(gòu)與互聯(lián)網(wǎng)平臺(tái)、技術(shù)公司等其他主體之間合作關(guān)系的日益增多,出版機(jī)構(gòu)需要簽訂相關(guān)的內(nèi)容審核、技術(shù)支持、數(shù)據(jù)安全等合作協(xié)議,明確各自的權(quán)責(zé)邊界,同時(shí)建立監(jiān)督機(jī)制,并定期評(píng)估合作效果。
五、結(jié)語
生成式人工智能正以顛覆性的技術(shù)推動(dòng)變革數(shù)字出版業(yè)態(tài),以文本生成、文生視頻、語音合成為代表的多模態(tài)信息與知識(shí)的自動(dòng)化生產(chǎn),構(gòu)成了現(xiàn)階段數(shù)字出版智能化過程中的主要應(yīng)用形式,將從多維度進(jìn)一步增強(qiáng)數(shù)字出版與融合出版的基本優(yōu)勢(shì)、轉(zhuǎn)型趨勢(shì)以及用戶滿足。在智能傳播的創(chuàng)新擴(kuò)散洪流中,出版業(yè)應(yīng)有效把握和運(yùn)用人工智能技術(shù),在創(chuàng)新多元化的數(shù)字視聽產(chǎn)品,提升組織效率與激發(fā)產(chǎn)能,打造個(gè)性化和交互性的用戶需求等方面進(jìn)一步優(yōu)化生成式人工智能技術(shù)的社會(huì)化和產(chǎn)業(yè)化應(yīng)用,賦予其更多的“想象力”和“可塑性”。與此同時(shí),還需加強(qiáng)對(duì)人工智能生產(chǎn)內(nèi)容的創(chuàng)新性、準(zhǔn)確性、可負(fù)責(zé)性等風(fēng)險(xiǎn)的關(guān)注,進(jìn)一步研究相應(yīng)的治理模式并采取積極舉措,為未來數(shù)字出版智能化發(fā)展中可能出現(xiàn)的各種不確定性提供保障。
|參考文獻(xiàn)|
[1] 匡文波,姜澤瑋. 論智能傳播研究的基本理論問題[J]. 中國人民大學(xué)學(xué)報(bào),2024(3):115-126.
[2] 第二十一次全國國民閱讀調(diào)查成果發(fā)布[EB/OL].(2024-04-23)[2024-06-12]. https://www.nppa.gov.cn/xxfb/ywdt/202404/t20240424_844803.html.
[3] 孫慶生. 讓出版事業(yè)與人工智能共舞[J]. 中國出版,2017(17):16-20.
[4] 李旗. 深度融合背景下融合出版產(chǎn)品質(zhì)量控制現(xiàn)狀、問題與對(duì)策:基于31家圖書出版企業(yè)的調(diào)查研究[J]. 科技與出版,2023(3):88-96.
[5] 徐敬宏,張如坤. ChatGPT在編輯出版行業(yè)的應(yīng)用:機(jī)遇、挑戰(zhàn)與對(duì)策[J]. 中國編輯,2023(5):116-122.
[6] 繁星. 中國有聲書市場(chǎng)前景如何?[N]. 國際出版周報(bào),2024-05-29.
[7] 匡文波,曹萩兒. 文本生成視頻技術(shù)對(duì)新聞業(yè)的影響及對(duì)策研究[J]. 新聞?wù)搲?024(2):7-9.
[8] 張立,王揚(yáng),李夢(mèng)竹,等. 對(duì)近年來數(shù)字出版評(píng)優(yōu)產(chǎn)品的追蹤測(cè)評(píng)及分析(Ⅵ):出版社“短視頻+直播”排行與傳播效果比較分析[J]. 科技與出版,2024(4):48-63.
[9] 揭其濤,王奕諾. 玫瑰荊棘:生成式AI賦能數(shù)字出版內(nèi)容生產(chǎn)的邏輯、機(jī)遇與隱憂[J]. 科技與出版,2024(4):64-70.
[10] 匡文波,姜澤瑋. ChatGPT在編輯出版中的應(yīng)用、風(fēng)險(xiǎn)與規(guī)制[J]. 中國編輯,2024(1):72-77.
[11] 楊阿圓,王勇安. 變革、轉(zhuǎn)向與倫理:基于SCOT理論的AIGC與出版知識(shí)服務(wù)[J]. 出版廣角,2023(23):29-37.
[12] 喻國明,蘇芳,蔣宇樓. 解析生成式AI下的“涌現(xiàn)”現(xiàn)象:“新常人”傳播格局下的知識(shí)生產(chǎn)邏輯[J]. 新聞界,2023(10):4-11.
[13] 錢鋒,董毅敏,張鐵明,等. 元宇宙多模態(tài)、跨模態(tài)內(nèi)容時(shí)代的科技出版理論探討與實(shí)踐研究[J].中國科技期刊研究,2023(7):902-908.
[14] 匡文波,姜澤瑋. 人工智能時(shí)代網(wǎng)絡(luò)空間治理的框架與路徑[J]. 中國編輯,2023(9):40-45.
[15] 羅飛寧,劉壯,謝文亮. AIGC時(shí)代編輯的身份挑戰(zhàn)與角色轉(zhuǎn)型[J]. 出版廣角,2023(15):65-69.