王億本 程思夢
AI主播憑借諸多優(yōu)勢逐漸被運(yùn)用于企業(yè)營銷、新聞傳播、教學(xué)實(shí)踐、直播帶貨、網(wǎng)絡(luò)游戲等多個(gè)領(lǐng)域,引發(fā)廣泛社會關(guān)注。AI主播能夠彌補(bǔ)傳統(tǒng)主播的一些局限性,具有補(bǔ)償性媒介特征。1979年,保羅·萊文森(Paul Levinson)在其博士論文《人類歷程回顧:一種媒介進(jìn)化理論》(Human Replay: A Theory of the Evolution of Media)中首次提出補(bǔ)償性媒介(Remedial Medium)的概念[1]。1984年,保羅·萊文森在《媒介進(jìn)化與理性對媒介決定論的鉗制》(Media Evolution and Rationality as Checks on Media Determinism)一文中再次提出“補(bǔ)救媒介的媒介”(media-remedial media)的觀點(diǎn)[2]。1988年,他在《思想無羈:技術(shù)時(shí)代的認(rèn)識論》中解釋,“任何一種媒介,都是一種補(bǔ)救措施,都是對過去的某一種媒介功能的補(bǔ)救和補(bǔ)償”[3]。補(bǔ)償性媒介理論表明,任何一種新媒介剛推出時(shí)只是相對完美,存在著未暴露的缺陷,強(qiáng)調(diào)媒介始終處于不斷進(jìn)化,滿足人類的新需求,同時(shí)產(chǎn)生新問題,再繼續(xù)探索解決路徑的過程。在AI主播熱的現(xiàn)實(shí)語境下,本文將探索AI主播作為新生媒介的補(bǔ)償功能及其依然存在的缺憾,為后續(xù)媒介技術(shù)演化及其研究提供參考。
從英國PA New Media公司推出阿娜諾娃(Ananova),到以二次元形象出現(xiàn)的絆愛、科大訊飛攜手相芯科技打造了虛擬主持人“康曉輝”,再到東方衛(wèi)視主持天氣播報(bào)的虛擬主持人“小冰”、央視網(wǎng)絡(luò)春晚推出AI虛擬主持人團(tuán)隊(duì)、兩會期間新華社推出AI虛擬主播“新小萌”、人民日報(bào)推出AI虛擬主播“小晴”、央視“五四青年節(jié)”晚會推出AI虛擬主播“小靈”……國內(nèi)外AI主播的發(fā)展勢頭勢不可擋。AI主播從最初的單一模式、低水平應(yīng)用到不同場景的個(gè)性化定制、高仿真下的擬人化,再到現(xiàn)在的定制化生產(chǎn)、高質(zhì)量應(yīng)用、情感交互的發(fā)展過程。近年來,AI主播憑借技術(shù)優(yōu)勢豐富了電視節(jié)目形態(tài),提高了節(jié)目制作效率,也重塑了內(nèi)容生產(chǎn)業(yè)務(wù)鏈。自2021年國家廣播電視總局在《廣播電視和網(wǎng)絡(luò)視聽“十四五”科技發(fā)展規(guī)劃》中提出推動虛擬主播廣泛應(yīng)用,提高制播效率和智能化水平。
技術(shù)革命也引發(fā)學(xué)界的關(guān)注,相關(guān)研究主要從以下兩個(gè)維度展開:
有研究者關(guān)注AI主播技術(shù)的先進(jìn)性。向子旭認(rèn)為AI主播的應(yīng)用豐富了節(jié)目形態(tài)、提高了節(jié)目制作效率、重塑內(nèi)容生產(chǎn)業(yè)務(wù)鏈[4]。AI主播是對傳統(tǒng)主播的一種有效補(bǔ)償,王可欣和史蒙蘇從現(xiàn)象層面解釋媒介補(bǔ)償機(jī)制,探討補(bǔ)償?shù)倪吔鐥l件、補(bǔ)償?shù)陌l(fā)生過程等[5]。
也有研究者聚焦AI主播技術(shù)的反思。喻國明等對于技術(shù)革命下身體的媒介化范式進(jìn)行技術(shù)反思,認(rèn)為未來媒介技術(shù)的發(fā)展邏輯會沿著身體媒介化的邏輯進(jìn)行迭代與創(chuàng)新,而人的主體性將面臨被身體性取代的趨向,甚至有可能成為技術(shù)浸潤的賽博人[6]。張莎莎認(rèn)為AI主播存在技術(shù)倫理、法律責(zé)任、職業(yè)沖擊等現(xiàn)實(shí)問題,應(yīng)當(dāng)建立完善的算法和數(shù)據(jù)監(jiān)管機(jī)制、明確AI主播的報(bào)道邊界以規(guī)避AI主播所帶來的倫理風(fēng)險(xiǎn)[7]。未來AI主播應(yīng)在明確目標(biāo),完成清晰定位;推動應(yīng)用,形成粉絲社群;理清思路,重視文化創(chuàng)新等方面發(fā)力,以更好地演進(jìn)發(fā)展[8]。也有學(xué)者從補(bǔ)償性媒介角度探討AI主播對傳統(tǒng)的主持行業(yè)帶來的技術(shù)創(chuàng)新補(bǔ)償、情感賦能補(bǔ)償、個(gè)性類型補(bǔ)償?shù)确矫?,但是缺少對于AI主播技術(shù)演進(jìn)優(yōu)勢與缺陷的探討。
目前,AI主播的相關(guān)研究主要以樂觀的態(tài)度探索其技術(shù)補(bǔ)償優(yōu)勢,卻對目前技術(shù)補(bǔ)償?shù)木窒扌运伎疾粔?。因此,本文重點(diǎn)從補(bǔ)償性媒介理論視角探討AI主播對傳統(tǒng)主播的補(bǔ)償優(yōu)勢以及補(bǔ)償缺憾。
萊文森指出,“面對面的傳播是一切傳播的起源”[9]。媒介進(jìn)化逐漸重現(xiàn)面對面?zhèn)鞑ヌ卣鳎瑵M足人的渴求和幻想并彌補(bǔ)失去的東西。早期媒介技術(shù)的發(fā)展只是對傳播進(jìn)行功能性的補(bǔ)償,但是新媒體的迭代發(fā)展不僅是在功能上對人感覺器官的簡單延伸,更是對受眾心理需求的補(bǔ)償。
以“事實(shí)—觀點(diǎn)”分離、免于偏見、尊重新聞事實(shí)為核心內(nèi)涵的客觀性被眾多媒體和新聞工作者奉為圭臬。但是大多數(shù)新聞工作者無法擺脫媒體立場以及新聞工作者個(gè)人的價(jià)值取向等諸多因素,難以保持客觀的報(bào)道立場。比如,2008年5月14日,中央電視臺新聞?lì)l道的主持人趙普在直播汶川大地震新聞時(shí),眼含淚水,幾度哽咽,引發(fā)網(wǎng)友對其專業(yè)性的質(zhì)疑。同樣,9·11事件爆發(fā)24小時(shí)內(nèi),美國三大廣播公司主播播報(bào)相關(guān)新聞時(shí)也有個(gè)人情感植入[10]。比較而言,AI主播在報(bào)道新聞事件時(shí)“根據(jù)事實(shí)來描寫事實(shí)”,而不是“根據(jù)希望來描寫事實(shí)”[11],能夠向公眾提供客觀的新聞事實(shí),以一種超然、公正、獨(dú)立的態(tài)度進(jìn)行新聞報(bào)道,避免個(gè)人情感植入,避免諸如種族歧視、性別歧視等問題,滿足受眾對新聞?wù)鎸?shí)性的需要。
相比傳統(tǒng)主播受到人體生理限制,AI主播在時(shí)間維度上的全時(shí)段工作和空間維度上的場景延伸,讓受眾可以更加多樣靈活地選擇和接收信息。
一方面,相較于傳統(tǒng)主播容易疲憊,有上下班時(shí)段限制,不能完全滿足受眾全時(shí)段信息服務(wù)需求,AI主播可以實(shí)現(xiàn)24小時(shí)不間斷直播,全天候內(nèi)容輸出,用戶接受信息不受時(shí)間和地點(diǎn)的限制。
另一方面,AI主播可以結(jié)合3D虛擬場景、AR、VR、MR等技術(shù),實(shí)現(xiàn)新聞報(bào)道的場景延伸。先進(jìn)的虛擬現(xiàn)實(shí)技術(shù)不僅可以讓AI主播根據(jù)不同的主題和場合調(diào)整播報(bào)風(fēng)格和語氣,還可以“走出”演播廳,根據(jù)播報(bào)內(nèi)容搭配不同場景,讓受眾從視覺上感受新聞現(xiàn)場。
此外,AI主播能夠進(jìn)行多語種播報(bào),依靠機(jī)器強(qiáng)大的翻譯能力進(jìn)行多語種語言翻譯,拓展國際傳播的時(shí)空范圍。
面對面?zhèn)鞑ナ窃醯母泄倨胶鉅顟B(tài)。無論是傳統(tǒng)媒體時(shí)代還是新媒體時(shí)代,技術(shù)發(fā)展的最終目的在于實(shí)現(xiàn)感官平衡。從報(bào)紙到廣播再到電視,媒介技術(shù)演進(jìn)彌補(bǔ)了人類聽覺、視覺的缺失。在互聯(lián)網(wǎng)時(shí)代,人類通過媒介化補(bǔ)償豐富感官體驗(yàn):表情包彌補(bǔ)了人類表情和身體語言受制于傳播中介的缺點(diǎn),網(wǎng)絡(luò)直播技術(shù)為觀眾身體在場的時(shí)空限制提供了補(bǔ)償,讓主播和觀眾雙方的身體均可以視作是即時(shí)在場。這種對身體的媒介化補(bǔ)償本質(zhì)體現(xiàn)了人類對面對面?zhèn)鞑サ淖非螅磳τ谏眢w在場的追求。
而在新媒體時(shí)代,層出不窮的新技術(shù)雖然延伸了用戶對外部世界的感知,讓用戶感知信息的邊界不斷擴(kuò)大,但用戶信息獲取的中介化程度不斷加深,呈現(xiàn)出“離身性”的特點(diǎn),個(gè)人和真實(shí)世界的距離越來越遠(yuǎn)。因此,人們試圖利用技術(shù)手段彌補(bǔ)真實(shí)身體離場的遺憾,通過營造虛擬現(xiàn)實(shí)實(shí)現(xiàn)人的“在場”。AI主播能夠代替受眾進(jìn)入情景,以虛擬身體的方式實(shí)現(xiàn)在場,通過大數(shù)據(jù)和智能技術(shù)打通多重空間,拉近受眾與外部世界的距離,將受眾的視聽感官延伸到自己無法前往的信息空間。從某種程度上來說,電視對現(xiàn)場的“再現(xiàn)”功能讓“物質(zhì)與傳播的分離”成為可能,AI主播的發(fā)展不僅拓寬了身體影像化的維度,還再次提升人類傳播活動的抽象能力,實(shí)現(xiàn)了“數(shù)字在場”[12]。
除此之外,AI主播通常會與其他新媒體技術(shù)結(jié)合起來,讓觀眾在觀看時(shí)全身心參與,形成更強(qiáng)的互動感。依靠AI主播的動態(tài)真人三維重建技術(shù),并利用5G、3R、超高清視頻技術(shù)作為輔助,提升觀眾的聽覺和視覺感受,營造出更具有真實(shí)感的媒介環(huán)境。如新華社數(shù)字記者小諍作為全球首位太空記者,在空間站進(jìn)行“現(xiàn)場報(bào)道”,擺脫了現(xiàn)實(shí)空間的束縛,利用媒介算法給受眾帶來超越現(xiàn)實(shí)的空間力,以虛擬的手段進(jìn)入真實(shí)場景進(jìn)行內(nèi)容生產(chǎn),給受眾帶來超越真實(shí)的觀感體驗(yàn)。
媒介發(fā)展的動力來自社會需求,媒介補(bǔ)償研究也不應(yīng)止步于對現(xiàn)象的描述和解釋。AI主播不僅在外形、語種、音色、背景等方面都可以根據(jù)受眾不同喜好和需求進(jìn)行變化,還可通過智能算法、大數(shù)據(jù)分析等人工智能技術(shù),為用戶精準(zhǔn)畫像,并進(jìn)行個(gè)性化分析,與用戶建立專屬的情感陪伴,使之成為用戶信任的、依賴的、有影響力的智能主體[13]。
老年化社會應(yīng)重視老年人的需求,他們離開工作崗位后,可能感到孤獨(dú)、被拋棄,對心理健康造成影響。國外有機(jī)構(gòu)制作為獨(dú)居老年人提供非面對面服務(wù)的虛擬人,可以和獨(dú)居老人進(jìn)行互動。也有醫(yī)療機(jī)構(gòu)開發(fā)具有醫(yī)療保健和陪伴功能的虛擬人陪伴老人,可以實(shí)時(shí)監(jiān)測和記錄老年人的身體狀況,還可以陪伴老人,減少孤獨(dú)感。殘障人士和兒童也需要陪伴,AI主播對于弱勢群體的陪伴和情感補(bǔ)償可以幫助他們更好地適應(yīng)社會。
喻國明、滕文強(qiáng)等指出媒介補(bǔ)償邏輯的實(shí)質(zhì)是“揚(yáng)棄”,從而得出未來媒介要堅(jiān)持“以人為本”的底層邏輯進(jìn)行媒介互動[14]。新媒介勢必在某些方面要領(lǐng)先于舊媒介,但它在其他方面可能是落后于舊媒介的。同理,AI主播在信息傳播與情感陪伴方面具有優(yōu)勢,但也無法突破技術(shù)既有的缺陷。
雖然AI主播在形象和音色上都有了極大的改進(jìn),但仍然無法與真人主播相比。在人類說話的過程中,語流音變的存在讓相鄰的語音音節(jié)通常會互相影響,比如元音的位置和發(fā)音方式等,這種變化會增加語言的表現(xiàn)力和節(jié)奏感。而AI主播在播報(bào)過程中大部分都是多音節(jié)詞語的無變化持續(xù)輸出,語流音變不足,導(dǎo)致言語表達(dá)顯得僵化。
其次,真人主播播報(bào)信息時(shí),會根據(jù)相關(guān)語句的語法和含義選擇語音停頓的位置。這種停頓往往是說話者為了強(qiáng)調(diào)某個(gè)語意,或表達(dá)某種感情,在詞語或句子之間所作的停頓,能引起聽者的聯(lián)想,進(jìn)而使雙方產(chǎn)生共鳴。如果在播報(bào)時(shí)停頓出現(xiàn)錯(cuò)誤,就會引起語義的改變,造成語義混淆。
同時(shí),重音也是人與人溝通過程中準(zhǔn)確表達(dá)不可缺少的方式。重音的使用方式有兩種:一是語法重音,這是按照句法結(jié)構(gòu)特點(diǎn)說出的重音,一般沒有特殊用意;二是強(qiáng)調(diào)重音,是為了突出某個(gè)語意,或表達(dá)某種強(qiáng)烈情感,將句中某些詞語音量加大。比如新聞聯(lián)播在報(bào)道“巫溪縣茶山村是重慶市最偏遠(yuǎn)的地區(qū),也是脫貧攻堅(jiān)中最難啃的硬骨頭”時(shí),主持人加重了兩個(gè)“最”字的讀音,突出反映了脫貧攻堅(jiān)的偉大成就,實(shí)現(xiàn)稿件“目的”展現(xiàn)的最大化。AI主播不能理解脫貧攻堅(jiān)的艱難,在讀稿時(shí)會顯得過于平淡,無法喚起受眾的共情。
在AI主播進(jìn)行新聞播報(bào)中,無論是語音變化、語音停頓還是重音的選擇都遠(yuǎn)不如真人主播言語表達(dá)來得自然生動。究其根本還是AI主播未能把握內(nèi)容的深層含義,不能感受現(xiàn)場語境,僅停留在傳遞表層意義階段。
心理學(xué)教授艾伯特·麥拉賓(Albert Mehrabian)研究發(fā)現(xiàn):在人們交流過程中,55%的信息是通過視覺傳達(dá)的,如手勢、表情、外表、裝扮、肢體語言、儀態(tài)等等;38%的信息是通過聽覺傳達(dá),如說話的語調(diào)、聲音的抑揚(yáng)頓挫等等;剩下只有7%來自語言表達(dá)。通過麥拉賓法則,非言語交際的重要性可見一斑。與傳統(tǒng)主播比較,AI主播具有零失誤、不間斷、海量信息儲備以及多語種播報(bào)等優(yōu)勢,但在神態(tài)、肢體語言等非言語交流方面存在不足。從只有頭部動畫、表情也略顯僵硬的2D虛擬人物阿娜諾娃(Ananova)到3D形象、語音、動作、表情上都有很大進(jìn)步的絆愛(Kizunaai),從利用虛擬形象生成技術(shù)制作的高度擬人化的“康曉輝”,再到通過情緒仿真引擎,為其賦予了如同真人情感表情,其形象氣質(zhì)、語音語調(diào)、口唇表情、肢體動作跟真人的相似度達(dá)到97%的“時(shí)間小妮”[15],AI主播無論是面部表情還是肢體動作雖然已經(jīng)盡可能的擬人化,但是還做不到完全等同于真人主持人,只做到了“形似”并沒有達(dá)到“神似”。AI主播技術(shù)試圖還原人際交流效果,讓其更具有真人主持人的“神韻”,非言語交際的不足仍需繼續(xù)技術(shù)補(bǔ)償。目前,AI主播表情缺少變化,語氣語調(diào)靈活不高,手勢不夠協(xié)調(diào),體態(tài)語比較呆板,總體非言語交流能力明顯不及言語交際能力。
AI主播人格包括兩個(gè)層面:一個(gè)是形象和聲音的類人層面,另一個(gè)是個(gè)性化層面,即不僅擁有解決問題的能力和智慧,而且可以形成自己獨(dú)特的個(gè)性[16]。目前,AI主播仍然缺乏真正的個(gè)性化特征。比如:情感豐富、有些冒失、天然呆、比較內(nèi)向的洛天依,多才多藝、傲嬌、容易嫉妒、可愛、喜歡自夸的小冰,性格溫和、喜歡音樂的吃貨赫茲,活潑可愛、自信心膨脹、喜歡吐槽的絆愛……隨著人工智能技術(shù)進(jìn)步,AI主播越來越被賦予了具有人類自然屬性和生命屬性的人格,也開始具備情緒表達(dá)、邏輯推理等更高層次的人類特征[17]。但是這些看起來具有個(gè)性化、風(fēng)格不一的人格設(shè)計(jì),只是情感計(jì)算框架和智能編排的“系統(tǒng)”運(yùn)行下的一串串代碼,其技術(shù)設(shè)置的載體即AI主播帶給受眾的是互動的假象[18],由技術(shù)帶來的偽個(gè)性化,缺乏真人主播具備的人格魅力。
當(dāng)前,AI主播對信息處理能力有限,對信息進(jìn)行編碼、儲存和檢索能力有限,其智能特征仍有待完善,僅能夠傳遞表層意義,缺乏情感基調(diào)變化,難以表達(dá)言語深意。AI主播的創(chuàng)作過程是機(jī)械化、程序式的,其與觀眾的實(shí)時(shí)互動受到限制,難以實(shí)現(xiàn)真正的情感互動,缺乏人類的情感深度和復(fù)雜性。
保羅·萊文森認(rèn)為媒介技術(shù)的應(yīng)用一般會經(jīng)歷“玩具—鏡子—藝術(shù)”三個(gè)階段。目前AI主播擁有諸多優(yōu)勢,但仍然以簡單的“玩具”功能為主,能否進(jìn)化為復(fù)刻現(xiàn)實(shí)的“鏡子”,甚至更具有創(chuàng)意性的“藝術(shù)”手段,還有待技術(shù)的繼續(xù)進(jìn)步。那么AI主播補(bǔ)償?shù)膮⒄瘴锸鞘裁??補(bǔ)償?shù)哪繕?biāo)是什么?
第一,AI主播補(bǔ)償?shù)膮⒄瘴锸鞘裁??前文已述,“面對面的傳播是一切傳播的起源”?9],當(dāng)前媒介朝著重現(xiàn)面對面?zhèn)鞑ヌ卣鞯姆较蜓葸M(jìn)。鑒于此,AI主播補(bǔ)償?shù)膮⒄瘴锸钦嫒酥鞑サ南嚓P(guān)特征,包括鮮活的非言語傳播、真實(shí)的傳播個(gè)性等。
第二,AI主播補(bǔ)償?shù)哪繕?biāo)是什么?AI主播具有較明顯技術(shù)優(yōu)勢,但仍有待優(yōu)化,“一種媒介與現(xiàn)實(shí)世界是否契合,關(guān)鍵在于重現(xiàn)現(xiàn)實(shí)世界環(huán)境的精準(zhǔn)度如何,而非范圍大小”[20]。當(dāng)然,誠如萊文森所強(qiáng)調(diào)的,人性化趨勢不僅是再現(xiàn)前技術(shù)環(huán)境,還要超越原來的生物局限[21]。AI主播補(bǔ)償?shù)哪繕?biāo)是,“繼續(xù)不斷地復(fù)制人類傳播的自然模式,繼續(xù)跨越時(shí)空的演化”[22]。AI主播可以復(fù)制真人主播的諸多優(yōu)勢,并超越真人主播的生理局限性。比如,更廣泛的時(shí)空延展、更客觀的報(bào)道立場、更豐富的感官體驗(yàn)等,這些也是AI主播技術(shù)補(bǔ)償?shù)哪繕?biāo)。
第三,作為“玩具”的AI主播,其技術(shù)補(bǔ)償有待優(yōu)化。盡管AI主播可以突破時(shí)空限制,全天候服務(wù)受眾。但難以擺脫自身的生硬和機(jī)械感,未能傳達(dá)新聞應(yīng)有的溫度,也難以與觀眾形成情感共鳴。未來AI主播應(yīng)朝著人性化趨勢發(fā)展,補(bǔ)償自主學(xué)習(xí)、場景理解和情感識別等能力。
第四,作為“鏡子”與“藝術(shù)”的AI主播,其應(yīng)用領(lǐng)域有待拓展。如金融服務(wù)、醫(yī)療陪伴、政務(wù)服務(wù)等,“24×7”不間斷的精準(zhǔn)服務(wù)將成為現(xiàn)實(shí)。
綜上,基于補(bǔ)償性媒介理論,我們既要厘清AI主播的技術(shù)優(yōu)勢,又要審慎思考AI主播技術(shù)的局限性。我們要合理利用AI主播技術(shù)優(yōu)勢服務(wù)人類社會,并積極探索AI主播技術(shù)短板的應(yīng)對路徑。