官奕聰 呂欣
摘要:近年來(lái),伴隨人工智能技術(shù)的快速發(fā)展與應(yīng)用,AI虛擬主播已然成為信息傳播領(lǐng)域引人注目的一道風(fēng)景。然而與真人主播相比,虛擬主播在表情達(dá)意、親和力等方面依然存在著諸多難以跨越的障礙,亟待在認(rèn)知和實(shí)踐中予以重視和改進(jìn)。本文旨在通過(guò)分析AI虛擬主播現(xiàn)狀,尋找其具象化情感表達(dá)的可行路徑,并提出相應(yīng)解決策略及方案。
關(guān)鍵詞:AI虛擬主播 具象化 情感表達(dá)
2018年11月,新華社聯(lián)合搜狗在第五屆世界互聯(lián)網(wǎng)大會(huì)上發(fā)布了全球首個(gè)“AI合成主播”。這位身著黑色西裝、打領(lǐng)帶、以央視新聞主播邱浩為原型的虛擬合成主播的亮相引起全球矚目。英國(guó)《獨(dú)立報(bào)》稱其是“一位栩栩如生的數(shù)字化播報(bào)員”。
人工智能技術(shù)使得機(jī)器人寫作、數(shù)據(jù)新聞、虛擬主播等深刻影響著傳統(tǒng)記者、播音員的角色定位,算法推送比傳統(tǒng)編輯更加精準(zhǔn)高效,AI剪輯師也至少在效率上實(shí)現(xiàn)了對(duì)傳統(tǒng)剪輯的超越,而上述虛擬主持人在國(guó)家級(jí)文化活動(dòng)中的規(guī)模亮相,更是讓傳統(tǒng)意義上的主持人受到挑戰(zhàn),深感“不論是身體、技能還是體力、心理都已處于下風(fēng)”。的確,虛擬主播在內(nèi)容制作上的高效、節(jié)目播報(bào)的準(zhǔn)確度以及帶來(lái)視覺(jué)新鮮感等方面的優(yōu)勢(shì)有目共睹。但受眾與用戶以及不同領(lǐng)域的研究者們?cè)诙恳恍碌耐瑫r(shí)也都感受到其與真人主播在共情力、親和力方面的差距。除了哲學(xué)意義和媒介專業(yè)主義層面的考量之外,學(xué)界和業(yè)界的關(guān)注點(diǎn)都不約而同地觸及虛擬主播本身的擬人化、交互性等問(wèn)題。與真人相比,虛擬主播除了在技能等物理層面“優(yōu)于”真人主播外,其情感表達(dá)的缺失將是影響該技術(shù)在信息傳播領(lǐng)域有效應(yīng)用的首要因素。
一、情感交流缺失——虛擬主播的局限與困境
美國(guó)心理學(xué)家梅拉比安(Mehrabian)曾經(jīng)提出著名的“7%-38%-55%定律”,即“Mehrabia溝通模型”。他認(rèn)為人們對(duì)表達(dá)內(nèi)容的有效理解包含三個(gè)要素:肢體語(yǔ)言55%,聲調(diào)38%和說(shuō)話內(nèi)容7%。而肢體語(yǔ)言中包括:儀態(tài)、姿勢(shì)、表情。其中表情是最直觀被感知的,尤其是面部表情,這也符合我們?nèi)粘I钪械慕?jīng)驗(yàn)與常識(shí)。中國(guó)自古就有“察言觀色”“喜怒形于色”“手舞足蹈”等成語(yǔ),表情及形體語(yǔ)言所傳達(dá)的信息之于交流的重要性由此可見(jiàn)一斑。反觀當(dāng)下業(yè)界實(shí)踐中的虛擬主播產(chǎn)品現(xiàn)狀,不難看出情感化的交流尚處在初級(jí)階段??傮w而言,由于情感化交流的缺失,虛擬主播在業(yè)界的實(shí)踐及應(yīng)用范圍還存在很大的局限,具體表現(xiàn)在如下方面。
1.傳播領(lǐng)域及內(nèi)容方面的局限。新聞播報(bào)是當(dāng)下AI虛擬主播應(yīng)用的主要行業(yè)之一。對(duì)真人主播而言,該領(lǐng)域的新聞信息播報(bào)可謂包羅萬(wàn)象。但對(duì)虛擬主播而言,由于具象化情感表達(dá)的不足,使得虛擬主播擅長(zhǎng)播報(bào)的領(lǐng)域范圍有所限制,一般是以較為中性、客觀的新聞報(bào)道類型為主,如數(shù)據(jù)型、信息發(fā)布型新聞的播報(bào)。綜藝節(jié)目、直播平臺(tái)的主持中,虛擬主播也存在類似的情形。比如,難以和觀眾、用戶形成深層的持續(xù)性互動(dòng),因而適合其主持的節(jié)目類型或直播平臺(tái)風(fēng)格也多局限在更多程式化、重復(fù)性的商業(yè)、銷售等領(lǐng)域。
2.傳播效果的局限。與其他類型的主播或主持人相比,新聞主播的語(yǔ)言表達(dá)相對(duì)更加客觀、理性。但這并不意味著新聞主播工作時(shí)不需要情感的把握。在播報(bào)一條充滿正能量的見(jiàn)義勇為的新聞時(shí),真人主播會(huì)慷慨激昂、面帶笑容;在播報(bào)一條揭露社會(huì)問(wèn)題的負(fù)面消息時(shí),真人主播會(huì)怒目圓睜、眉頭緊蹙……。受眾在觀看上述新聞播報(bào)的同時(shí)也會(huì)感受到真人主播對(duì)事件的態(tài)度以及價(jià)值取向,進(jìn)而潛移默化地受到影響。倘若上述兩條視頻中使用AI虛擬新聞主播,鑒于后者在情感表達(dá)上的局限,將可能帶給受眾某種程度上的違和感。這種違和感不僅會(huì)帶來(lái)恐怖谷效應(yīng),更會(huì)直接影響產(chǎn)品的體驗(yàn)感,使之無(wú)法與真人主播富有表現(xiàn)力的、分寸拿捏得當(dāng)?shù)牟?bào)相提并論。
3.與受眾/用戶產(chǎn)生“共情”力上的局限?!肮睬椤弊鳛樾睦韺W(xué)上的重要概念,是指?jìng)€(gè)體“直覺(jué)和理解他人的情緒并作出適當(dāng)反應(yīng)的能力”。人工智能技術(shù)的發(fā)展促進(jìn)了真人和機(jī)器人之間的互動(dòng),在信息傳媒領(lǐng)域,則意味著AI虛擬主播有可能具備“共情”能力。無(wú)論是新聞節(jié)目的受眾,還是直播平臺(tái)的用戶,在接收信息的同時(shí),都期待與主播有更多的互動(dòng)。這一需求給虛擬主播提出了挑戰(zhàn),與真人主播相比,虛擬主播無(wú)法體會(huì)和理解他人的情緒、情感反應(yīng),難以與受眾或用戶之間形成有效的互動(dòng)交流,在產(chǎn)生“共情”力上受到局限。在傳播信息的同時(shí),兼顧扮演“共情傳遞者”的角色,將是虛擬主播面臨的困境之一。
二、具象化情感表達(dá):讓虛擬主播更富親和力
虛擬主播要想突破瓶頸、實(shí)現(xiàn)更好的傳播效果,僅僅在外形設(shè)計(jì)上“栩栩如生”是遠(yuǎn)遠(yuǎn)不夠的。從應(yīng)用領(lǐng)域的拓展、播報(bào)內(nèi)容的多元,到“共情力”的增強(qiáng),其關(guān)鍵點(diǎn)和基本出路都在于如何實(shí)現(xiàn)與受眾和用戶的交流與互動(dòng)。不論是新聞播報(bào),還是肢體語(yǔ)言更為豐富的綜藝節(jié)目乃至直播平臺(tái)的虛擬主持,情感表達(dá)都是其實(shí)現(xiàn)有效傳播的核心競(jìng)爭(zhēng)力。就技術(shù)維度而言,具象化情感表達(dá)為實(shí)現(xiàn)上述目標(biāo)提供了可行的思路。
虛擬主播的具象化情感表達(dá),一般是指AI虛擬主播通過(guò)更為豐富的面部表情、肢體語(yǔ)言及服裝形象上的設(shè)計(jì),使受眾對(duì)其產(chǎn)生親切感、認(rèn)同度乃至深度的情感依賴。以此為標(biāo)準(zhǔn)來(lái)衡量國(guó)內(nèi)相關(guān)行業(yè)發(fā)展現(xiàn)狀不難發(fā)現(xiàn),凡是在業(yè)界受歡迎的虛擬主播,都是因其形象塑造以及與用戶的情感交流、互動(dòng)方面的設(shè)計(jì)有所創(chuàng)新。
以B站為例,這個(gè)堪稱國(guó)內(nèi)虛擬主播產(chǎn)業(yè)布局最久的平臺(tái),2019年一季度內(nèi)共有超6000位虛擬主播在B站開(kāi)播,觀看人數(shù)近600萬(wàn)。不僅如此,B站還投資了洛天依、彩虹社等高人氣的二次元虛擬偶像。B站在這方面的成功得益于AI技術(shù)的加持,得益于虛擬偶像角色在情感化方面的獨(dú)到表達(dá)?!鞍咨洗笛本褪且粋€(gè)較為典型的成功案例,其形象可愛(ài)軟萌,于2018年6月1日進(jìn)行了首次直播,且當(dāng)日粉絲數(shù)就達(dá)到20萬(wàn),至2020年7月25日,bilibili關(guān)注人數(shù)已突破110萬(wàn)。該虛擬偶像初次直播不僅沒(méi)有怯場(chǎng),而且“反自然地”與觀眾進(jìn)行了互動(dòng)。其面部表現(xiàn)力,尤其是具象化情感表達(dá)方面的刻畫十分到位,被粉絲團(tuán)親切地形容為“喵喵狐”。
正如虎牙CTO所言:“在平臺(tái)上有很多已經(jīng)有的數(shù)字人IP,你可以把你的形象拿過(guò)來(lái),通過(guò)驅(qū)動(dòng)技術(shù)把這些形象驅(qū)動(dòng)起來(lái),然后再渲染給觀眾?!边@里的驅(qū)動(dòng)技術(shù)中最重要的就是具象化情感表達(dá)。倘若具象化情感表達(dá)缺失,就很難讓用戶產(chǎn)生親近感和認(rèn)同感,會(huì)讓人感覺(jué)在和一個(gè)“面癱”進(jìn)行交流。可見(jiàn),具象化情感表達(dá)在AI虛擬主播的設(shè)計(jì)中舉足輕重。
如果說(shuō)情感化設(shè)計(jì)是一般產(chǎn)品和偉大產(chǎn)品之間的分野,那么這句話也同樣適用于虛擬主播的設(shè)計(jì)。AI合成主播的問(wèn)世雖然引發(fā)一系列沖擊,但與“現(xiàn)象級(jí)”產(chǎn)品的出現(xiàn)還有很大距離,虛擬主播“跨界”到更廣泛領(lǐng)域的應(yīng)用也面臨瓶頸。如何借助技術(shù)手段彌補(bǔ)具象化情感表達(dá)的缺失,已然成為虛擬主播發(fā)展中的關(guān)鍵一環(huán)。
三、虛擬主播具象化情感表達(dá)的可能路徑與方法
虛擬仿真角色的情感研究號(hào)稱人工智能的“禁區(qū)”,其中既包含了哲學(xué)、倫理學(xué)層面的寓意,同時(shí)也因?yàn)榍楦斜旧磔^難被量化、被轉(zhuǎn)換為抽象的數(shù)字。技術(shù)層面,虛擬主播的具象化情感表達(dá)或可從如下路徑加以探索。
1.虛擬主播情感表達(dá)的語(yǔ)義分析路徑及改善方法。文字語(yǔ)言作為人類將情感抽象化的工具之一,是連接機(jī)器與人腦的重要工具,通過(guò)對(duì)文字語(yǔ)言進(jìn)行詞性、詞義分析及詞頻分析、語(yǔ)義分析等,再配合人工標(biāo)注的情感詞典,可以得出富有情感色彩的文字所對(duì)應(yīng)的情感。虛擬主播情感表達(dá)的設(shè)計(jì)主要根據(jù)語(yǔ)義分析方法得以建立。
目前對(duì)文字情感的語(yǔ)義分析技術(shù)主要有兩類,即極性分析和情緒分類。前者將文本分為積極情緒、消極情緒以及無(wú)情緒三類,其識(shí)別正確率可達(dá)85%左右。后者則將文本進(jìn)行初級(jí)情緒分類,如開(kāi)心、憤怒、悲傷等情緒。根據(jù)模型不同,初級(jí)情緒分類也會(huì)有很多不同的方法。初級(jí)情緒分類源于心理學(xué)家埃克曼(Ekman)的理論,??寺严病⑴?、哀、懼、驚奇、厭惡確立為基本情感。
不過(guò)初級(jí)情緒分類的識(shí)別正確率較低,筆者測(cè)試了GitHub上的“基于LSTM的中文情緒識(shí)別”項(xiàng)目后,得出不足40%的識(shí)別正確率。此項(xiàng)目將擁有4萬(wàn)多個(gè)句子的樣本,分為其他(Null)、喜好(Like)、悲傷(Sad)、厭惡(Disgust)、憤怒(Anger)、高興(Happiness)六類,其數(shù)據(jù)來(lái)源分別為NLPCC Emotion Classification Challenge(訓(xùn)練數(shù)據(jù)中17113條,測(cè)試數(shù)據(jù)中2242條)和微博數(shù)據(jù)篩選后人工標(biāo)注(訓(xùn)練數(shù)據(jù)中23000條,測(cè)試數(shù)據(jù)中2500條),其數(shù)據(jù)提供方是清華大學(xué)計(jì)算機(jī)系黃民烈副教授。
極性分析與初級(jí)情感分類呈遞進(jìn)關(guān)系,即先通過(guò)對(duì)文本的極性分析,確保情感來(lái)源向量正確的基礎(chǔ)上,展開(kāi)情感情緒的二次劃分(積極情感對(duì)應(yīng)“開(kāi)心”等正面情緒,消極情感對(duì)應(yīng)“憤怒”等負(fù)面情緒),再根據(jù)結(jié)果綜合得出其情感表達(dá)的整體量表。這樣可以大大改善初級(jí)情感分類識(shí)別率較低的缺陷,使得整體識(shí)別率有所提升。
2.虛擬主播情感表達(dá)的具象化路徑及改善方法。如果說(shuō)情感向量及程度的正確判斷從根本上避免了虛擬主播播報(bào)內(nèi)容引起受眾質(zhì)疑乃至反感的可能,那么與之同等重要的就是情感的表達(dá),也就是通過(guò)虛擬主播的模型設(shè)計(jì)及數(shù)據(jù)驅(qū)動(dòng)等技術(shù)手段,將文字描述中的抽象情感、情緒盡可能具象化地加以展現(xiàn)的能力。
機(jī)器并不能直接理解抽象的情緒,需要通過(guò)算法將抽象情緒與具象化的AI虛擬主播的情緒動(dòng)畫進(jìn)行一一映射。通過(guò)對(duì)上下文的語(yǔ)義分析及同情緒不同文本的語(yǔ)義分析,可以對(duì)情感表達(dá)的向度和程度進(jìn)行相應(yīng)的量化,以此作為權(quán)重,使得AI虛擬主播的表情達(dá)意具有真切感,也符合人類的行為習(xí)慣。
現(xiàn)有的虛擬主播情緒動(dòng)畫制作主要采用兩種方法,一種是動(dòng)畫師手動(dòng)設(shè)置關(guān)鍵幀,另一種則借助面部捕捉設(shè)備拾取真人的面部情緒變化數(shù)據(jù)并進(jìn)行分析,以此數(shù)據(jù)驅(qū)動(dòng)AI虛擬合成主播角色模型及其情緒動(dòng)畫形象的生成。前者的優(yōu)勢(shì)在于可以將情緒動(dòng)畫制作得更為生動(dòng)、夸張,劣勢(shì)是操作耗時(shí)費(fèi)力,人力成本高且制作周期較長(zhǎng);后者制作周期較短,并在某種程度上彌補(bǔ)了現(xiàn)有AI生成動(dòng)畫動(dòng)作不夠流暢、面部表情僵硬等不足,但對(duì)設(shè)備精度及成本要求高。
理想的做法是,嘗試將二者的優(yōu)勢(shì)集中起來(lái),首先通過(guò)面部捕捉技術(shù)獲得面部情緒變化數(shù)據(jù)并進(jìn)行分析,然后由動(dòng)畫師進(jìn)行手工修改關(guān)鍵幀,這樣的工作流程將生產(chǎn)出效率更高效果更好同時(shí)帶有立體、靈動(dòng)、互動(dòng)特征的情緒動(dòng)畫,在與受眾進(jìn)行信息交流乃至精神層面的溝通上更進(jìn)一步。
3.運(yùn)用5G等新技術(shù)加深交互反饋,有效提升虛擬主播“共情力”。5G時(shí)代的到來(lái)為傳感器技術(shù)賦能,使多模態(tài)數(shù)據(jù)收集及交互成為可能。與單模態(tài)的數(shù)據(jù)識(shí)別相比,多模態(tài)數(shù)據(jù)識(shí)別可以綜合不同模態(tài)的信息以提高情緒情感識(shí)別的準(zhǔn)確度。通過(guò)對(duì)受眾心率、血流速度、面部表情等的感應(yīng)與分析,對(duì)其生理信號(hào)、表情以及肢體語(yǔ)言等多模態(tài)信息進(jìn)行特征提取和融合,能夠較為準(zhǔn)確地獲得受眾當(dāng)下的情緒狀態(tài)和對(duì)傳播內(nèi)容的感受,在此基礎(chǔ)上虛擬主播將會(huì)嘗試以類人類的思維、從“理解”的意義上發(fā)出更為貼合語(yǔ)境的對(duì)應(yīng)性情感反饋,滿足受眾的心理需求,讓用戶獲得更好的“共情”體驗(yàn)。
高速發(fā)展的5G技術(shù)也將進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)的全場(chǎng)景聯(lián)通和人機(jī)之間的智能協(xié)同。虛擬主播“跨界”至交互領(lǐng)域時(shí),情感表達(dá)的交互反饋既是用戶對(duì)虛擬主播產(chǎn)生情感依賴的重要條件之一,也是虛擬主播的“機(jī)器情感”得以生成的前提。全場(chǎng)景多模態(tài)的情感情緒識(shí)別中,設(shè)計(jì)者可以借助相關(guān)的智能交互測(cè)量工具和傳感設(shè)備,較為精確地辨識(shí)用戶的實(shí)時(shí)情境與情感,有針對(duì)性地進(jìn)行雙向語(yǔ)義分析和情感反饋分析,在用戶情感和“機(jī)器情感”以及二者的互動(dòng)方面均獲得較為精確的把握,可望建立起人機(jī)情感互動(dòng)的完整閉環(huán),從而有效提升虛擬主播的共情能力,使得交互過(guò)程更為人性化、專業(yè)化。
四、結(jié)語(yǔ)
作為智媒時(shí)代具有象征意義的新生事物,虛擬主播的問(wèn)世與發(fā)展一直伴隨著“親和力”方面的質(zhì)疑。依托信息情感分析這一人工智能中極具引領(lǐng)性的方法,通過(guò)語(yǔ)義分析技術(shù)的細(xì)化和動(dòng)畫制作手段的優(yōu)化,將有效提升虛擬主播情感表達(dá)的具象化水準(zhǔn);借助5G時(shí)代帶來(lái)的全場(chǎng)景多模態(tài)交互環(huán)境以及智能傳感器的綜合運(yùn)用,可望使這一新型技術(shù)不僅僅在新聞播報(bào)、節(jié)目主播等媒體舞臺(tái)上贏得一席之地,還可以“跨界”到包括直播平臺(tái)在內(nèi)的其他行業(yè),實(shí)現(xiàn)對(duì)人類勞動(dòng)的部分替代和人類能力的某種延伸。
作者官奕聰系中國(guó)傳媒大學(xué)動(dòng)畫與數(shù)字藝術(shù)學(xué)院數(shù)字媒體藝術(shù)專業(yè)碩士研究生呂欣系中國(guó)傳媒大學(xué)動(dòng)畫與數(shù)字藝術(shù)學(xué)院教授
本文系2019年度國(guó)家社科基金藝術(shù)學(xué)項(xiàng)目“網(wǎng)絡(luò)文化對(duì)社會(huì)公眾生活方式的影響研究”(項(xiàng)目編號(hào):19BH147)的階段性研究成果之一。
參考文獻(xiàn)
[1]邵鵬,楊禹.AI虛擬主播與主持人具身傳播[J].中國(guó)廣播電視學(xué)刊,2020(06).
[2]EKMAN P.Emotion in the Human Face[M].Oxford:Pergamon Press Inc,1972.
[3]高勇,馬思偉,宋博聞.國(guó)內(nèi)虛擬主播產(chǎn)業(yè)鏈發(fā)展現(xiàn)狀及趨勢(shì)研究[J].新媒體研究,2020(01).
[4]王丹.“AI合成主播”的發(fā)展與雙效推進(jìn)策略[J].傳媒,2019(23).
[5]華樹(shù)凱.人工智能驅(qū)動(dòng)下主持人角色的創(chuàng)新與發(fā)展——以AI合成主播為例[J].中國(guó)廣播,2020(09).