摘要:數(shù)字人作為在人機傳播中的重要交互角色,展現(xiàn)出了高效性、精準(zhǔn)性、個性化、交互性、全天候服務(wù)以及多樣性與靈活性等特點,推動了人機共生新紀(jì)元,促進了數(shù)字文明建構(gòu),在元宇宙中扮演著關(guān)鍵角色。本文探討了元宇宙背景下“人—設(shè)備—數(shù)字人”的多模態(tài)交互、主體人直接控制數(shù)字人的交互方式,分析了數(shù)字人在媒體傳播、時尚設(shè)計和商業(yè)服務(wù)等領(lǐng)域的典型應(yīng)用,以期為數(shù)字人的交互設(shè)計提供有益參考。
關(guān)鍵詞:元宇宙 數(shù)字人 交互設(shè)計 商業(yè)服務(wù)
元宇宙作為虛擬世界與現(xiàn)實世界的融合體,正逐漸成為人們社交、娛樂、工作和學(xué)習(xí)的新平臺。在這個新興的數(shù)字空間中,數(shù)字人扮演著至關(guān)重要的角色,它們不僅是用戶個性化的化身,更是連接虛擬與現(xiàn)實的橋梁。數(shù)字人的交互設(shè)計既有基于身體美學(xué)的高仿真性,又有基于具身認(rèn)知的可感知設(shè)計和基于文化認(rèn)同的個性化。在實現(xiàn)方式上,超真感的多模態(tài)交互、沉浸式的情感交互以及個性化需求的智能交互,共同構(gòu)成了數(shù)字人交互式設(shè)計的核心。這些交互方式不僅增強了數(shù)字人的互動性,也為用戶帶來了更加豐富和立體的體驗。數(shù)字人的出現(xiàn),不僅提高了傳播效率,拓展了傳播內(nèi)容的多樣性和個性化,又給受眾帶來全新的視聽和交互體驗,推動了產(chǎn)業(yè)鏈升級與智能化發(fā)展。
一、數(shù)字人交互設(shè)計的核心特點:融合美學(xué)、認(rèn)知與文化的創(chuàng)新實踐
數(shù)字人交互設(shè)計融合了美學(xué)、認(rèn)知科學(xué)和技術(shù)工程的精華,為構(gòu)建更加人性化的虛擬世界奠定了堅實的基礎(chǔ)。隨著人工智能、計算機視覺和自然語言處理等技術(shù)的進步,數(shù)字人不僅能夠模擬真實人物的外表和行為,更能在多維度上實現(xiàn)高度互動。
1.高仿真設(shè)計:數(shù)字人的身體美學(xué)與技術(shù)融合。具身認(rèn)知理論強調(diào)認(rèn)知過程與身體體驗的緊密聯(lián)系,而數(shù)字人的高仿真設(shè)計正是這一理論在虛擬交互領(lǐng)域的重要體現(xiàn)。通過高度逼真的身體美學(xué)設(shè)計,數(shù)字人不僅在外觀上模擬真實人類的外貌、皮膚紋理、衣物質(zhì)感等細節(jié),還在動作和表情上追求與人類無差別的自然流暢度,這種設(shè)計使得用戶在與數(shù)字人互動時能夠通過視覺、聽覺等感官獲得與真實人際交往相似的體驗。數(shù)字人的微表情捕捉技術(shù)能夠精準(zhǔn)再現(xiàn)面部肌肉的微妙變化,從而映射出內(nèi)心情感的波動,讓用戶感受到數(shù)字人的情感反應(yīng)如同真人一般真實可信。這種高度仿真的身體美學(xué)設(shè)計,讓用戶的身體感知和認(rèn)知過程在虛擬交互中得以延伸和擴展,從而增強用戶對數(shù)字人的認(rèn)同感和沉浸感。例如,中國國際傳播集團和世優(yōu)科技合作的數(shù)字人“阿央”,通過對人體比例、肌肉結(jié)構(gòu)、皮膚紋理等進行細致的觀察和分析,將這些美學(xué)元素融入數(shù)字人的設(shè)計中,從行走的姿態(tài)到手指的微妙彎曲,無不展現(xiàn)出人類動作的自然流暢,通過實時數(shù)字人、實時渲染等技術(shù),使其擁有豐富的面部表情和肢體語言,呈現(xiàn)出高度仿真的形象?!鞍⒀搿币褏⑴c主持了2024年北京數(shù)字經(jīng)濟體驗周暨數(shù)字消費節(jié)、全球數(shù)字經(jīng)濟大會數(shù)字消費節(jié)等重大活動,為用戶帶來了全新的體驗。
2.可感知設(shè)計:數(shù)字人的具身認(rèn)知與情感互動??筛兄O(shè)計強調(diào)數(shù)字人通過具身認(rèn)知與用戶進行情感互動,具身認(rèn)知理論認(rèn)為認(rèn)知過程不僅依賴于大腦,還與身體和環(huán)境密切相關(guān),數(shù)字人通過模擬人類的肢體語言、表情和動作,使用戶在交互中感受到更強的社交臨場感,仿佛在與真實人類互動。數(shù)字人通過可感知設(shè)計,如逼真的面部表情、自然的肢體動作,營造出仿佛真實社交伙伴就在身邊的感覺,這種設(shè)計不僅提升了用戶體驗的真實性和沉浸感,還通過情感共鳴增強了用戶與數(shù)字人之間的連接,使用戶在交互過程中感受到被理解和支持,從而形成更加自然、智能和人性化的交互體驗。用戶在與數(shù)字人的情感互動中,憑借具身認(rèn)知和所感受到的社交臨場感,獲得更加豐富、深入且自然的體驗,讓數(shù)字人不再是冰冷的技術(shù)產(chǎn)物,而是能滿足情感需求、帶來獨特交互感受的存在。例如,三峽旅游集團打造的文旅AI交互數(shù)字人“鱘俠船長”,在 “鱘俠船長” 模型構(gòu)建初期,讓演員模擬駕駛船只、講解景點、與游客互動等典型動作,對演員進行全方位動作數(shù)據(jù)采集,實現(xiàn)數(shù)字人動作從現(xiàn)實物理空間到虛擬數(shù)字空間的精準(zhǔn)映射。語音識別技術(shù)層面,以自然語言處理(NLP)為核心支撐,“鱘俠船長” 配備高靈敏度麥克風(fēng)陣列,實時采集游客語音信息。例如,游客詢問 “三峽的最佳游覽季節(jié)是什么時候”,識別系統(tǒng)經(jīng)過處理后,將文本傳輸至后端對話管理模塊,調(diào)用相關(guān)知識庫生成精準(zhǔn)回復(fù),再借助文本轉(zhuǎn)語音(TTS)技術(shù),以富有情感、貼合 “鱘俠船長” 人設(shè)的語音反饋給游客,達成自然、高效的語音交互,打破溝通壁壘,滿足游客信息獲取訴求。
3.個性化設(shè)計:數(shù)字人的文化認(rèn)同與創(chuàng)新傳承。個性化設(shè)計在數(shù)字人領(lǐng)域的核心價值在于其作為文化認(rèn)同與創(chuàng)新傳承的雙重載體,超越了單純的技術(shù)集成,成為連接傳統(tǒng)與現(xiàn)代、全球與本土的文化橋梁。數(shù)字人通過深度融合文化認(rèn)同,不僅能夠體現(xiàn)特定文化的精神內(nèi)核與審美特質(zhì),還能在現(xiàn)代科技語境下實現(xiàn)文化的創(chuàng)造性轉(zhuǎn)化與創(chuàng)新性發(fā)展。這種設(shè)計理念讓數(shù)字人通過恰當(dāng)?shù)恼Z言、行為、表情,精準(zhǔn)還原特定文化的情感表達與行為模式,從而構(gòu)建起一種具有文化深度與時代張力的交互體驗。通過將傳統(tǒng)元素與現(xiàn)代審美、時尚潮流有機結(jié)合,數(shù)字人不僅滿足了現(xiàn)代人對多元文化的需求,更在全球化背景下為文化傳承提供了新的可能性,使觀眾在互動中感受到文化的生命力與當(dāng)代價值。這種設(shè)計特點不僅推動了數(shù)字人技術(shù)的文化賦能,也為數(shù)字時代的人文精神注入了新的活力。例如,由廣西壯族自治區(qū)文化和旅游廳指導(dǎo)、廣西旅游發(fā)展集團打造的文旅數(shù)字人“劉三姐”,依托具有鮮明地域特色的專屬文化符號——“劉三姐”,在形象設(shè)計上,參考了歷代劉三姐扮演者的人物形象,融入壯族特色和現(xiàn)代元素的服裝設(shè)計,既展現(xiàn)了傳統(tǒng)文化的魅力,又符合現(xiàn)代審美。在語言設(shè)計方面,數(shù)字人“劉三姐”具備多語言能力,不僅會唱山歌,還會講英語、東盟語、白話、壯話、桂柳話、客家話等多種語言,不僅體現(xiàn)了廣西的多元文化背景,也便于與不同語言背景的游客進行交流。
二、數(shù)字人交互式設(shè)計的多元實現(xiàn)方式:強化便捷、智能、真實的交互體驗
數(shù)字人交互式設(shè)計的實現(xiàn)方式多種多樣,包括傳統(tǒng)的“人—設(shè)備—數(shù)字人”的多模態(tài)交互方式、人直接操作數(shù)字人虛擬身體的交互方式,以及情感化交互。這些交互式設(shè)計的實現(xiàn)方式打破了語言和肢體動作的限制,為用戶帶來更加便捷、智能、真實的交互體驗。
1.“人—設(shè)備—數(shù)字人”多模態(tài)交互,實現(xiàn)感官融合、智能互動?!叭恕O(shè)備—數(shù)字人”多模態(tài)交互的設(shè)計不僅是一種技術(shù)實現(xiàn),更是一種通過身體感知與虛擬世界深度融合的認(rèn)知體驗。具身理論強調(diào),人類的認(rèn)知和情感體驗是通過身體與環(huán)境的互動形成的,而數(shù)字人作為虛擬實體,通過語音、視覺、觸覺等多模態(tài)交互方式,能夠模擬真實人類的動作、表情和情感表達,使用戶在交互過程中產(chǎn)生“具身化”的感知體驗。這種設(shè)計使用戶在與數(shù)字人互動時,能夠通過設(shè)備(如手機、電腦)感受到一種身體與虛擬世界的無縫連接,從而增強社交臨場感,即用戶感受到數(shù)字人仿佛真實存在于社交空間中。這種臨場感不僅依賴于技術(shù)的精確性(如語音識別、手勢識別),更依賴于數(shù)字人對用戶情感狀態(tài)的捕捉與反饋,使用戶在交互中感受到被理解與共情,滿足用戶對智能化、人性化交互的深層次需求。例如,國家自然博物館引入數(shù)字人導(dǎo)覽系統(tǒng),游客可以通過智能手機、平板電腦或VR眼鏡等硬件設(shè)備接入互動平臺,自由選擇游覽路徑和虛擬導(dǎo)游,開啟一段探索之旅。該項目運用先進的大模型技術(shù),構(gòu)建了一個智能AI問答系統(tǒng),能夠即時響應(yīng)并解答游客的問題,提供沉浸式的導(dǎo)覽體驗,大大增強了參觀的趣味性和便捷性。
2.主體人控制數(shù)字人的直接交互,實現(xiàn)動作捕捉技術(shù)與虛擬身體的聯(lián)動。主體人依靠動作捕捉技術(shù)能夠直接實現(xiàn)對虛擬數(shù)字人身體的控制。動作捕捉技術(shù)讓使用者能夠擺脫實體設(shè)備的限制,直接和數(shù)字虛擬形象進行互動,將人類的意識映射到虛擬身體上,造成虛擬身體等同于肉身的“錯覺”,實現(xiàn)了意識與虛擬身體的統(tǒng)一。在這一互動過程中,數(shù)字人的表情動作設(shè)計與主體人的動作行為相融合,數(shù)字虛擬角色個性化的性格特征更加凸顯,讓主體人“暫時脫離現(xiàn)實肉身”進而解放受限于現(xiàn)實世界的意識,促進了其在虛擬空間中的真實情感表達和更深刻的體驗。這種互動方式被廣泛應(yīng)用于文娛、游戲之中。例如,體感游戲利用標(biāo)準(zhǔn)攝像頭捕捉玩家的實時動作,然后通過視頻分析技術(shù)對手和臉部位置進行識別和追蹤,并轉(zhuǎn)化為游戲內(nèi)角色的控制信號,實現(xiàn)玩家動作與游戲角色動作的同步。游戲系統(tǒng)還會根據(jù)這些動作和游戲規(guī)則來判斷玩家的游戲進度和狀態(tài)。這種方式不僅讓玩家感受到身臨其境的游戲體驗,還增強了互動性和趣味性。
3.情感化數(shù)字人交互,實現(xiàn)“感同身受”的情感體驗。情感計算(Affective Computing)和情緒識別技術(shù)為數(shù)字人交互設(shè)計提供了新的實現(xiàn)方式。通過捕捉和分析用戶的情感狀態(tài),數(shù)字人能夠?qū)崟r調(diào)整自身的交互策略,提供更加個性化和情感化的服務(wù)。情感計算是一種通過計算機系統(tǒng)識別、理解、處理和模擬人類情感的技術(shù)。它結(jié)合了心理學(xué)、認(rèn)知科學(xué)、人工智能和機器學(xué)習(xí)等多學(xué)科知識,能夠通過分析用戶的面部表情、語音語調(diào)、生理信號(如心率、皮膚電導(dǎo)率)等多模態(tài)數(shù)據(jù),推斷用戶的情感狀態(tài)。而情緒識別技術(shù)是情感計算的核心組成部分,包括面部表情識別、語音情感分析、生理信號分析等。數(shù)字人可以通過攝像頭捕捉用戶的面部表情,利用深度學(xué)習(xí)算法分析表情特征,識別用戶的情緒狀態(tài),調(diào)整恰如其分的對話內(nèi)容和語氣,實現(xiàn)情感共鳴。
三、數(shù)字人交互設(shè)計的廣泛應(yīng)用:引領(lǐng)媒體、時尚與商業(yè)服務(wù)的智能變革
交互設(shè)計的數(shù)字人憑借其獨特的交互能力和智能化特點,逐步拓展并滲透到眾多學(xué)科板塊的創(chuàng)新服務(wù)之中,被廣泛應(yīng)用于媒體、娛樂、服務(wù)、時尚、文旅等各個行業(yè),展現(xiàn)出了巨大的應(yīng)用潛力和前景。
1.推動媒體智能化轉(zhuǎn)型,革新內(nèi)容生產(chǎn)與用戶體驗。媒體傳播領(lǐng)域交互式數(shù)字人的應(yīng)用在當(dāng)今數(shù)字化時代正扮演著越來越重要的角色,它們不僅革新了內(nèi)容的生產(chǎn)和分發(fā)方式,還極大地增強了用戶體驗感和參與度。通過集成自然語言處理、機器學(xué)習(xí)以及計算機視覺等先進技術(shù),交互式數(shù)字人能夠以更加人性化的形式與用戶互動,提供個性化的內(nèi)容推薦和服務(wù),從而推動媒體行業(yè)向更智能、更高效的模式轉(zhuǎn)型。例如,2023年3月,人民日報AI虛擬主播“任小融”在全國兩會召開之際上線,外形更加完美,播報更加自然。2024年3月,央視《法治在線》節(jié)目中推出了以其常駐主持陳怡博為原型的AI主播“怡博”,在節(jié)目中主要充當(dāng)通過網(wǎng)絡(luò)檢索對相關(guān)話題拓展評述的角色。澎湃新聞推出的24小時直播頻道“π24H live”,以新技術(shù)為突破口,打造了“真人+數(shù)字虛擬人”主持的互聯(lián)網(wǎng)輕型直播形式。這些應(yīng)用不僅降低了成本,提高了效率,極大地豐富了內(nèi)容的表現(xiàn)形式。同時,這種新型的媒體呈現(xiàn)形式為傳統(tǒng)媒體注入了新的活力,吸引了更多年輕一代的關(guān)注。
2.引領(lǐng)時尚新體驗,重塑創(chuàng)意表達與消費體驗。交互式數(shù)字人在時尚設(shè)計領(lǐng)域的應(yīng)用正日益成為推動行業(yè)發(fā)展的重要力量。它們豐富了時尚設(shè)計的表現(xiàn)形式,改變了時尚信息的傳播方式,還為消費者提供了全新的參與和體驗方式。在服裝設(shè)計環(huán)節(jié),交互式數(shù)字人能夠精準(zhǔn)模擬人體形態(tài)與動作,為設(shè)計師提供實時的虛擬試穿效果,直觀感受不同設(shè)計元素的搭配效果,從而加速設(shè)計迭代,提升作品的創(chuàng)意性和實用性。通過整合先進的3D建模、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)以及人工智能(AI)技術(shù),數(shù)字人能夠為消費者提供前所未有的個性化服務(wù),使消費者能夠在虛擬環(huán)境中試穿衣物、定制化服裝,并與品牌進行互動。例如,一些奢侈品牌推出了基于AR的應(yīng)用程序,讓用戶可以通過智能手機屏幕看到自己穿戴該品牌最新款式的模樣,為顧客提供了更加便捷且富有樂趣的選擇方式。
3.重新定義客戶體驗與運營模式,推動商業(yè)服務(wù)智能化升級。交互式數(shù)字人在商業(yè)服務(wù)領(lǐng)域的應(yīng)用正在重新定義客戶體驗、運營效率以及商業(yè)模式,通過結(jié)合自然語言處理、機器學(xué)習(xí)和大數(shù)據(jù)分析等先進技術(shù),根據(jù)客戶的個性化需求進行精準(zhǔn)響應(yīng),憑借其智能化的交互能力、個性化的服務(wù)體驗以及高效的數(shù)據(jù)處理能力,大幅提升了客戶服務(wù)的質(zhì)量和速度。在零售行業(yè)中,交互式數(shù)字人可以作為虛擬導(dǎo)購,為消費者提供一對一的個性化服務(wù)。在金融服務(wù)領(lǐng)域,交互式數(shù)字人則成為銀行與客戶之間溝通的橋梁。交互式數(shù)字人在餐飲、旅游、教育等多個商業(yè)領(lǐng)域也展現(xiàn)出了巨大的應(yīng)用潛力。以文旅行業(yè)為例,數(shù)字人可為游客提供更加豐富和沉浸式的游覽體驗,深刻改變了文化遺產(chǎn)保護以及旅游營銷的方式。在博物館、藝術(shù)畫廊或歷史遺跡中,交互式數(shù)字人可以作為藝術(shù)品的“守護者”和解說者,通過高清圖像和語音講解,深入解讀作品的藝術(shù)價值和創(chuàng)作背景,使靜態(tài)的展品變得生動起來。
(作者劉嘉瑜系華東師范大學(xué)馬克思主義學(xué)院博士研究生;柳林蔚系上海市教育系統(tǒng)黨內(nèi)法規(guī)研究中心特聘研究員)
參考文獻
[1]陸曉寧.身體美學(xué)視角下的人與數(shù)字虛擬角色交互設(shè)計研究[D].桂林:廣西師范大學(xué),2023.
[2]潘玥,徐而捷,高禮華,等.基于可視化分析的AI數(shù)字人研究與發(fā)展啟示[J].包裝工程,2024(20).
【編輯:李棟】