摘要:[目的/意義]通過(guò)對(duì)虛擬數(shù)字人技術(shù)的應(yīng)用場(chǎng)景分析,進(jìn)一步挖掘其在科普和教學(xué)中的創(chuàng)新應(yīng)用潛力,以期為數(shù)字教育和科普提供新的解決方案。[方法/過(guò)程]系統(tǒng)梳理虛擬數(shù)字人的技術(shù)原理和關(guān)鍵技術(shù),利用案例分析法探討其在細(xì)分領(lǐng)域的前沿應(yīng)用和實(shí)踐研究,通過(guò)實(shí)證展示虛擬數(shù)字人在科普和教學(xué)領(lǐng)域的應(yīng)用潛力。[結(jié)果/結(jié)論]虛擬數(shù)字人作為新型媒介,可以引領(lǐng)科普內(nèi)容的創(chuàng)新表達(dá),并以其高度擬人化和互動(dòng)性,實(shí)現(xiàn)更具沉浸感和參與度的教學(xué)體驗(yàn)。目前的挑戰(zhàn)來(lái)自于圖形和動(dòng)畫技術(shù)、語(yǔ)音特征深度學(xué)習(xí)技術(shù)、交互和智能技術(shù)、認(rèn)知建模和學(xué)習(xí)算法、大語(yǔ)言模型LLM技術(shù)以及算力背后的核心技術(shù)。
關(guān)鍵詞:虛擬數(shù)字人;科普;教學(xué);計(jì)算機(jī)圖形學(xué);人工智能;虛擬現(xiàn)實(shí)
分類號(hào):G255; G434
引用格式:韓晶. 虛擬數(shù)字人在科普與教學(xué)中的應(yīng)用研究與場(chǎng)景探析[J/OL]. 知識(shí)管理論壇, 2024, 9(5): 460-476 [引用日期]. http://www.kmf.ac.cn/p/406/. (Citation: Han Jing. Application Research and Scenario Analysis of Virtual Digital Humans in Science Popularization and Teaching[J/OL]. Knowledge Management Forum, 2024, 9(5): 460-476 [cite date]. http://www.kmf.ac.cn/p/406/.)
1" 引言/Introduction
2017年我國(guó)提出的“到2020年人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步,人工智能產(chǎn)業(yè)成為新的重要經(jīng)濟(jì)增長(zhǎng)點(diǎn),人工智能技術(shù)應(yīng)用成為改善民生的新途徑,有力支撐進(jìn)入創(chuàng)新型國(guó)家行列和實(shí)現(xiàn)全面建成小康社會(huì)的奮斗目標(biāo)”的戰(zhàn)略目標(biāo)[1],到2024年已經(jīng)基本實(shí)現(xiàn)。中國(guó)在人工智能領(lǐng)域取得了顯著進(jìn)展,技術(shù)水平已接近世界先進(jìn)水平,人工智能產(chǎn)業(yè)蓬勃發(fā)展,成為重要的經(jīng)濟(jì)增長(zhǎng)點(diǎn)。人工智能應(yīng)用在醫(yī)療、教育、交通等領(lǐng)域廣泛普及,有效改善民生,助力實(shí)現(xiàn)全面建成小康社會(huì)。2022年國(guó)家“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃中就提升全民數(shù)字素養(yǎng)和技能提出:“實(shí)施全民數(shù)字素養(yǎng)與技能提升計(jì)劃,擴(kuò)大優(yōu)質(zhì)數(shù)字資源供給,鼓勵(lì)公共數(shù)字資源更大范圍向社會(huì)開放”[2]。其中,虛擬數(shù)字人作為一種新興的數(shù)字技術(shù)應(yīng)用,正在成為提升全民數(shù)字素養(yǎng)和技能的重要途徑。根據(jù)中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟總體組和中關(guān)村數(shù)智人工智能產(chǎn)業(yè)聯(lián)盟數(shù)字人工作委員會(huì)發(fā)布的《2020年虛擬數(shù)字人發(fā)展白皮書》中對(duì)虛擬數(shù)字人的描述,虛擬數(shù)字人是指具有數(shù)字化外形的虛擬人物[3]。與具備實(shí)體的機(jī)器人不同,虛擬數(shù)字人依賴于顯示設(shè)備(如計(jì)算機(jī)、智能終端等)而存在,并具備以下三個(gè)特征:①擁有人的外觀,具有指定性別、外貌、性格等人物特征;②擁有人的行為,具有用語(yǔ)言、面部表情和肢體動(dòng)作表達(dá)的能力;③擁有人的思想,具備識(shí)別外部環(huán)境、可以與他人交流和互動(dòng)的能力。
虛擬數(shù)字人既不同于數(shù)字人亦不同于虛擬人,而是同時(shí)兼具虛擬人和數(shù)字人特征[4]。數(shù)字人、虛擬人和虛擬數(shù)字人是與計(jì)算機(jī)技術(shù)和仿真技術(shù)相關(guān)的概念,都是基于計(jì)算機(jī)圖形學(xué)、人工智能等相關(guān)技術(shù)構(gòu)建出來(lái)的,都對(duì)真實(shí)人體形態(tài)、外貌、動(dòng)作和行為進(jìn)行模擬和重現(xiàn),但各自有不同的特點(diǎn),如數(shù)字人涵蓋了廣泛的數(shù)字化人形象,而虛擬人更強(qiáng)調(diào)交互能力,虛擬數(shù)字人則具備更高級(jí)的逼真性和交互性能,這也使其在多個(gè)不同領(lǐng)域中得到應(yīng)用,具體如表1所示:
綜上所述,數(shù)字人、虛擬人和虛擬數(shù)字人都是利用計(jì)算機(jī)技術(shù)創(chuàng)建的人體模擬實(shí)體,但它們?cè)诙x、范疇、應(yīng)用領(lǐng)域和功能上存在一些區(qū)別。虛擬人是數(shù)字人的一部分,而虛擬數(shù)字人是數(shù)字人中更具技術(shù)復(fù)雜性和逼真性的一種類型,具備更高級(jí)的逼真性和交互性能,展示了更多應(yīng)用的潛力。由于術(shù)語(yǔ)的使用可能存在不同的解釋,因此在具體情況下,這些概念的包含關(guān)系可能會(huì)有所變化。
虛擬數(shù)字人是近年來(lái)在計(jì)算機(jī)圖形學(xué)和人工智能、虛擬現(xiàn)實(shí)等前沿交叉領(lǐng)域的重要成果之一。它通過(guò)模擬人類的外貌、聲音和行為特征,在多個(gè)應(yīng)用領(lǐng)域都取得了令人驚嘆的進(jìn)展。利用高性能的語(yǔ)言建模、計(jì)算機(jī)視覺和圖像生成等數(shù)字化技術(shù),虛擬數(shù)字人能夠模擬不同情境下的語(yǔ)言表達(dá)和行為感知,以實(shí)現(xiàn)與人類的多模態(tài)自然交互,同時(shí),它還具備較強(qiáng)的情感表達(dá)、情緒交流、性格培養(yǎng)和個(gè)性化服務(wù)能力。根據(jù)市場(chǎng)分析機(jī)構(gòu)預(yù)測(cè),我國(guó)虛擬數(shù)字人市場(chǎng)規(guī)模在2026年將達(dá)到102.4億元。
雖然虛擬數(shù)字人擁有巨大的潛力,但在科普和教學(xué)中的應(yīng)用仍處于起步階段,與“虛擬數(shù)字人在科普和教學(xué)中的應(yīng)用”相關(guān)的文獻(xiàn)在CNKI中檢索結(jié)果不多,比較有代表性的如蔡雨坤等的研究表明,在數(shù)字技術(shù)的支持下,相關(guān)虛擬數(shù)字人人數(shù)不受限、樣貌更新穎,且擁有智能化的科學(xué)內(nèi)容生產(chǎn)能力,可以減輕真人科學(xué)家從事科普面臨的時(shí)間壓力、傳播壓力,改善公眾對(duì)科學(xué)家的刻板印象[5]。王玄玄介紹了虛擬數(shù)字人在微課教學(xué)中應(yīng)用的價(jià)值與局限性,然后分析了虛擬數(shù)字人在微課教學(xué)中的實(shí)現(xiàn),最后針對(duì)虛擬數(shù)字人在微課教學(xué)中應(yīng)用存在的問(wèn)題提出了相應(yīng)的解決措施[6]。當(dāng)前中國(guó)在教育和科普方面面臨的最大問(wèn)題是科學(xué)教育資源的不足和科學(xué)教育方法的落后,現(xiàn)有薄弱的師資力量將導(dǎo)致跨學(xué)科的教學(xué)能力和創(chuàng)新性教學(xué)方法缺乏,同時(shí)全社會(huì)科普資源的缺乏,將成為提升學(xué)生科學(xué)素養(yǎng)的障礙。黨的二十大明確提出,到2035年建成教育強(qiáng)國(guó)、科技強(qiáng)國(guó)、人才強(qiáng)國(guó),強(qiáng)調(diào)教育、科技、人才是全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家的基礎(chǔ)性、戰(zhàn)略性支撐,那么,虛擬數(shù)字人在科普和教學(xué)領(lǐng)域應(yīng)用的重要性和迫切性顯而易見,虛擬數(shù)字人在解決教育資源分配不均和科普知識(shí)傳播不足方面具有廣闊的應(yīng)用前景,但還需要在技術(shù)、內(nèi)容、應(yīng)用場(chǎng)景、社會(huì)認(rèn)知度等方面不斷完善和突破,需要多方面的努力,才能真正發(fā)揮其作用,推動(dòng)教育和科普事業(yè)的發(fā)展。
本文聚焦虛擬數(shù)字人的關(guān)鍵技術(shù),借鑒其在細(xì)分領(lǐng)域的應(yīng)用經(jīng)驗(yàn),通過(guò)實(shí)證展示虛擬數(shù)字人如何有效提升效果評(píng)估和用戶體驗(yàn),從而引領(lǐng)科普創(chuàng)新和革新教學(xué)模式。本文通過(guò)對(duì)虛擬數(shù)字人技術(shù)的應(yīng)用場(chǎng)景分析,進(jìn)一步挖掘其在科普和教學(xué)中的創(chuàng)新應(yīng)用潛力,創(chuàng)新性地通過(guò)《中國(guó)名師講壇》虛擬數(shù)字人形象定制為數(shù)字教育和知識(shí)科普提供新的解決方案。
2" 虛擬數(shù)字人技術(shù)應(yīng)用概述/Overview of the Application of Virtual Digital Human Technology
2.1" 虛擬數(shù)字人定義
虛擬數(shù)字人指存在于非物理世界中,由計(jì)算機(jī)圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語(yǔ)音合成等計(jì)算機(jī)手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物[7]。簡(jiǎn)而言之,是基于計(jì)算機(jī)圖形學(xué)和人工智能的仿真人體模型。
2.2" 技術(shù)原理與關(guān)鍵技術(shù)
虛擬數(shù)字人擁有的形象能力、表達(dá)能力和感知互動(dòng)能力,其背后主要依托兩大類技術(shù),一類是支撐虛擬數(shù)字人外觀形象生成方面的技術(shù),包括三維建模、圖像處理與渲染技術(shù)、運(yùn)動(dòng)捕捉和手勢(shì)識(shí)別技術(shù)、語(yǔ)音合成與識(shí)別技術(shù)等;另一類是驅(qū)動(dòng)虛擬數(shù)字人內(nèi)在智能學(xué)習(xí)方面的技術(shù),包括自然語(yǔ)言處理(natural language processing, NLP)技術(shù)、人工智能情感交互技術(shù)以及數(shù)據(jù)管理和安全技術(shù)。
2.3" 虛擬數(shù)字人應(yīng)用的發(fā)展現(xiàn)狀與趨勢(shì)
在游戲領(lǐng)域,開發(fā)者為玩家提供更加豐富真實(shí)的游戲內(nèi)容,如場(chǎng)景設(shè)計(jì)、武器裝備、皮膚裝扮等外設(shè)都可以自行定制和變化,如多人在線射擊游戲《堡壘之夜》(Fortnite),與歌手Travis Scott跨界合作舉辦虛擬演唱會(huì),虛擬人物模擬了歌手的標(biāo)志形象,如臟辮、赤膊等,這種虛擬數(shù)字人應(yīng)用在游戲中獲得了高度關(guān)注,吸引了大量的玩家參與,并引發(fā)了廣泛的討論,見圖1[8],因?yàn)樗o玩家提供了個(gè)性化的角色選擇和展示方式,增加了游戲的互動(dòng)性和深度參與感。隨著技術(shù)的進(jìn)步,虛擬數(shù)字人將更加智能化、自主化,并根據(jù)玩家的動(dòng)作和情感提供更真實(shí)的反應(yīng)能力和更豐富的角色行為。
在娛樂(lè)領(lǐng)域,定制虛擬主持人/主播/偶像后,只需要事先準(zhǔn)備音頻或者文字內(nèi)容即可一鍵生成視頻,就可以實(shí)現(xiàn)節(jié)目?jī)?nèi)容快速、自動(dòng)化生產(chǎn),從根本上做到降本增效。通過(guò)統(tǒng)一且風(fēng)險(xiǎn)可控的人物形象打造品牌專屬IP形象,可實(shí)現(xiàn)與觀眾的實(shí)時(shí)互動(dòng),優(yōu)化觀看體驗(yàn)。虛擬數(shù)字人在娛樂(lè)中扮演角色、增加互動(dòng)性和沉浸感的應(yīng)用已經(jīng)相當(dāng)普遍,虛擬數(shù)字人的逼真度、情感表達(dá)和個(gè)性化特點(diǎn)不斷提升。如圖2[9]所示,2022年國(guó)際足聯(lián)世界杯期間,中國(guó)體育播音員劉建宏的數(shù)字孿生人在抖音上宣讀比賽結(jié)果和其他相關(guān)新聞。
在影視領(lǐng)域,如電影《阿凡達(dá)2》融合動(dòng)作捕捉技術(shù)、表情捕捉技術(shù)、人物和場(chǎng)景CG(computer graphics)造型、實(shí)景3D攝影系統(tǒng)、虛擬攝影系統(tǒng)等數(shù)字技術(shù)于一身,這一成功案例展示了虛擬數(shù)字人在影視領(lǐng)域的潛力,既能為角色創(chuàng)造新的發(fā)展維度,又能延續(xù)經(jīng)典IP的角色魅力。電影《流浪地球2》幾乎全片都使用了虛擬拍攝技術(shù),3 000多個(gè)視效鏡頭中,虛擬拍攝鏡頭有2 000多個(gè),見圖3[10]。利用虛擬數(shù)字人創(chuàng)建實(shí)驗(yàn)場(chǎng)景,可以替代演員進(jìn)行危險(xiǎn)動(dòng)作,虛擬數(shù)字人技術(shù)真正使觀眾升級(jí)成為玩家,解鎖了更多前所未有的互動(dòng)體驗(yàn),眼、耳、身、意,全息體驗(yàn)影視魅力,走進(jìn)IP世界數(shù)字空間,體會(huì)身臨“奇”境之感,這不僅為影視制作提供了更大的創(chuàng)作自由度和成本效益,還能將虛擬數(shù)字人打造成為新型IP的創(chuàng)作源泉,使電影藝術(shù)的表現(xiàn)空間日新月異。
在社交領(lǐng)域,如Snapchat中的“增強(qiáng)現(xiàn)實(shí)鏡頭”技術(shù),Snapchat是一款流行的社交媒體應(yīng)用,其“增強(qiáng)現(xiàn)實(shí)鏡頭”功能使用虛擬數(shù)字人技術(shù),可以將虛擬效果疊加于用戶的面部,還可以用新的數(shù)字方式來(lái)幫助購(gòu)物者試穿鞋子或嘗試虛擬妝容,疫情期間發(fā)揮了很強(qiáng)大的作用[11]。與朋友交流時(shí)使用這種虛擬數(shù)字人,可以增添趣味性和創(chuàng)造性,這種互動(dòng)形式鼓勵(lì)人們?cè)鰪?qiáng)社交體驗(yàn),正在逐漸成為一種新的社交互動(dòng)方式。
在文旅領(lǐng)域,虛擬數(shù)字人是“導(dǎo)游”的不二人選,它可以在著名景點(diǎn)、各大主題公園、歷史博物館、科技館、名人故居等旅游線路上為游客提供智能服務(wù),其多語(yǔ)言導(dǎo)游、便于更新和維護(hù)等天然優(yōu)勢(shì)可以使觀眾得到實(shí)時(shí)的路線規(guī)劃、詳盡的信息查詢和生動(dòng)形象的語(yǔ)音講解,與此同時(shí),觀眾還可以與虛擬數(shù)字人物互動(dòng),對(duì)場(chǎng)館的歷史淵源、文化背景、藝術(shù)特色和發(fā)展規(guī)劃有更深入的了解。此外,虛擬數(shù)字人在改善導(dǎo)游體驗(yàn)、降低管理成本方面更值得推廣,見圖4[12]。
在金融領(lǐng)域,虛擬數(shù)字人作為智能理財(cái)顧問(wèn)、智能引導(dǎo)員,不僅能在線下為客戶答疑解惑,引導(dǎo)辦理業(yè)務(wù)和按照客戶的需求推薦相關(guān)理財(cái)產(chǎn)品和服務(wù),還可以進(jìn)行線上線下的多線同步操作,大大提升了工作效率,也讓普通員工投身到更加有創(chuàng)造性的工作中去,使工作安排更加合理,避免了人力消耗在重復(fù)的工作上,見圖5[13]。
在政務(wù)領(lǐng)域,AI數(shù)字人首次智能解讀《最高人民法院的工作報(bào)告》(見圖6[14]),給觀眾帶來(lái)了全新的交互體驗(yàn),也讓“政策解讀”這一類嚴(yán)肅的新聞內(nèi)容具有了“創(chuàng)意感”和“親和力”,將萬(wàn)余字的報(bào)告精簡(jiǎn)至千余字,同時(shí)又不失根本意思,以生動(dòng)、便捷、有趣的方式向公眾快速解讀了重點(diǎn)內(nèi)容,開啟了工作報(bào)告解讀的AI新方式,吸引了更多年輕群體觀看。這樣的方式相較于傳統(tǒng)的政策解讀,亦可理解為一種面向社會(huì)公眾的政治常識(shí)教育,通過(guò)三維建模和動(dòng)畫制作,將看似晦澀難懂的知識(shí)點(diǎn)變得更加直觀形象,易于聽眾吸收理解,這對(duì)于科普類教育工作具有現(xiàn)實(shí)意義。
虛擬數(shù)字人的出現(xiàn)同時(shí)也為教育領(lǐng)域帶來(lái)了許多機(jī)遇和挑戰(zhàn)。教育部門公布的數(shù)據(jù)顯示,過(guò)去幾年來(lái),中國(guó)的教師總?cè)藬?shù)保持在1 500萬(wàn)人左右。教師數(shù)量不足,優(yōu)質(zhì)師資匱乏,嚴(yán)重影響了我國(guó)教育質(zhì)量的提升。虛擬數(shù)字人能夠在遠(yuǎn)程教育中大顯身手,拓寬學(xué)生的學(xué)習(xí)渠道,倡導(dǎo)教育公平,同時(shí),虛擬數(shù)字人還可以對(duì)學(xué)生進(jìn)行個(gè)性化輔導(dǎo),營(yíng)造沉浸式課堂,激發(fā)學(xué)生的學(xué)習(xí)興趣,提高學(xué)習(xí)效果。它無(wú)與倫比的模擬實(shí)踐訓(xùn)練能力、情感支持能力和情緒陪伴能力在安全風(fēng)控和人文關(guān)懷方面更勝一籌。
虛擬數(shù)字人的引入可以有效降低教育相關(guān)視頻的制作成本,提高效率,使用虛擬數(shù)字人代替真實(shí)的教師進(jìn)行教學(xué),不需要人工出鏡和錄制,同時(shí)利用虛擬數(shù)字人可以創(chuàng)建可反復(fù)使用的教學(xué)視頻,從而減少教育視頻錄制中的重復(fù)工作,不受時(shí)間和地點(diǎn)限制。有限的人力資源可以被投入到視頻的后期制作與推廣宣傳中去,這在某種程度上可以推動(dòng)教育質(zhì)量的提升,擴(kuò)大受眾的范圍,讓更多的人得到獲取知識(shí)的渠道,達(dá)到教育普惠性的效果。
3" 虛擬數(shù)字人引領(lǐng)科普創(chuàng)新/Virtual digital humans leading the innovation in science popularization
3.1" 虛擬數(shù)字人技術(shù)在科普應(yīng)用中的需求分析
3.1.1" 科普人才短缺呼喚虛擬分身
截至2022年12月,我國(guó)科普信息員隊(duì)伍人數(shù)超1 380萬(wàn),科普內(nèi)容分享傳播量累計(jì)達(dá)17.6億余次[15],試想如果能利用虛擬數(shù)字人,科普效率將得到大幅提升。目前的科普人員受到策劃選題、撰稿、錄制設(shè)備、拍攝、剪輯等條件限制,耗時(shí)耗力,而科普類虛擬數(shù)字人可以根據(jù)受眾的需求,在任何時(shí)間出現(xiàn)在指定地點(diǎn),甚至讓已故科學(xué)家“復(fù)活”,也就是人們常說(shuō)的“數(shù)字永生”,這也是對(duì)科學(xué)家的一種緬懷和祭奠。利用虛擬數(shù)字人,可以極大程度提升科普生產(chǎn)力。
3.1.2" 科普工作缺乏創(chuàng)意需要?jiǎng)?chuàng)新科普形象
在聚焦基礎(chǔ)研究和前沿領(lǐng)域的科普工作時(shí),新興媒體更應(yīng)注重科技創(chuàng)新。以往科普專家給人的印象都是嚴(yán)肅刻板,缺乏吸引力和感染力,而科普類虛擬數(shù)字人的形象可以根據(jù)受眾的偏好設(shè)計(jì),實(shí)現(xiàn)個(gè)性化、定制化和專業(yè)化的完美結(jié)合,還可以使虛擬形象、超寫實(shí)虛擬人等多種類型融合出現(xiàn),從而更有效地搭建學(xué)術(shù)研究與Z世代年輕群體溝通的橋梁。比如在2022年冬奧會(huì)上出現(xiàn)的AI手語(yǔ)主播(見圖7[16]),她就是一位由手語(yǔ)翻譯引擎和自然動(dòng)作引擎驅(qū)動(dòng)的數(shù)字人[16]。根據(jù)央視披露的信息,AI手語(yǔ)主播長(zhǎng)時(shí)間、系統(tǒng)性地學(xué)習(xí)了《國(guó)家通用手語(yǔ)詞典》,另外還學(xué)習(xí)了百萬(wàn)量級(jí)的標(biāo)準(zhǔn)手語(yǔ)平行語(yǔ)料數(shù)據(jù)和超8 500條影視級(jí)手語(yǔ)動(dòng)作數(shù)據(jù),從而做出了精準(zhǔn)、流暢的手語(yǔ)解說(shuō),并且表情自然生動(dòng),手語(yǔ)動(dòng)作精準(zhǔn)度達(dá)95%以上,出色地勝任了手語(yǔ)解說(shuō)的工作。
3.1.3" 人機(jī)交互雙智能為科普提供源源不斷的素材
生活在現(xiàn)實(shí)世界中的人類如何最大限度地釋放潛能,超級(jí)AI或許會(huì)給科普帶來(lái)機(jī)遇和挑戰(zhàn)。虛擬數(shù)字人依托人工智能機(jī)制,能夠?qū)崿F(xiàn)許多真人無(wú)法完成的功能,并且可以根據(jù)應(yīng)用場(chǎng)景進(jìn)行定制[17]。比如2024年初最熱門的人工智能文生視頻大模型Sora,雖然它目前還無(wú)法完全理解物理世界,時(shí)常制作出混淆了玻璃破碎和液體溢出順序的帶有缺陷的視頻(見圖8[18]),但不可否認(rèn),Sora的軟物理模擬,是大規(guī)模擴(kuò)展文本到視頻訓(xùn)練時(shí)的一項(xiàng)“涌現(xiàn)特性”[18]。通過(guò)對(duì)真實(shí)影像和文本描述結(jié)合生成的Sora視頻進(jìn)行現(xiàn)場(chǎng)演示,可以直觀展現(xiàn)AI技術(shù)的“涌現(xiàn)特征”,使受眾清晰地辨別現(xiàn)實(shí)與AI生成內(nèi)容的差異,并深刻認(rèn)識(shí)到AI被濫用的潛在風(fēng)險(xiǎn),這將是進(jìn)行AI科普的最有效方式。
3.2" 虛擬數(shù)字人在科普展示中的前沿應(yīng)用案例
為了弘揚(yáng)老一輩航天人的精神,讓更多的青少年接觸并了解航天知識(shí)的魅力,商湯科技精心打造了錢學(xué)森先生的AI數(shù)字人形象,實(shí)現(xiàn)了真實(shí)的面部、聲音、表情和動(dòng)作模擬,不僅高度還原了錢學(xué)森先生的語(yǔ)音和語(yǔ)調(diào),做到了精準(zhǔn)的口型匹配,細(xì)致入微地呈現(xiàn)出了他舉手投足間的神態(tài)與氣質(zhì),完成了高度逼真的AI數(shù)字人形象復(fù)刻,從而讓這位“兩彈一星功勛獎(jiǎng)?wù)芦@得者”的音容笑貌在靈境空間中生動(dòng)再現(xiàn),仿佛真人一般真實(shí)自然。這不僅是對(duì)錢學(xué)森先生科學(xué)精神的傳承,更是對(duì)新一代青少年的激勵(lì)與啟迪,如圖9[19]所示:
又如在視覺上利用VR動(dòng)畫的虛構(gòu)性、視聽綜合性和三維仿真性,非遺“滬諺”中極具地方語(yǔ)言特色和影建場(chǎng)景的老上海意象和情境得以重現(xiàn)(如圖10[20]),在聽覺上注重對(duì)演述與三維動(dòng)畫進(jìn)行環(huán)繞收聲、混縮,特別要捕捉易忽略的環(huán)境聲與動(dòng)效,這是觀眾獲得“在場(chǎng)”感最重要的元素。最終,非遺傳承人置身虛擬全景中,通過(guò)演述傳遞親身體驗(yàn)感,讓學(xué)習(xí)者加速理解、實(shí)現(xiàn)心理沉浸,最終更好地傳承、認(rèn)同并運(yùn)用“滬諺”這種寶貴的非遺文化作品[20]。
通過(guò)以上案例的介紹和分析,可以得出結(jié)論:①虛擬數(shù)字人能夠以生動(dòng)形象的方式呈現(xiàn)科學(xué)知識(shí),吸引更多觀眾參與科普活動(dòng),提升科普效果;②虛擬數(shù)字人的互動(dòng)性和個(gè)性化特點(diǎn)可以更好地滿足不同受眾的需求,拓展科普受眾群體;③利用虛擬數(shù)字人進(jìn)行科普活動(dòng)還能夠?yàn)榭破战逃⑷雱?chuàng)新元素,推動(dòng)科普事業(yè)的發(fā)展。
3.3" 虛擬數(shù)字人的科普教育實(shí)踐研究
對(duì)于教育科普方面的嘗試而言,更加生動(dòng)便捷的講解無(wú)疑是虛擬數(shù)字人最重要的競(jìng)爭(zhēng)力與優(yōu)勢(shì),擁有一個(gè)完整的知識(shí)儲(chǔ)備庫(kù)則是可以發(fā)揮數(shù)字虛擬人優(yōu)勢(shì)的必要條件,萬(wàn)方視頻將在業(yè)內(nèi)首次嘗試將虛擬數(shù)字人引入科普教育。萬(wàn)方視頻是萬(wàn)方數(shù)據(jù)旗下一款學(xué)術(shù)產(chǎn)品,其收錄的視頻內(nèi)容以科教文化為主,通過(guò)多年的建設(shè),已與國(guó)內(nèi)眾多學(xué)術(shù)及媒體機(jī)構(gòu)和欄目(如央視的科普頻道、鳳凰衛(wèi)視的訪談節(jié)目、中華醫(yī)學(xué)會(huì)的健康講座等)緊密合作,時(shí)長(zhǎng)突破100萬(wàn)分鐘。值得一提的是,其自主拍攝的《中國(guó)名師講壇》和《境內(nèi)高端學(xué)術(shù)會(huì)議》這兩個(gè)欄目,為市場(chǎng)輸出了很多優(yōu)質(zhì)的高校教師授課視頻、學(xué)術(shù)會(huì)議報(bào)告、院士的科普視頻等,為虛擬數(shù)字人系統(tǒng)的建設(shè)提供基礎(chǔ)的內(nèi)容保障。同時(shí),萬(wàn)方視頻具有規(guī)范、完整的版權(quán)授權(quán),基于授課專家的形象可制作不同風(fēng)格的虛擬數(shù)字人,既保護(hù)了知識(shí)所有者的肖像權(quán),又提升了教育視頻的產(chǎn)出效率,解決了知識(shí)產(chǎn)權(quán)方面的倫理沖突。
基于萬(wàn)方數(shù)據(jù)《中國(guó)名師講壇》視頻庫(kù),甄選出一批受到用戶廣泛認(rèn)可的科普類視頻內(nèi)容,將其升級(jí)為虛擬數(shù)字人互動(dòng)視頻,分別以物理、醫(yī)學(xué)、互聯(lián)網(wǎng)、計(jì)算機(jī)這4個(gè)學(xué)科作為試點(diǎn),邀請(qǐng)科普專家到拍攝現(xiàn)場(chǎng)進(jìn)行錄制或提供已經(jīng)拍攝好的視頻,形象克隆需要2小時(shí)左右,后續(xù)再提供30分鐘左右的音頻,提供這些素材之后,由視頻生成AI進(jìn)行3-5天的機(jī)器學(xué)習(xí)訓(xùn)練,即可生成屬于專家自己的數(shù)字人專屬形象。這個(gè)過(guò)程中要注意的是一般視頻生成AI只關(guān)注某個(gè)特定類別的視頻數(shù)據(jù),或局限在較短的視頻上,或者局限在固定大小的視頻上,比如會(huì)將所有的視頻都拆解成256*256分辨率的標(biāo)準(zhǔn)尺寸的4秒視頻來(lái)處理,這種方法局限性很大,不夠靈活,我們可以借鑒Sora的方法,把之前用來(lái)訓(xùn)練不同形式文本的條件擴(kuò)散模型Diffusion Transformer的算法,拿來(lái)訓(xùn)練不同時(shí)長(zhǎng)、不同分辨率、和不同寬高比尺寸的視頻和圖像,在訓(xùn)練之前,還需要對(duì)這些視頻數(shù)據(jù)進(jìn)行一些準(zhǔn)備工作,如對(duì)視頻數(shù)據(jù)進(jìn)行降維處理,即把原視頻在時(shí)間和空間的維度上進(jìn)行壓縮,進(jìn)而在這個(gè)壓縮的數(shù)據(jù)集上進(jìn)行訓(xùn)練,訓(xùn)練完之后再轉(zhuǎn)換成原始的像素空間,這樣做的目的是使形象更逼真,動(dòng)作更自然,清晰度更高,聲音起伏有感情,真人還原度非常高。之后可與專家協(xié)商科普視頻的更新頻率,每次專家僅提供文字稿件即可完成一次科普短視頻內(nèi)容的輸出,這種方式省時(shí)省力。目前萬(wàn)方已成功制作出首個(gè)虛擬數(shù)字人形象——北京大學(xué)未來(lái)技術(shù)學(xué)院的席鵬教授(見圖11),未來(lái)將有更多學(xué)者加入該計(jì)劃。
總而言之,虛擬數(shù)字人代替講課的老師出鏡作為實(shí)驗(yàn)項(xiàng)目,具有很大的建設(shè)意義和必要性。它不僅可以降低制作成本和提高效率,還可以提供更多個(gè)性化的學(xué)習(xí)體驗(yàn)和多元化的教育選擇,同時(shí)也為教育視頻領(lǐng)域的發(fā)展提供了很好的思路和方式。因此,筆者建議在相關(guān)技術(shù)和設(shè)備條件具備的情況下,適當(dāng)開展該項(xiàng)目的實(shí)踐研究,以期取得更加優(yōu)良的實(shí)踐效果,為教育事業(yè)的發(fā)展做出積極貢獻(xiàn)。
4" 虛擬數(shù)字人革新教學(xué)模式/Virtual digital humans revolutionize teaching models
4.1" 教育領(lǐng)域?qū)μ摂M數(shù)字人的期望與需求
2018年,新西蘭學(xué)生迎來(lái)世界首位數(shù)字虛擬教師。作為奧克蘭學(xué)校提供的免費(fèi)教育項(xiàng)目之一,虛擬教師威爾Will出現(xiàn)在了小學(xué)關(guān)于可再生能源的課堂,如圖12[21]所示:
教育領(lǐng)域?qū)μ摂M數(shù)字人的期望與需求體現(xiàn)在以下幾點(diǎn):
4.1.1" 提升個(gè)性化學(xué)習(xí)體驗(yàn)
虛擬數(shù)字人能夠針對(duì)不同的學(xué)習(xí)者提供個(gè)性化服務(wù),根據(jù)學(xué)習(xí)者的興趣愛好、學(xué)習(xí)進(jìn)度等特點(diǎn),智能推送相關(guān)學(xué)習(xí)資源和教學(xué)內(nèi)容。例如,在教學(xué)中虛擬數(shù)字人可以根據(jù)學(xué)生的興趣愛好及現(xiàn)階段的學(xué)習(xí)目標(biāo),生成特定領(lǐng)域的知識(shí)內(nèi)容,以動(dòng)畫、視頻、圖片等多元結(jié)合的學(xué)習(xí)方式,提供定制化的學(xué)習(xí)體驗(yàn),使學(xué)習(xí)過(guò)程更加具有吸引力并獲得滿意的學(xué)習(xí)效果。
4.1.2" 提高知識(shí)傳遞效果
在教學(xué)中,虛擬數(shù)字人通過(guò)逼真的表情、動(dòng)作等能夠更加生動(dòng)地向?qū)W習(xí)者展示知識(shí)內(nèi)容,有效地提高知識(shí)傳遞效果。相較于真人教師,學(xué)生面對(duì)虛擬數(shù)字人沒(méi)有面對(duì)傳統(tǒng)意義上教師的緊張感,授課過(guò)程更加放松,也更容易通過(guò)與虛擬數(shù)字人進(jìn)行交互,掌握并理解復(fù)雜的科學(xué)概念。與傳統(tǒng)的聽課形式相比,虛擬數(shù)字人能夠提供更加直觀、生動(dòng)的教學(xué)體驗(yàn),激發(fā)學(xué)生的學(xué)習(xí)興趣,提高學(xué)習(xí)效果。
4.1.3" 創(chuàng)新教學(xué)方法
虛擬數(shù)字人提供了一種新的教學(xué)手段,可以通過(guò)模擬實(shí)驗(yàn)等方式,幫助學(xué)生更好地理解和應(yīng)用知識(shí)。例如,在化學(xué)實(shí)驗(yàn)中,虛擬數(shù)字人能夠根據(jù)學(xué)生的操作,模擬危險(xiǎn)的化學(xué)反應(yīng),使學(xué)生能夠在安全環(huán)境下進(jìn)行實(shí)踐操作,提高實(shí)踐能力和應(yīng)用能力,同時(shí)模擬實(shí)驗(yàn)中不真正消耗實(shí)驗(yàn)原料,可以實(shí)現(xiàn)在重復(fù)多次模擬練習(xí)后再進(jìn)行真實(shí)實(shí)驗(yàn)操作,不但大大提升了實(shí)驗(yàn)的成功幾率,還減少了消耗品的損耗,降低教學(xué)成本。
4.1.4" 豐富遠(yuǎn)程教育輔助工具
虛擬數(shù)字人在遠(yuǎn)程教育中能夠扮演重要的角色,相較于傳統(tǒng)的教育模式,通過(guò)互聯(lián)網(wǎng)技術(shù)以及與虛擬數(shù)字人的互動(dòng),學(xué)習(xí)者能夠隨時(shí)隨地與教育者進(jìn)行交流和學(xué)習(xí)。老師面對(duì)面或者通過(guò)錄制的網(wǎng)課上課,受限于人的休息時(shí)間,如果不是老師一對(duì)一的連線則很難實(shí)現(xiàn)互動(dòng)式的體驗(yàn),而虛擬數(shù)字人則可不受時(shí)間與空間的限制,更加靈活可以實(shí)現(xiàn)遠(yuǎn)程實(shí)驗(yàn)、遠(yuǎn)程講解等教學(xué)活動(dòng),真正做到想學(xué)就學(xué),大大拓展了教育的邊界。
數(shù)字人支持的多模態(tài)智慧課堂可以實(shí)現(xiàn)軟件和硬件之間的無(wú)縫互聯(lián),人與數(shù)字人進(jìn)行實(shí)時(shí)互動(dòng),為學(xué)生提供沉浸式的智慧學(xué)習(xí)體驗(yàn),學(xué)生可以獲得大量的學(xué)習(xí)機(jī)會(huì)[22]。
4.2" 虛擬數(shù)字人在教學(xué)輔助中的創(chuàng)新應(yīng)用案例
虛擬數(shù)字人能夠增強(qiáng)教學(xué)互動(dòng)性,提高學(xué)生參與度,提供個(gè)性化學(xué)習(xí)體驗(yàn),推動(dòng)教育模式的創(chuàng)新與發(fā)展。虛擬現(xiàn)實(shí)教室更是超越了傳統(tǒng)教室的邊界,能以傳統(tǒng)課堂無(wú)法實(shí)現(xiàn)的方式豐富學(xué)生的學(xué)習(xí)體驗(yàn)。
在佐治亞州亞特蘭大市的莫爾豪斯學(xué)院(Morehouse College),生物課上學(xué)生們可以和教授一起站在虛擬教室里,手拿一個(gè)真人大小的分子,解構(gòu)并重建它,而不是以傳統(tǒng)學(xué)習(xí)方式在一本書里或在2D視頻中觀看復(fù)雜的分子結(jié)構(gòu)[23]。學(xué)生們可以利用虛擬現(xiàn)實(shí)技術(shù),通過(guò)3D模型的方式來(lái)觀察和操作一個(gè)放大的DNA鏈,直觀地理解其結(jié)構(gòu)和功能,并進(jìn)行分子結(jié)構(gòu)的拆解和組裝,從而更深入地理解生命科學(xué)的基本原理,如圖13[23]所示:
利用虛擬數(shù)字人技術(shù)可輕松復(fù)刻教師的形象、聲音、動(dòng)作或者打造一個(gè)學(xué)生更感興趣的虛擬形象,輸入準(zhǔn)備好的腳本文案,即可生成一條數(shù)字人教學(xué)視頻,大幅提升短視頻內(nèi)容制作的效率,有效滿足教培機(jī)構(gòu)對(duì)大量課程的需求[24],可根據(jù)學(xué)生的需求,生成虛擬教師+虛擬場(chǎng)景、虛擬教師+真實(shí)場(chǎng)景或真人教師+虛擬場(chǎng)景,數(shù)字人的應(yīng)用能有效縮短教學(xué)視頻的生成周期與成本。
4.3" 虛擬數(shù)字人在教學(xué)效果評(píng)估與學(xué)生學(xué)習(xí)體驗(yàn)方面的研究
廣州番禺職業(yè)技術(shù)學(xué)院智慧職業(yè)教育大數(shù)據(jù)工程技術(shù)研究中心通過(guò)數(shù)據(jù)采集和處理、行為分析、主題相關(guān)性評(píng)估、結(jié)果排名和反饋,開發(fā)出了AI智能助教“番番”,在《人工智能導(dǎo)論》課程中展示出了卓越的應(yīng)用效果[25]。教師可以通過(guò)“番番”發(fā)布討論主題,學(xué)生則可以通過(guò)語(yǔ)音參與討論,同時(shí),討論的內(nèi)容會(huì)實(shí)時(shí)顯示在教室的大屏幕上,見圖14[25]。這套系統(tǒng)的特點(diǎn)是利用人工智能技術(shù)對(duì)學(xué)生的行為、語(yǔ)言進(jìn)行智能分析,能夠提取討論的高頻詞匯,評(píng)估主題的相關(guān)性,并對(duì)討論結(jié)果進(jìn)行排名。智能分析的功能使得教師能夠更好地了解學(xué)生的討論行為和表達(dá),從而更有針對(duì)性地提供指導(dǎo)和反饋。此外,學(xué)生之間的互動(dòng)也得到了增強(qiáng),他們可以更好地交流和分享觀點(diǎn),促進(jìn)學(xué)習(xí)的合作和共同進(jìn)步。通過(guò)引入虛擬數(shù)字人技術(shù),高職學(xué)校教學(xué)模式得到了創(chuàng)新和改進(jìn),這一研究成果也展示了人工智能在教育領(lǐng)域的巨大潛力。
由此可見,虛擬教師能夠與學(xué)生進(jìn)行實(shí)時(shí)互動(dòng),回答學(xué)生的問(wèn)題,并根據(jù)學(xué)生的反饋調(diào)整教學(xué)內(nèi)容和方法。這種互動(dòng)性大大提高了教學(xué)效果,使學(xué)生更容易理解復(fù)雜的概念,同時(shí),通過(guò)虛擬實(shí)驗(yàn)室和互動(dòng)教學(xué),學(xué)生可以親身參與實(shí)驗(yàn)和探索,他們的參與度和學(xué)習(xí)興趣得到了極大的提高。這些結(jié)論和建議具有普適性和可操作性,對(duì)于推動(dòng)虛擬數(shù)字人在教學(xué)中的應(yīng)用和發(fā)展具有重要指導(dǎo)意義。
5" 挑戰(zhàn)與未來(lái)展望/Challenges and Future Prospects
5.1" 智能技術(shù)和資源儲(chǔ)備挑戰(zhàn)
5.1.1" 圖形和動(dòng)畫技術(shù)
使用先進(jìn)的圖形渲染技術(shù)和動(dòng)畫技術(shù),以增強(qiáng)虛擬數(shù)字人的視覺效果和逼真度。數(shù)字人雖然外表像人,但是其內(nèi)核遠(yuǎn)還沒(méi)有達(dá)到一個(gè)真人的狀態(tài),或者說(shuō)接近真人的狀態(tài)。比如數(shù)字人在自己的表情管理、感知互動(dòng)上,其實(shí)還缺乏很多的親和力。這個(gè)過(guò)程首先需要?jiǎng)?chuàng)建一個(gè)三維模型來(lái)表示虛擬數(shù)字人的外觀,建模師需要具備良好的藝術(shù)感和對(duì)細(xì)節(jié)的關(guān)注,以確保模型看起來(lái)逼真且符合設(shè)計(jì)要求。
5.1.2" 語(yǔ)音特征深度學(xué)習(xí)技術(shù)
包含語(yǔ)言合成與識(shí)別技術(shù),以捕捉和模擬人類的聲音,優(yōu)質(zhì)的語(yǔ)音合成技術(shù),使虛擬數(shù)字人的語(yǔ)音聽起來(lái)更加真實(shí),并且能夠準(zhǔn)確識(shí)別和理解用戶的語(yǔ)音指令和問(wèn)題。這個(gè)過(guò)程的實(shí)現(xiàn)需要大量的數(shù)據(jù)和計(jì)算資源以及對(duì)人類行為和情感的深入了解。
5.1.3" 交互和智能技術(shù)
為了讓虛擬數(shù)字人與用戶進(jìn)行自然互動(dòng),需要為其添加交互和智能功能。這包括自然語(yǔ)言處理、情感分析等技術(shù)。此外,還需要為虛擬數(shù)字人配置個(gè)性化的推薦和服務(wù)功能,以滿足用戶的需求。虛擬數(shù)字人技術(shù)的開發(fā)需要對(duì)人工智能和機(jī)器學(xué)習(xí)有深入的理解,以及對(duì)用戶需求和行為模式的準(zhǔn)確把握。
5.1.4" 認(rèn)知建模和學(xué)習(xí)算法
利用認(rèn)知建模技術(shù)和機(jī)器學(xué)習(xí)算法,使虛擬數(shù)字人能夠不斷學(xué)習(xí)和改進(jìn)自己的表現(xiàn)。這包括通過(guò)分析用戶的反饋和行為數(shù)據(jù),調(diào)整虛擬數(shù)字人的表現(xiàn)方式,并提供更好的教學(xué)和科普體驗(yàn)。
5.1.5" 大語(yǔ)言模型LLM技術(shù)
眾所周知,ChatGPT背后的技術(shù)是大型語(yǔ)言模型(Large Language Model,LLM)的應(yīng)用。ChatGPT把各種形式的文本,包括自然語(yǔ)言、程序代碼和數(shù)字拆解成基本的文本建構(gòu)塊,叫做Token,然后以Token作為基本單位來(lái)進(jìn)行大規(guī)模文本數(shù)據(jù)的訓(xùn)練和生成,而2024年初備受關(guān)注的Sora則是把不同形式的視頻和圖像拆解成一個(gè)個(gè)小的圖像塊,叫做Visual Patch,然后以Visual Patch圖像塊為基本單位,來(lái)進(jìn)行大規(guī)模視頻數(shù)據(jù)的訓(xùn)練和生成。這給虛擬數(shù)字人在教育領(lǐng)域的垂直應(yīng)用提供了啟示,那就是在創(chuàng)建豐富多樣的教學(xué)資源視頻數(shù)據(jù)(包括視聽類教材、教師講授視頻、模擬實(shí)驗(yàn)、互動(dòng)演示、多媒體資料等)時(shí),可以將其拆解成一個(gè)個(gè)小的教育資源圖像塊,以提升資源的靈活性和可擴(kuò)展性。換而言之,Sora是一個(gè)視覺數(shù)據(jù)的通用模型,可以生成不同時(shí)長(zhǎng)、不同長(zhǎng)寬比尺寸和不同分辨率的視頻和圖像,正是這種靈活性使得OpenAI能夠?qū)⑺蓄愋偷囊曈X數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一的表達(dá)方法,從而使得他們能夠使用網(wǎng)絡(luò)上海量的視頻數(shù)據(jù)去大規(guī)模訓(xùn)練Sora,這種多樣化和靈活性為Sora成為通用物理模擬器奠定基礎(chǔ)。
5.1.6" 算力背后的核心技術(shù)
未來(lái)我們想要開發(fā)更強(qiáng)大的物理和數(shù)字世界的模擬器,那么需要繼續(xù)擴(kuò)大視頻AI模型的訓(xùn)練規(guī)模,而擴(kuò)大視頻AI的訓(xùn)練規(guī)模,則要求我們用更海量的視頻數(shù)據(jù)去訓(xùn)練AI,也意味著需要更多的算力,而算力背后是高性能處理器芯片,這也是眾所周知我國(guó)被“卡脖子”的地方。多模態(tài)模型的爆發(fā)、視頻數(shù)據(jù)的生成和調(diào)用,對(duì)集群通信延遲和帶寬的要求更高,包括降低IT設(shè)備空間占有率、節(jié)能減碳等問(wèn)題,都亟需在國(guó)內(nèi)大模型研發(fā)應(yīng)用加快、智算需求提升之際進(jìn)行統(tǒng)一規(guī)劃設(shè)計(jì)。
5.2" 未來(lái)展望
為了提升用戶體驗(yàn)并促進(jìn)知識(shí)傳播和教育效果的進(jìn)一步改善,虛擬數(shù)字人項(xiàng)目實(shí)施進(jìn)度需要進(jìn)一步加快,虛擬數(shù)字人的逼真度和情感表達(dá)能力也需要進(jìn)一步增強(qiáng),以提升用戶的沉浸感和互動(dòng)體驗(yàn)。
虛擬數(shù)字人技術(shù)是一種重要的工具,可以在科普與教學(xué)中提供以人為中心的學(xué)習(xí)體驗(yàn),尤其在個(gè)性化學(xué)習(xí)、多模態(tài)人機(jī)交互、全自主內(nèi)容生成與更新、情感智能化反饋方面有著顯而易見的優(yōu)勢(shì),在與虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)、大語(yǔ)言模型(LLM)等技術(shù)結(jié)合之后,可以創(chuàng)建出更加沉浸式和互動(dòng)性強(qiáng)的學(xué)習(xí)環(huán)境。在享受虛擬世界帶來(lái)的便利和樂(lè)趣的同時(shí),我們也要保持清醒,避免過(guò)度沉迷,防止弱化人的身體知能。此外,盲目擴(kuò)大數(shù)據(jù)采集會(huì)加劇隱私泄露風(fēng)險(xiǎn),因此需要謹(jǐn)慎對(duì)待。在追求應(yīng)用成效的同時(shí),也不能忽略技術(shù)自身的特性,避免過(guò)度超前[26]。通過(guò)不斷的研究和創(chuàng)新,可以進(jìn)一步推動(dòng)虛擬數(shù)字人技術(shù)在科普與教學(xué)中的發(fā)展,提高學(xué)生的學(xué)習(xí)效果,并增加學(xué)習(xí)樂(lè)趣。
參考文獻(xiàn)/References:
[1] 國(guó)務(wù)院.國(guó)務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知[EB/OL]. [2024-01-17]. https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm. (THE STATE COUNCIL. Notice of the State Council on issuing the development plan for the new generation of artificial intelligence[EB/OL]. [2024-01-17]. https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.)
[2] 國(guó)務(wù)院.國(guó)務(wù)院關(guān)于印發(fā)“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃的通知[EB/OL]. [2024-01-17]. https://www.gov.cn/zhengce/zhengceku/2022-01/12/content_5667817.htm. (THE STATE COUNCIL. Notice of the State Council on issuing the 14th Five Year Plan for the development of the digital economy[EB/OL]. [2024-01-17]. https://www.gov.cn/zhengce/zhengceku/2022-01/12/content_5667817.htm.)
[3] 中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟總體組.中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟: 2020年虛擬數(shù)字人發(fā)展白皮書[EB/OL]. [2024-01-17]. https://www.xdyanbao.com/doc/j54usk9nh8?bd_vid=4012100276967770546. (Overall group of China artificial intelligence industry development alliance. China artificial intelligence industry development alliance: 2020 white paper on the development of virtual digital humans[EB/OL]. [2024-01-17]. https://www.xdyanbao.com/doc/j54usk9nh8?bd_vid=4012100276967770546.)
[4] 郭全中.虛擬數(shù)字人發(fā)展的現(xiàn)狀、關(guān)鍵與未來(lái)[J]. 新聞與寫作, 2022(7): 56-64. (GUO Q Z. The current status, key points, and future of the development of virtual digital humans[J]. News and writing, 2022(7): 56-64.)
[5] 蔡雨坤, 陳禹堯. 取“人”之長(zhǎng): 虛擬數(shù)字人在科普中的應(yīng)用研究[J]. 科普研究, 2023, 18(4): 26-34. (CAI Y K, CHEN Y Y. Taking advantage of ‘human’ strengths: research on the application of virtual digital humans in science popularization[J]. Studies on science popularization, 2023, 18(4): 26-34.)
[6] 王玄玄.虛擬數(shù)字人在微課教學(xué)中的應(yīng)用研究[J]. 工程技術(shù)研究, 2023, 8(21): 155-157. (WANG X X. Research on the application of virtual digital human in microlecture teaching[J]. Engineering and technological research, 2023, 8(21): 155-157.)
[7] 網(wǎng)經(jīng)社.量子位:《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》[EB/OL]. [2024-02-02]. https://www.100ec.cn/index.php/detail--6604822.html. (100EC.Quantum Bit: 2021 virtual digital human deep industry report[EB/OL]. [2024-02-02]. https://www.100ec.cn/index.php/detail--6604822.html.)
[8] Fortnite and Travis Scott present: astronomical[EB/OL]. [2024-07-30]. https://www.fortnite.com/news/astronomical.
[9] 深科技.午夜過(guò)后AI主播上線: 一公司生成40萬(wàn)個(gè)虛擬主播, 稱將打造1億AI主播[EB/OL]. [2024-07-27]. https://zhuanlan.zhihu.com/p/662850582. (DeepTech. After midnight, AI anchors go online: a company generates 400000 virtual anchors and claims to create 100 million AI anchors[EB/OL]. [2024-07-27]. https://zhuanlan.zhihu.com/p/662850582.)
[10] 青島發(fā)布. 實(shí)地探訪: 眾多高質(zhì)量影視劇紛紛選擇東方影都背后的原因[EB/OL]. [2024-07-27]. https://mp.weixin.qq.com/s?__biz=MzA5MjEwNjExMQ==amp;mid=2651694763amp;idx=1amp;sn=c1daf6a96269bb16e0c6c72aa8f0c32eamp;chksm=8b8b3abbbcfcb3ad3cbdbde901c785626f261a2c40f7850449a7089186984655894ffa092f53amp;scene=27. (Qingdao releases. Field visit: reasons behind numerous high-quality films and TV dramas choosing oriental movie city[EB/OL]. [2024-07-27]. https://mp.weixin.qq.com/s?__biz=MzA5MjEwNjExMQ==amp;mid=2651694763amp;idx=1amp;sn=c1daf6a96269bb16e0c6c72aa8f0c32eamp;chksm=8b8b3abbbcfcb3ad3cbdbde901c785626f261a2c40f7850449a7089186984655894ffa092f53amp;scene=27.)
[11] The latest from Snap AR[EB/OL]. [2024-07-30]. https://ar.snap.com/?utm_source=forbusiness_snapchat_comamp;utm_medium=referralamp;utm_content=global_nav_itemamp;utm_campaign=universal_navigationamp;lang=en-US.
[12] 新浪財(cái)經(jīng). 文旅數(shù)字人推動(dòng)城市IP破屏出圈, 虛擬數(shù)字人賦能多元化數(shù)字文旅體驗(yàn)[EB/OL]. [2024-07-27]. https://baijiahao.baidu.com/s?id=1798477106474616047amp;wfr=spideramp;for=pc. ( Sina finance.Digital talents in cultural and tourism drive the breakthrough of urban IP, while virtual digital talents empower diversified digital cultural and tourism experiences[EB/OL]. [2024-07-27]. https://baijiahao.baidu.com/s?id=1798477106474616047amp;wfr=spideramp;for=pc.)
[13] 世優(yōu)科技. AI數(shù)字人引領(lǐng)金融行業(yè)數(shù)字化變革, 數(shù)字人一體機(jī)助力銀行體驗(yàn)創(chuàng)新[EB/OL]. [2024-07-27]. https://www.sohu.com/a/748087045_121323274. (Shiyou Technology.AI digital humans lead the digital transformation of the financial industry, and digital all-in-one machines help banks experience innovation[EB/OL]. [2024-07-27]. https://www.sohu.com/a/748087045_121323274.)
[14] 河北網(wǎng)絡(luò)廣播電視臺(tái). AI數(shù)字人帶你解讀最高法院工作報(bào)告——百度打造政府工作報(bào)告解讀新范式[EB/OL]. [2024-07-27]. https://www.zhonghongwang.com/show-140-267115-1.html. (Hebei network radio and television station. AI digital person takes you to interpret the Supreme Court’s work report - Baidu creates a new paradigm for interpreting government work reports[EB/OL]. [2024-07-27]. https://www.zhonghongwang.com/show-140-267115-1.html.)
[15] 中國(guó)科協(xié)網(wǎng). 中國(guó)科協(xié)辦公廳關(guān)于對(duì)2022年表現(xiàn)突出的科普中國(guó)信息員組織單位予以工作表?yè)P(yáng)的通知[EB/OL]. [2024-02-20]. https://baijiahao.baidu.com/s?id=1758993026723936768amp;wfr=spideramp;for=pc. (China association for science and technology network. Notice from the general office of the China association for science and technology on commending the outstanding performance of science popularization Chinese information officers organizing units in 2022[EB/OL]. [2024-02-20]. https://baijiahao.baidu.com/s?id=1758993026723936768amp;wfr=spideramp;for=pc.)
[16] 澎湃. 亮相冬奧會(huì)完成全民科普, 風(fēng)口飛了一年的數(shù)字人如何照進(jìn)現(xiàn)實(shí)[EB/OL]. [2024-02-20]. https://m.thepaper.cn/baijiahao_16750596. (The Paper. Appearing at the Winter Olympics to complete nationwide science popularization, how digital people who have been popular for a year can be brought into reality[EB/OL]. [2024-02-20]. https://m.thepaper.cn/baijiahao_16750596.)
[17] 蔡雨坤, 顏燕. 虛擬數(shù)字人做科普值得推廣[EB/OL]. [2024-02-19]. https://baijiahao.baidu.com/s?id=1781496777367485440amp;wfr=spideramp;for=pc. (CAI Y K, YAN Y. Virtual digital humans for science popularization are worth promoting[EB/OL]. [2024-02-19]. https://baijiahao.baidu.com/s?id=1781496777367485440amp;wfr=spideramp;for=pc.)
[18] 新智元. Sora不懂物理世界, 翻車神圖全網(wǎng)爆笑![EB/OL]. [2024-02-20]. https://mp.weixin.qq.com/s/mbT7O3HfVzSkGKai3pQu2Q. (AI-era.Sora doesn’t understand the physical world, funny pictures are hilarious all over the internet![EB/OL]. [2024-02-20]. https://mp.weixin.qq.com/s/mbT7O3HfVzSkGKai3pQu2Q.)
[19] 單行科技. 錢學(xué)森AI數(shù)字人亮相, “商湯如影”為航天科普事業(yè)添“AI意”[EB/OL]. [2024-02-19]. https://zhuanlan.zhihu.com/p/678064537. (Single line technology. Qian Xuesen’s AI digital figure makes its debut, adding “AI meaning” to the aerospace science popularization industry by “SenseAvatar”[EB/OL]. [2024-02-19]. https://zhuanlan.zhihu.com/p/678064537.)
[20] 魯力立, 陸怡婕, 許鑫.寓教于樂(lè):元宇宙視角下口頭文學(xué)類非遺的科普VR設(shè)計(jì)[J]. 圖書館論壇, 2023, 43(2): 141-149. (LU L L, LU Y J, XU XPopular science VR design of oral intangible cultural heritage from the perspective of metaverse[J]. Library tribune, 2023, 43(2): 141-149.)
[21] 宋天驕.世界首位數(shù)字虛擬教師現(xiàn)身新西蘭校園[J]. 甘肅教育, 2018(21): 128. (SONG T J. World’s first digital virtual teacher appears on New Zealand campus[J]. Gansu education, 2018(21): 128.)
[22]婁方園, 齊夢(mèng)娜, 王竹新, 等.元宇宙場(chǎng)域下的教育數(shù)字人及其應(yīng)用[J]. 圖書館論壇, 2023, 43(3): 101-108. (LOU F Y, QI M N, WANG Z X, et al. Educational Digital human and its application in the field of metaverse[J]. Library tribune, 2023, 43(3): 101-108.)
[23] 維克多.元宇宙大學(xué)悄然興起——2D在線教育或被3D虛擬現(xiàn)實(shí)教育取代[EB/OL]. [2024-02-19]. https://new.qq.com/rain/a/20221025A04R7T00. (WEI K D. The rise of metaverse universities quietly -2D online education may be replaced by 3D virtual reality education[EB/OL]. [2024-02-19]. https://new.qq.com/rain/a/20221025A04R7T00.)
[24] 世優(yōu)科技. AI數(shù)字人在教育領(lǐng)域有哪些應(yīng)用?數(shù)字人對(duì)教育行業(yè)帶來(lái)哪些變革?[EB/OL]. [2024-02-19]. https://learning.sohu.com/a/731188452_121323274. (Shiyou Technology. What are the applications of AI digital humans in the field of education? what changes will digital humans bring to the education industry?[EB/OL]. [2024-02-19]. https://learning.sohu.com/a/731188452_121323274.)
[25] 黃國(guó)榮.虛擬數(shù)字人在高職教育中的應(yīng)用.[J]. 數(shù)字技術(shù)與應(yīng)用, 2024, (1): 42-44. (HUANG G R. The Application of virtual digital human in vocational education[J]. Digital technology amp; application, 2024, (1): 42-44.)
[26] 顧小清, 宛平, 王龔.教育元宇宙:讓每一個(gè)學(xué)習(xí)者成為主角[J]. 華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版), 2023, 41(11): 13-26. (GU X Q, WAN P, WANG G. Metaverse in education: position every child real experience in the new world[J]. Journal of East China Normal University(educational sciences), 2023, 41(11): 13-26.)
Application Research and Scenario Analysis of Virtual Digital Humans in Science Popularization and Teaching
Han Jing
The Institute of Scientific and Technical Information of China, Beijing 100038
Abstract: [Purpose/Significance] By analyzing the application scenarios of virtual digital human technology, we aim to further explore its innovative potential in science popularization and teaching, in order to provide new solutions for digital education and knowledge popularization. [Method/Process] Systematically review virtual digital humans’ technical principles and key technologies, use case analysis to explore their cutting-edge applications and practical research in segmented fields, and empirically demonstrate the potential of virtual digital humans in science popularization and teaching. [Result/Conclusion] Virtual digital humans, as a new medium, can lead the innovative expression of popular science content and achieve a more immersive and participatory teaching experience with their high degree of anthropomorphism and interactivity. The current challenges come from graphics and animation technology, deep learning technology for speech features, interactive and intelligent technology, cognitive modeling and learning algorithms, LLM technology for large language models, and the core technologies behind computing power.
Keywords: virtual digital human" " science popularization" " teaching" " computer graphics" " " artificial intelligence" " virtual reality
Author(s): Han Jing, librarian, master, E-mail: 1509213084@qq.com.
Received: 2024-05-12" " Published: 2024-09-30