摘要:隨著人工智能算法、算力、算據(jù)的加速發(fā)展,AIGC正成為數(shù)智時代背景下重要的內(nèi)容生產(chǎn)模式。2023年4月,“AI孫燕姿”的爆火意味著人工智能技術(shù)向音樂領(lǐng)域進一步滲透。在人工智能時代,AIGC生產(chǎn)中用戶角色、行為與情感實踐均發(fā)生了變化。AIGC賦權(quán)用戶,極大地降低了內(nèi)容生成的技術(shù)門檻,內(nèi)容分發(fā)呈現(xiàn)個性化與智能化的特點。同時,在AIGC加速發(fā)展的浪潮下,用戶研究范式從關(guān)注用戶開始轉(zhuǎn)向人智交互方向。
文章基于人智交互的研究視角,對AIGC創(chuàng)作背景下的用戶特征進行總結(jié),并探討用戶對AI主體性感知和感受性感知特點。在此基礎(chǔ)上,深入分析“AI孫燕姿”爆火的原因。通過用戶研究發(fā)現(xiàn),AI歌手所具備的極強擬人性、易用性和易掌控性,是促使其爆紅的三個關(guān)鍵因素。
同時,文章從情感實踐的視角出發(fā),探究用戶與AI歌手之間的情感互動。一方面,AI歌手的擬人性極大地提升了用戶的人智交互體驗,構(gòu)筑了用戶與不同AI歌手之間獨特的情感意義空間;另一方面,人機之間構(gòu)筑的虛擬情感聯(lián)結(jié)呈現(xiàn)出脆弱性和不穩(wěn)定性的特征,人類對于算法的認知解釋存在算法偏見,導(dǎo)致AI歌手的瑕疵極易引發(fā)用戶的算法厭惡。最后,文章對AI歌手背后所存在的法律問題和倫理隱憂進行了探討,并提出以人本人工智能為核心理念的發(fā)展建議,堅持以人為本,為人所用。
關(guān)鍵詞:人工智能生成內(nèi)容;人智交互;AI歌手;用戶特征;情感實踐
中圖分類號:TP18文獻標志碼:A文章編號:1674-8883(2024)20-0022-05
2022年被認為是人工智能生產(chǎn)內(nèi)容AIGC(ArtificialIntelligentGeneratedContent)爆發(fā)元年。2022年人工智能繪畫(以下簡稱“AI繪圖”)席卷網(wǎng)絡(luò),設(shè)計師杰森·艾倫的獨立實驗室發(fā)布了與其同名的圖像生成模型Midjournery。模型生成的圖片《太空歌劇院》在科羅拉多州的藝術(shù)展上脫穎而出,榮膺最高榮譽。由此他發(fā)出感慨——“藝術(shù)已死”,引發(fā)熱議。類似AI繪圖開源創(chuàng)作工具還有StableDiffusion、OpenAI等,一系列AI繪圖模型的誕生和廣泛應(yīng)用,證明了隨著人工智能算法、算力、算據(jù)的加速發(fā)展,AIGC正成為數(shù)智時代背景下重要的內(nèi)容生產(chǎn)模式[1]。
2023年上半年,“AI孫燕姿”(ArtificialIntelligence)在網(wǎng)絡(luò)上爆火,在B站和抖音等多個平臺引發(fā)熱議。截至7月初,由B站用戶“陳墨瞳1995”發(fā)布的“AI孫燕姿”翻唱歌曲《發(fā)如雪》的視頻播放量已經(jīng)突破200萬,多個由“AI孫燕姿”演繹的翻唱作品視頻播放量突破百萬。
順應(yīng)AIGC創(chuàng)作浪潮席卷而來的AI歌手讓人們看到了一種具有生命力和想象力的全新音樂生態(tài)。部分歌迷認為AI孫燕姿等AI歌手將他們帶回了記憶中那個群星璀璨的華語樂壇,彌補了遺憾。但也有人質(zhì)疑AI歌手的演唱毫無靈魂,同時還侵犯了歌手本人的知識產(chǎn)權(quán)。目前,AI歌手與真正的音樂人之間的邊界和版權(quán)劃分尚不清晰,平臺審核規(guī)則也并不明確。在“AI孫燕姿”爆火并引發(fā)爭議之后,不少創(chuàng)作者也悄然刪除了平臺上多個播放量破百萬的視頻。
在人工智能時代,AIGC生產(chǎn)中用戶角色、行為與情感實踐均發(fā)生了變化,用戶研究范式也從關(guān)注用戶本身向人智交互的方向發(fā)展[2]。本文以“AI孫燕姿”為研究對象,基于人智交互研究視角,從用戶特征維度出發(fā)對“AI孫燕姿”爆火的原因進行探析,發(fā)掘AI歌手與用戶之間的情感互動實踐,同時針對AI歌手所面臨的爭議以及困境提出應(yīng)對的策略思考。
“AI孫燕姿”的橫空出世,究其根本,是人工智能技術(shù)向音樂領(lǐng)域的滲透。實際上,在“AI孫燕姿”爆火之前,網(wǎng)絡(luò)上就已經(jīng)有不少創(chuàng)作者使用AI算法工具創(chuàng)作了“AI周杰倫”“AI陳奕迅”等AI歌手,并發(fā)布了相關(guān)的翻唱視頻,但最終的呈現(xiàn)效果以及熱度都不如“AI孫燕姿”。AI歌手的生成效果因人而異,歸根結(jié)底是由后臺的算法側(cè)重所決定的。
創(chuàng)作“AI孫燕姿”的核心技術(shù)來自so-vitssvc開源軟件制作的Sovits4.0歌聲轉(zhuǎn)換模型。歌聲轉(zhuǎn)換模型通過內(nèi)容編碼器提取歌曲的音調(diào)、音高等特征,將每段音頻做成幾秒到幾十秒不等的片段,再輸入算法拾取翻唱者的聲音數(shù)據(jù)與歌曲切片對應(yīng),加上后期優(yōu)化即可生成一首AI翻唱歌曲。
概括地說,就是用一個音色替換另外一個音色,并選擇性保留了原唱歌手的語氣、唱腔等細節(jié),達到宛如真人翻唱的逼真效果。
so-vits-svc升級迭代至今已發(fā)展到Sovits4.0版本,其已經(jīng)可以僅憑數(shù)段由軟件處理的原聲音生成目標音色的音頻,滿足使用者定制歌曲的音色和曲目需求。得益于開源軟件的支持,AI歌手創(chuàng)作的技術(shù)門檻較低,哪怕是技術(shù)小白也能在短時間內(nèi)學(xué)習(xí)并完成定制化的AI歌手模型生成與歌曲創(chuàng)作。
隨著互聯(lián)網(wǎng)形態(tài)演化和人工智能技術(shù)發(fā)展,AIGC進入加速發(fā)展階段,對比貫穿Web2.0時代的PGC(ProfessionalGeneratedContent,專業(yè)生產(chǎn)內(nèi)容)和UGC(UserGeneratedContent,用戶生產(chǎn)內(nèi)容)創(chuàng)作模式,AIGC的出現(xiàn)使內(nèi)容生成力呈指數(shù)級上升。AIGC憑借其大規(guī)模、高質(zhì)量和低成本的內(nèi)容生產(chǎn)特點,有望成為未來Web3.0元宇宙場景下主導(dǎo)性的內(nèi)容生成范式[3]。
同時,AIGC技術(shù)特征所指向的另一個大方向就是人智交互。作為一種人機協(xié)同參與的數(shù)字內(nèi)容生成方式,AIGC打破了人、機器與信息資源之間的邊界,重塑了內(nèi)容生成的全鏈條。在內(nèi)容生成方面,AIGC賦權(quán)公眾其強大的數(shù)據(jù)檢索、集成、分析與自主生成能力,極大地降低了專業(yè)內(nèi)容生成的技術(shù)門檻,推動了內(nèi)容生產(chǎn)的平民化和民主化[4]。在內(nèi)容傳播與分配的階段,個性化定制策略與智能化推介機制逐漸占據(jù)核心地位。AIGC憑借其強大的內(nèi)容生成能力,快速產(chǎn)出定制化內(nèi)容,進而實現(xiàn)內(nèi)容與目標受眾群體之間的高度匹配[5]。
有學(xué)者認為,人智交互與人機交互的核心區(qū)別在于,用戶的交互對象由傳統(tǒng)的計算機信息系統(tǒng)變更為先進的AI系統(tǒng),并據(jù)此構(gòu)建了人本導(dǎo)向的人智交互研究框架[6]51。而無論是人機交互還是人智交互,本質(zhì)上都是將算法視為傳播主體,關(guān)注人與技術(shù)的交流與互動,以及對個人、社會和技術(shù)發(fā)展所產(chǎn)生的影響。
阿爾法圍棋(AlphaGo)擊敗人類職業(yè)圍棋手時,人們還篤定人工智能不過是人類指令的執(zhí)行者,AI無法在藝術(shù)等人文領(lǐng)域擊敗人類的思想和創(chuàng)作力。時過境遷,目前AI已經(jīng)全方面滲透繪畫、音樂等人文藝術(shù)領(lǐng)域,并以驚人的速度迭代升級。2023年6月中國傳媒大學(xué)新媒體研究院與新浪AI媒體研究院發(fā)布的《2023年中國AIGC行業(yè)用戶態(tài)度觀察》顯示,超四成人對于AIGC可自動完成大量內(nèi)容創(chuàng)作任務(wù),并且可快速學(xué)習(xí)和迭代生成內(nèi)容的能力表示認可或者非常認可。人們對于AIGC生產(chǎn)的內(nèi)容開始從不屑走向接受,甚至引發(fā)了對于AI創(chuàng)作能力的恐慌。
“AI孫燕姿”的爆火并不是AI在音頻創(chuàng)作領(lǐng)域的唯一佳績,據(jù)喜馬拉雅發(fā)布的《2022年原創(chuàng)內(nèi)容生態(tài)報告》,由AIGC完成的“單田芳聲音重現(xiàn)”系列專輯,在2022年總播放量就已經(jīng)超過1億次。AIGC所生產(chǎn)的內(nèi)容逐漸被人們接受和喜愛。
基于以往的人智交互體驗研究視角,所探討的用戶特征大致可以歸納為兩大范疇。一是用戶個體的固有屬性特征,二是用戶與AI接觸互動后所形成的感知評價。用戶對于人工智能的感知可進一步細化為主體性感知和感受性感知[7]。具體包括以下15個用戶特征維度:性別、性格、倫理或政治意識、自主性、使用動機、個人狀態(tài)、專業(yè)能力或知識、信心、社會支持、認知臨場感、掌控感、AI算法規(guī)范感知、AI擬人化感知、AI價值觀評價和AI易用性評價[6]46-48。
下文主要從用戶接觸AI后所形成的幾個感知維度出發(fā),對“AI孫燕姿”的爆火原因進行分析。
(一)AI擬人化感知
當用戶感知到AI具有擬人化特征時,人智交互體驗感會更好,進而提升用戶對AI的同理心、接納程度和信任程度。有研究認為,當人工智能具備擬人化屬性時,用戶在交互過程中更易體驗到社會臨場感。社會臨場感最早在傳播學(xué)領(lǐng)域提出,后引入人機交互領(lǐng)域,通常被界定為計算機系統(tǒng)被用戶視作“真實個體”的程度[8]。AI歌手天然具有極強的擬人性,也可以說AI歌手將擬人性作為目標進行不斷的創(chuàng)作與迭代升級?!癆I孫燕姿”能夠在一眾AI歌手中脫穎而出,不僅是因為背后歌聲轉(zhuǎn)換模型的技術(shù)升級,也與孫燕姿本人音色的獨特性密切相關(guān)。孫燕姿獨特的聲線、吐字清晰的唱法和極具特點的氣息運用等聲音特質(zhì),更容易訓(xùn)練出具有個人標識的穩(wěn)定聲音模型,也彌補了原唱歌手在唱功上的缺失?!癆I孫燕姿”翻唱的歌曲一經(jīng)推出就深受大眾喜愛,因其極為貼合孫燕姿本人的聲線,具有極強的擬人性,用戶容易對其產(chǎn)生同理心,將對本人的喜愛移情和投射到“AI孫燕姿”身上。
(二)AI易用性評價
在“AI孫燕姿”某個翻唱視頻爆火后,出于追逐流量和熱點的心理,其他視頻創(chuàng)作者自然會產(chǎn)生模仿創(chuàng)作的行為。加之創(chuàng)作“AI孫燕姿”所使用的Sovits4.0歌聲轉(zhuǎn)換模型來源于so-vits-svc開源項目,并不具有使用限制,技術(shù)門檻較低,使得短時間內(nèi)涌現(xiàn)了大量的“AI孫燕姿”翻唱視頻,并且在平臺算法推送機制下屢次登上視頻熱門榜,產(chǎn)生滾雪球效應(yīng),不斷擴大“AI孫燕姿”的傳播面與影響力。
(三)對AI的掌控感認知
掌控感指的是個體對于自身能夠施加控制或影響AI行為程度的主觀感知。用戶對AI歌手具有極強的控制權(quán)。AI歌手本質(zhì)是運用算法生成定制化音頻,以滿足用戶的個性化需求。據(jù)不完全統(tǒng)計,僅“AI孫燕姿”這一個AI歌手翻唱的歌曲已達上千首,可見AI歌手極大地滿足了用戶的個性化需求。從粉絲的心理層面上來看,對于AI歌手的掌控欲,某種程度上映射了粉絲對于真實的歌手偶像的控制欲。僅需極低的成本,就可以訓(xùn)練出自己所喜愛的歌手的AI模型,并應(yīng)用到無限的歌曲定制中。
目前,Sovits4.0歌聲轉(zhuǎn)換模型只能做到音色的替換,語氣唱腔等細節(jié)無法改變。但假以時日,這些標志著歌手個性化特征的氣息與唱腔也會被AI復(fù)制,打造出一個情感飽滿的AI歌手。
情感實踐維度是人智交互研究視角下考察人與AI關(guān)系的另一個切入點。情感實踐(emotionalpractices)源自情感史學(xué)研究領(lǐng)域,涵蓋涉及個體自我(身體和精神)、語言、物質(zhì)制品、環(huán)境互動以及與他人交往的多種實踐活動。相較于傳統(tǒng)的內(nèi)容生產(chǎn)與分發(fā)模式聚焦于信息的有效傳遞,元宇宙場景下的內(nèi)容創(chuàng)作與分發(fā)更注重用戶體驗和情感層面的互動交流[9]。有學(xué)者認為,算法的永恒在線、隨時鏈接和個性化互動反饋可以為用戶創(chuàng)造出一種“共在的情感實踐”,形成與用戶之間復(fù)雜的情感動態(tài)[10]。
在“AI本兮”的翻唱視頻中,有條令人印象深刻的彈幕:“復(fù)活吧我的愛人!”有學(xué)者認為,隨著元宇宙社會的到來,人的意識可以數(shù)據(jù)化存儲,實現(xiàn)個體生命的“不朽”與“永生”[11]。AI歌手在某種意義上讓歌手的生命在數(shù)字領(lǐng)域得以永生。
在“AI姚貝娜”翻唱視頻標題上,視頻創(chuàng)作者寫道:“我想給她完整的一生?!盇I歌手模型將已經(jīng)逝去的歌手的聲音再次帶到了喜愛他們的粉絲面前。這種可以被稱為數(shù)字哀悼的媒介實踐,從情感實踐的維度來看,用戶的情感表達和流動占據(jù)著行為和意圖的中心[12]。用戶對于AI歌手產(chǎn)生了特定的想象與心理投射,產(chǎn)生了情感寄托與慰藉的作用,構(gòu)筑了用戶與不同AI歌手之間獨特的情感意義空間。
在某種意義上,AI歌手似乎符合人本人工智能和人智交互視角下以人為本的準則規(guī)范。但實際交往中,用戶與AI之間的情感互動實踐并不是完全愉悅的。相反,人機之間構(gòu)筑的虛擬情感聯(lián)結(jié)脆弱且不穩(wěn)定。
算法厭惡是指一種人們不愿意使用或者相信算法或人工智能產(chǎn)品的傾向。有學(xué)者認為,人類對于算法錯誤呈現(xiàn)高敏感、低容忍的認知特點。當算法犯了人類預(yù)測者類似的錯誤后,相較于后者,更容易削弱人們對算法的信心水平[13]。李游等學(xué)者在對算法厭惡相關(guān)實證研究進行梳理后,將算法厭惡的發(fā)生機制概括為算法偏見機制和人類偏愛機制[14]。當AI歌手輸出的歌曲音色不夠自然或者不符合人們對其的期待時,對于真人歌手的偏愛和身體認同感,會讓用戶對AI歌手由于移情等心理作用所產(chǎn)生的濾鏡迅速幻滅并產(chǎn)生算法厭惡,不再信任AI歌手生成歌曲質(zhì)量與效果,此前人智互動間構(gòu)筑的情感橋梁也不復(fù)存在。
綜上所述,“AI孫燕姿”等AI歌手之所以能爆火,極強的擬人性是重要因素之一。換言之,AI歌手其實是用戶對于真人歌手的一種“代餐”。所謂“代餐”,是指當粉絲無法從偶像身上獲得內(nèi)容層面或精神層面的反饋時,出于情感寄托所尋求的相似物。
在虛實交融的應(yīng)用化場景下,用戶對于AI歌手的追捧更多是站在現(xiàn)實世界通過虛擬世界進行的一次情感探求,因此一旦AI歌手喪失了擬人性或真人歌手出現(xiàn),用戶對AI歌手所產(chǎn)生的情感依戀便會消失。
“AI孫燕姿”爆火后,一條“AI出來后第一個失業(yè)的是孫燕姿”的微博詞條登上了熱搜。在部分用戶將“AI孫燕姿”視為精神寄托給予正面反饋的同時,同樣有人抱有質(zhì)疑的態(tài)度,認為這象征著AI浪潮對于人類創(chuàng)作以及行業(yè)生存空間的又一次擠壓。正如孫燕姿在“AI孫燕姿”爆火后回應(yīng)中說:“你跟一個每分鐘就推出一張新專輯的人還有什么好爭的?!?/p>
與此同時,AI歌手背后所涉及的法律、倫理問題也有待解決。目前,AI歌手創(chuàng)作與真人歌手二者間的權(quán)益版圖劃分尚不明晰。以著作權(quán)法為依據(jù),上文所提及的發(fā)布“AI孫燕姿”翻唱周杰倫歌曲《發(fā)如雪》視頻的B站用戶“陳墨瞳1995”,就存在侵犯孫燕姿和周杰倫兩位相關(guān)權(quán)利人知識產(chǎn)權(quán)的法律風(fēng)險。
目前國家與平臺仍在深入探索AIGC以及人工智能的法律規(guī)定和管理辦法。2023年4月,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,同年5月抖音也發(fā)布了關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議。顯然,AIGC在內(nèi)容創(chuàng)作上的巨大潛力和產(chǎn)能給法律體系和行業(yè)規(guī)范造成了一定的沖擊。
另外,AI歌手還極有可能涉及深度偽造等信息倫理問題,AIGC強大的模仿力和逼真的擬人性使得虛假信息更加真假難辨,存在被詐騙集團利用實施詐騙的風(fēng)險。
人工智能歸根結(jié)底是人的本質(zhì)對象化。AIGC發(fā)展應(yīng)始終堅持人本主義,將人本人工智能(HumanCenteredAI)作為核心發(fā)展理念,處理好人、技術(shù)、自然與社會的關(guān)系,在機器人化與人的機器化的交融發(fā)展中真正實現(xiàn)人機共生與虛實共生[15]。未來要推進AI朝著為人服務(wù)、以人為本的方向發(fā)展,引導(dǎo)其向人類的倫理規(guī)范不斷迭代升級。在AI歌手所涉及的AIGC和音樂領(lǐng)域中,建立人工智能倫理問題多元監(jiān)督機制,進一步優(yōu)化政府監(jiān)管、行業(yè)自律、公眾監(jiān)督等多種監(jiān)督方式的分工協(xié)作機制。
國家要盡快完善對AI歌手的立法規(guī)范,明確AI歌手所涉及的版權(quán)問題以及倫理問題,防止AIGC加劇深度偽造等負面影響。與此同時,平臺應(yīng)對涉及AI創(chuàng)作生成的音樂視頻和音頻作品加強審核,對相關(guān)作品進行標簽注明,提醒用戶分辨真?zhèn)?,謹防詐騙。
在肯定AI歌手給用戶帶來的情感價值的同時,也不能忽視其背后所存在的技術(shù)風(fēng)險和倫理隱憂。面對仍處在探索階段的AIGC,在進行AI歌手的相關(guān)創(chuàng)作時,應(yīng)充分考慮其中所涉及的法律風(fēng)險,把握倫理底線,堅持人本主義,創(chuàng)作出能夠閃耀人性光輝的AIGC內(nèi)容。
參考文獻:
[1]張鈸,朱軍,蘇航.邁向第三代人工智能[J].中國科學(xué):信息科學(xué),2020,50(9):1281-1302.
[2]李白楊,白云,詹希旎,等.人工智能生成內(nèi)容(AIGC)的技術(shù)特征與形態(tài)演進[J].圖書情報知識,2023,40(1):66-74.
[3]王諾,畢學(xué)成,許鑫.先利其器:元宇宙場景下的AIGC及其GLAM應(yīng)用機遇[J].圖書館論壇,2023,43(2):117-124.
[4]王碩,閻妍.生成式人工智能時代下科技傳播的機遇與挑戰(zhàn):基于科技傳播體系的分析[J].中國科技論壇,2024(9):134-143.
[5]沈浩,任天知.智能重構(gòu)傳播生態(tài):內(nèi)容生成的范式演進與智能交互的未來構(gòu)想[J].現(xiàn)代出版,2024(7):55-63.
[6]姜婷婷,許艷閏,傅詩婷,等.人智交互體驗研究:為人本人工智能發(fā)展注入新動力[J].圖書情報知識,2022,39(4):51,46-48.
[7]張妍,趙宇翔,吳大偉,等.人智交互情境中用戶對生成式人工智能的心智感知及反應(yīng)研究[J].情報理論與實踐,2024,47(8):140-149.
[8]鄧俊,易欣妍,傅詩婷.社交機器人如何提升用戶社會臨場感?表情包情感效價在人智對話交互中的作用[J].圖書情報知識,2023,40(2):29-39.
[9]王諾,畢學(xué)成,許鑫.先利其器:元宇宙場景下的AIGC及其GLAM應(yīng)用機遇[J].圖書館論壇,2023,43(2):117-124.
[10]皇甫博媛.“算法冒犯我”:用戶與算法的情感實踐及其自主性[J].新聞大學(xué),2023(2):16-27,117-118.
[11]呂鵬.元宇宙技術(shù)與人類“數(shù)字永生”[J].人民論壇,2022(7):21-25.
[12]自國天然.情之所向:數(shù)字媒介實踐的情感維度[J].新聞記者,2020(5):41-49.
[13]李游,梁哲浩,常亞平.用戶對人工智能產(chǎn)品的算法厭惡研究述評及展望[J].管理學(xué)報,2022,19(11):1725-1732.
[14]杜嚴勇.厭惡算法還是欣賞算法?:人工智能時代的算法認知差異與算法信任建構(gòu)[J].哲學(xué)分析,2022,13(3):151-165,199.
[15]周玄,趙建超.人工智能的倫理困境與正向規(guī)約[J].江西社會科學(xué),2022,42(10):37-43.
作者簡介潘水一,研究方向:媒體融合與文化傳播。