王朝洋
(作者單位:黑龍江大學新聞傳播學院)
數(shù)字技術的發(fā)展正逐漸改變著人們?nèi)粘I畹姆椒矫婷妫夹g對于傳統(tǒng)社會的滲透也沖擊著人類現(xiàn)有的認知和生活方式。2023年3月,歌手陳珊妮發(fā)行了由其AI模型演唱的歌曲《教我如何做你的愛人》,該歌曲通過AI音軌和唱法技巧模型搭建的神經(jīng)網(wǎng)絡和復雜算法來實現(xiàn)演唱。這一行為藝術式的歌曲制作映射出人工智能技術對于音樂領域的顛覆式改變。
然而,AI技術在歌聲合成方面的應用并非首次,早在2007年出道的日本虛擬偶像“初音未來”就運用了AI歌聲合成技術。但是,專業(yè)公司打造一個虛擬歌手的啟動成本要幾十萬元,經(jīng)濟成本的掣肘使得虛擬歌手的創(chuàng)造局限在資本化的專業(yè)領域。而如今在網(wǎng)絡開源社區(qū)(又稱開放源代碼社區(qū),一般由擁有共同興趣愛好的人組成),普通用戶根據(jù)某一聲音的聲庫就可以免費訓練一個自己的虛擬歌手,技術的可操作性和近乎零成本的投入為AI“歌手”的民間創(chuàng)造提供了可能。此外,AI“歌手”翻唱音視頻的上百萬次點擊量也反映出其能提供給用戶獨特的情緒價值,但對于AI“歌手”的內(nèi)存技術問題、版權爭議和未來發(fā)展,學界和業(yè)界應當更加重視。
AI“歌手”的音頻是基于“生成式語音模型”的一款人工智能生成內(nèi)容(Artificial Intelligence Generated Content, AIGC)產(chǎn)品,使用AI音色轉換技術Sovits4.0版本生成。創(chuàng)作者需提前準備好歌手的采訪、直播等素材,經(jīng)過去呼吸聲、去雜音等技術細節(jié)處理以保留歌手的“干聲”,即歌曲去掉樂器、伴奏、混響、和聲后剩下的“原始聲音”,再將素材投入到機器中“訓練”出AI“歌手”的音色。
AI“歌手”翻唱音視頻的走紅不僅有技術層面的支持,也有平臺力量的推動。例如,嗶哩嗶哩(bilibili,簡稱“B站”)音樂區(qū)推出的“虛擬之聲創(chuàng)作計劃·2023年第二期”就鼓勵創(chuàng)作者根據(jù)要求對歌曲進行“原創(chuàng)/翻調(diào)/填詞/改編”等創(chuàng)作,并給予優(yōu)質(zhì)作品流量扶持和活動獎勵,目前該活動已有近億次瀏覽量。
此外,技術層面的低門檻與平臺方面的助推力量為普通用戶打造AI“歌手”提供了可能性,用戶利用開源社區(qū)的現(xiàn)有聲庫,根據(jù)成熟的算法程序進行“填空式”操作,便可將不同的聲音與任意歌曲進行搭配組合,AI“歌手”的打造權和歌曲翻唱的支配權開始向用戶開放。
“替代性滿足”理論來自弗洛伊德的精神分析心理學,指欲望能量在最初對象上遇到阻礙時會向其他對象轉移,是一個層層轉移、不斷妥協(xié)的過程,因此最終的替代對象與原始對象之間也會存在差異[1]。歌手本人因種種原因難以保證持續(xù)的新歌產(chǎn)出與演藝活動開展,以至于在粉絲和大眾的視野中不甚活躍時,粉絲出于對喜愛歌手的思念和期待而利用AI技術實現(xiàn)歌手的數(shù)字分身在賽博空間“營業(yè)”。因此,即便歌手本人缺席,只留存聲音在場,粉絲也能獲得替代性的滿足感。如孫燕姿的粉絲在聽到“AI孫燕姿”的翻唱歌曲后評論,“都說不好聽、沒感情,我的第一反應是,多好的粉絲福利”。AI“歌手”作為歌手的數(shù)字分身能夠從心理上撫慰粉絲的焦躁心理,用聲音提供陪伴感,以滿足粉絲的期待。
亨利·詹金斯在其著作《文本盜獵者:電視粉絲與參與式文化》中將參與式文化表述為“粉絲對電視文本進行盜獵挪用與拼貼重組”[2]。在互聯(lián)網(wǎng)時代,粉絲將歌手聲音的素材與其他歌手的歌曲進行拼貼重組的參與式創(chuàng)作,一方面是在技術支撐下的想象力發(fā)揮,如用王心凌的聲音呈現(xiàn)韓紅的《青藏高原》,用特朗普的聲音搭配《我愛你,中國》,超越現(xiàn)實的想象力在技術賦權下得到了實現(xiàn)的可能。另一方面,網(wǎng)友的評論提供了記憶層面的分析維度,如“年輕時聽孫燕姿,是對愛情的憧憬和幻想;年輕時聽周杰倫,是單戀的苦澀和回味。他們的不完美,就像我們年輕時的感情?,F(xiàn)在他們結合在一起,真完美”。歌手與歌曲的重組不僅僅是簡單的搭配組合,也是個體記憶的重塑。過往記憶中的遺憾以一首首旋律所譜寫,而如今的釋懷也由喜愛的聲音演唱著喜愛的歌曲來見證。用戶參與下的音視頻創(chuàng)作由此在想象力和記憶層面完成了延展和重構。
巴赫金的狂歡理論以民間為研究立場,指出狂歡節(jié)的主要儀式是人們以笑謔形式推舉“國王”為其加冕和隨后脫冕[3]。在AI“歌手”的翻唱音視頻中,歌手和歌曲的原本樣態(tài)仿若國王的“王冠”,是平民無法觸及之物,而在狂歡節(jié)中,如“陳墨瞳1995”等B站UP主(uploader,指在視頻網(wǎng)站、論壇、ftp站點上傳視頻音頻文件的人)因發(fā)布“AI孫燕姿”的翻唱作品而獲得平民“加冕”,相關歌手的粉絲也由此開啟了一場戲謔式的狂歡游戲。而與自上而下的權威音樂發(fā)布形式不同,這種自下而上的由普通用戶發(fā)起的民間游戲有著反主流、反權威的特征,“紅人加熱歌”的推歌形式將“平民”心中的實力歌手與優(yōu)質(zhì)歌曲進行重新組合,用戶自行打造著理想中“未來華語樂壇的發(fā)展方向”。
當前,元宇宙是學界和業(yè)界共同關注的熱點議題。學者喻國明曾對元宇宙進行描繪:“元宇宙是集成與融合現(xiàn)在與未來全部數(shù)字技術于一體的終極數(shù)字媒介,它將實現(xiàn)現(xiàn)實世界和虛擬世界連接革命,進而成為超越現(xiàn)實世界的、更高維度的新型世界。”[4]有學者曾預言,“在元宇宙社會,因為生命可以數(shù)據(jù)化,個體生命也就能夠永遠存在”[5]。當歌手因疾病或意外事件離世后,其留存的作品成為“絕唱”。而AI“歌手”作為數(shù)字媒介實現(xiàn)了個體持續(xù)化的連接,生與死的界限在媒介技術的操作下逐漸“消失”,已故歌手在賽博空間實現(xiàn)數(shù)字永生。例如,姚貝娜的歌迷通過制作“AI姚貝娜”翻唱歌曲將個體的哀思轉化為更廣泛領域的社會性紀念,粉絲以此方式填補自己喜愛的歌手無法再演唱的遺憾,他們相信這種具有哀悼式的“關懷文化”能夠證明死者仍然存在于某種精神領域。
AI“歌手”翻唱歌曲只需通過歌手聲音素材和其他歌手歌曲的拼貼即可完成制作,遠比現(xiàn)實中歌手制作歌曲的流程簡易,AI“歌手”甚至能取得高于歌手本人的受關注度。由消費推動的AI“歌手”翻唱作品的批量生產(chǎn)使歌曲成為流水線式的工業(yè)品,喪失了其作為藝術品的獨特價值。
此外,AI翻唱歌曲雖運用了歌手的聲音素材進行機器訓練,但受限于人工智能的技術屬性,人本身的情感與情緒無法得到有效詮釋。因此,現(xiàn)有AI“歌手”的歌曲演繹仍飽受聽眾“沒有感情”的詬病。從戈夫曼的擬劇論視角看,AI“歌手”的翻唱是基于數(shù)字技術的“理想化表演”[6]。但歌手的“補救表演”甚至是演唱時的失誤,因其更加打動人、更加真實往往也被視為一首歌曲的靈韻所在,這是追求效率和準確性的機器所無法實現(xiàn)的。
解構主義作為后現(xiàn)代思潮的一種,是后結構主義的一個重要分支,是對結構主義的批判和發(fā)展,其始作俑者是法國當代哲學家雅克·德里達(JacquesDerrida)?!把赢悺笔墙鈽嬛髁x的關鍵詞之一,在時間和空間兩個維度被賦予了延遲和間距的雙重含義[7]。AI技術解構了歌手作為人的整體性,將歌手的聲音從人本體中間隔開來,并與其他音頻素材進行重組拼貼,是技術作為人的創(chuàng)造物反過來支配人的異化表現(xiàn)。此外,AI“歌手”的翻唱以歌手聲音素材的機器訓練作為前提,在這一過程中,人的主體性被懸置,歌手身為“人”的屬性被削弱,歌手成為AI的養(yǎng)料,人演變?yōu)榧夹g發(fā)展的內(nèi)容物,也使網(wǎng)絡用戶產(chǎn)生“AI未來會替代人類”的擔憂。
英國學者克里斯蒂納·富克斯總結的數(shù)字勞動(digital labour)具備以下學界普遍認同的特征:勞動發(fā)生場所是以數(shù)字技術為支撐的互聯(lián)網(wǎng),勞動主體是互聯(lián)網(wǎng)用戶,勞動對象是主體的情感、認知、經(jīng)歷等,勞動產(chǎn)品是主體在互聯(lián)網(wǎng)上生成的內(nèi)容[8]。AI“歌手”翻唱現(xiàn)象的出現(xiàn)與爆火離不開粉絲群體在互聯(lián)網(wǎng)場域傾注情感與體力的數(shù)字勞動。在以往的粉絲文化中,無論是數(shù)字打投(指打榜投票)還是輿論造勢,粉絲都是圍繞歌手和歌曲進行數(shù)字勞動和情感實踐,歌手或歌曲的走紅往往是歌手和粉絲的共同勞動。然而,在AI“歌手”翻唱的媒介實踐發(fā)展中,歌手和歌曲似乎只提供勞動創(chuàng)作的素材,粉絲的數(shù)字制作與素材拼貼才是勞動的決定性力量,占據(jù)著勞動的主導地位。
在AI“歌手”翻唱的媒介事件逐漸發(fā)酵后,新浪微博曾出現(xiàn)“AI出來后第一個失業(yè)的是孫燕姿”的熱搜話題,從而引發(fā)AI“歌手”是否會替代真人歌手的討論。一方面,彭蘭教授認為在AIGC的語境下,人類試圖以“情感”“思想”作為創(chuàng)作的防守陣地,但可能會發(fā)現(xiàn)這塊陣地并不像人類想象的那么堅固[9]。真人歌手的情感與創(chuàng)作或許未必比機器的程式更有趣、更有價值。另一方面,AI“歌手”對于實力歌手和經(jīng)典歌曲的拼貼演繹也從一定程度上說明,經(jīng)過時間沉淀后仍煥發(fā)生命力的人、事物的價值得到了重估,或許AI“歌手”將會引領真人歌手再次“回春”。
AI“歌手”翻唱在互聯(lián)網(wǎng)的熱度越來越高,而其引發(fā)的版權爭議同樣值得關注。雖然生成該技術的源項目So-VITS-SVC已正式停止維護并存檔,但仍有該領域的愛好者創(chuàng)建了自己的分支繼續(xù)維護。一面是熱情不減的音樂愛好者的自發(fā)創(chuàng)作維護,一面是主體合法權益的侵害隱憂,AI“歌手”未來應當如何發(fā)展?
從技術層面上看,工業(yè)和信息化部、國家網(wǎng)信辦等相關部門應聯(lián)合學界和互聯(lián)網(wǎng)公司共同進行社會調(diào)研與技術研判,判斷AI“歌手”及其翻唱作品是否對社會發(fā)展進程有利好作用。
一方面,如果經(jīng)過研判此類人工智能技術的使用和作品的產(chǎn)出對社會發(fā)展的作用是利大于弊,則各方應出臺相應政策和規(guī)定引導其發(fā)展,并對該技術模型進行內(nèi)容輸出的可塑性培養(yǎng),持續(xù)響應用戶需求,適配更多場景的用戶交互。
另一方面,若經(jīng)過權威研判,此類作品未來將產(chǎn)生難以控制的負面后果,就要及時對其進行管制。對于多數(shù)如AI“歌手”類的AIGC產(chǎn)品,相關方應對用戶輸入的指令和投放的語料進行限制和約束,以降低其技術模型的內(nèi)容輸出風險。此外,AI“歌手”作為人工智能合成技術的分支,向普通用戶開放后不可避免地會產(chǎn)生AI倫理問題,如將歌手的聲音用于暴力、犯罪、色情等違法和敏感內(nèi)容制作中。因此,不僅要對技術使用進行政策約束,也要通過增加過濾機制來規(guī)避不當內(nèi)容的生成。
從法律角度看,我國現(xiàn)有法律還未對人的聲音進行法律的界定和責任的劃定。就歌手的音色或者唱腔而言,本身是不受著作權法保護的,但在商標法的規(guī)定中,歌手的聲音可以作為商標來保護。所以從這個角度來說,人聲同樣擁有人身屬性,違規(guī)利用有可能給聲音主體的合法權益造成損害。此外,對于歌手姓名和歌曲的使用等也可能侵害歌手、歌曲作品的詞曲創(chuàng)作者等主體的合法權益。例如,AI“歌手”的名字中提到了明星的具體人名,則對明星的姓名權造成了侵犯。更為重要的是,這項人工智能合成技術引發(fā)了人們對于其運用途徑的擔憂。有不少用戶在“AI孫燕姿”走紅后紛紛表示,“如果將該技術運用于詐騙,未來該怎么辦”。因此,面對此類人工智能合成技術,政策和法規(guī)的出臺是保證技術合理合規(guī)發(fā)展、保證人們生活幸福穩(wěn)定的重要前提。
AI“歌手”翻唱的音視頻發(fā)布平臺同樣需要承擔相應的責任。平臺方在日常運營中,本就有著對用戶發(fā)布信息進行內(nèi)容研判和風險預估的責任,而針對如今新出現(xiàn)的AI“歌手”翻唱作品,平臺方更應繃緊敏感神經(jīng),依據(jù)現(xiàn)有政策和法規(guī)進行處理。一方面,從原創(chuàng)者和原創(chuàng)內(nèi)容角度來看,平臺方應該在對內(nèi)容和版權進行研判和分析后,對原創(chuàng)信息通過加水印、用顯眼的設計標注“原創(chuàng)”字樣等方式來保護原創(chuàng)者的版權和其他合法權益。另一方面,平臺方也應當對用戶的侵權行為和侵權內(nèi)容作出快速反應和處理。如及時標注原創(chuàng)來源、下架相關侵權作品、對侵權行為嚴重或屢教不改的侵權者予以凍結賬號、查封賬號等處置。
AI“歌手”及其翻唱作品所能提供的情緒價值應當被給予肯定,但內(nèi)存其間的技術異化和版權爭議仍是其無法逃避的現(xiàn)實隱憂。在互聯(lián)網(wǎng)時代,諸如AI“歌手”類的AIGC產(chǎn)品無疑會推動內(nèi)容市場的多元化發(fā)展,進而提升現(xiàn)實歌手的知名度。但現(xiàn)實歌手本身也有影響力“失焦”的風險,粉絲大眾和音樂行業(yè)未來可能追逐的將不再是作為“人”的歌手,而是歌手的聲音。正如學者詹新惠所言,面對尚在探索中的AIGC,我們需要明確,技術不是目的,追求更好的世界、更美好的生活才是目的和目標。