古月一刀
如果問華語樂壇近期產(chǎn)量最高的歌手是誰,“AI孫燕姿”一定有姓名。在B站上搜索“AI孫燕姿”,既有大家耳熟能詳?shù)摹兑恢焙馨察o》《歲月神偷》《紅豆》,也有令人哭笑不得的《好漢歌》《火紅的薩日朗》……AI技術(shù)加持下的孫燕姿,各種曲風(fēng)不在話下。這類音頻極大地保留了孫燕姿本人的聲音特質(zhì),甚至達(dá)到了以假亂真的程度。除了“AI孫燕姿”,周杰倫、鄧紫棋等歌手也出現(xiàn)了大批AI分身。
UP主子魚(化名),雖然至今只做了4個(gè)“AI孫燕姿”的音頻,但總播放量已超過150萬次。其中僅《下雨天》單曲就超過了100萬次,收藏近兩萬人次。視頻中,諸如“開口跪”“一模一樣”“這不是原唱嗎”等彈幕比比皆是,不少網(wǎng)友震驚于AI技術(shù)已經(jīng)發(fā)展到如此地步。
子魚之前也做過“AI周杰倫”等,但對比下來,效果遠(yuǎn)不如“AI孫燕姿”?!斑@可能與孫燕姿本身的聲音辨識(shí)度有關(guān)?!彼f。子魚表示,比起那些“鬼畜區(qū)”的大佬,他的技術(shù)還很稚嫩,都是在網(wǎng)上看視頻一步步自學(xué)的,核心是開源項(xiàng)目So-vitssvc(以下簡稱Sovits)的使用。
Sovits的作用等同于柯南脖子上的“蝴蝶結(jié)變聲器”,即把一個(gè)音色變成另一個(gè)音色,這也是做“AI歌手”的關(guān)鍵。目前這個(gè)項(xiàng)目已經(jīng)迭代到了4.0版本,Sovits的使用大大簡化,僅憑數(shù)段音頻就可以訓(xùn)練出用戶想要的聲學(xué)模型。
當(dāng)然,對音頻有一些特殊的要求。比如,它得是“干聲”,就是在一首歌中去掉樂器、伴奏、混響、和聲后的“原始聲音”。再比如,訓(xùn)練材料得足夠多。“在4.0版本里,想完成一首惟妙惟肖的作品,起碼要有兩小時(shí)的‘干聲材料打底?!弊郁~說。在歌曲上,為了讓AI的唱腔更加游刃有余,訓(xùn)練者還必須收集歌手在各個(gè)音調(diào)中的“干聲”表現(xiàn)。
這些特殊的要求,單靠創(chuàng)作者自己很難完成。但因?yàn)橛泻芏嗑W(wǎng)友分享了自己整合的歌手“干聲”材料,這大大降低了Sovits的使用門檻。
子魚最初使用的就是這些整合包,他很快訓(xùn)練出了“AI孫燕姿”的聲音模型。只要用這個(gè)模型去替換掉原本歌曲的干聲即可,整個(gè)過程不超過兩小時(shí)。后來,子魚即便不用整合包,也能通過軟件去篩出一首成品歌曲的“干聲”,以一首歌約3分鐘為例,只要篩40首歌,就能獲得足夠時(shí)長的“干聲”材料。
“當(dāng)然,由于算法的局限及材料質(zhì)量的高低,很多AI歌手的表現(xiàn)還不算完美。但通過補(bǔ)充更多高質(zhì)量的材料及后期修音,可以在一定程度上解決這些問題?!弊郁~私底下訓(xùn)練出過自己的AI模型,“第一次聽到自己聲音的時(shí)候,起了滿身的雞皮疙瘩,好玩的同時(shí)也感到一絲恐懼”。
感到恐懼的遠(yuǎn)不止子魚一人。最近,女歌手陳珊妮在社交媒體上自曝,她在3月14日發(fā)布的新歌《教我如何做你的愛人》,實(shí)際上是“AI陳珊妮”唱的。消息一出,音樂圈無不感到震驚。
因?yàn)榇饲皼]有聽眾發(fā)現(xiàn)過,甚至有粉絲評論陳珊妮的嗓音好像“回春”了——這首歌的演唱水準(zhǔn)比她近年的表現(xiàn)要更好。這仿佛向人們傳遞了一個(gè)信息——一個(gè)制作精良的“AI歌手”已經(jīng)可以做到瞞天過海,欺騙絕大多數(shù)人了。
實(shí)際上,AI歌手并不是一個(gè)新鮮事物。初音未來早在2007年就面世了,后來模仿這種“二次元形象+語音合成引擎”的虛擬歌手層出不窮,B站的洛天依、LOL推出的K/DA女團(tuán)都是這種。
但以往的AI歌手通常有著鮮明的虛擬形象,大家都心知肚明是假的,其“電力充足”的電子音喉也無時(shí)無刻不在提示著TA們的虛擬身份?,F(xiàn)在的AI歌手則不一樣,他們的聲音源于真實(shí)的材料,“調(diào)教”也是為了無限度地?cái)M真,這使得人們的認(rèn)知很容易產(chǎn)生混亂。
如果使用“AI歌手”作惡怎么辦?本就泛濫的假唱將變得更加難以辨別,歌手行當(dāng)?shù)拈T檻變得越來越低,有關(guān)歌手聲音上的侵權(quán)也會(huì)變得更加頻繁……延展到其他領(lǐng)域,例如用親朋好友的聲音偽裝電信詐騙等。
與之相對的,是通過“AI歌手”來向善。比如,還原已故歌手的聲音,讓聽眾們得以緬懷。放在更廣的層面,也可以“復(fù)活”離世人們的聲音,給親朋們以慰藉?!癆I歌手”的出現(xiàn)既可能為公眾服務(wù),也可能成為犯罪者的幫兇,還是要看使用者的抉擇。
長期來看,AI技術(shù)與音樂的加深綁定勢不可擋。雖然有人認(rèn)為AI無法代替人的藝術(shù)性創(chuàng)作、AI的聲音沒有感情、AI無法實(shí)現(xiàn)人類細(xì)膩的表達(dá)等,但實(shí)際上對于音樂圈而言,AI技術(shù)早已深入產(chǎn)業(yè)的方方面面。
音樂播放器的“猜你喜歡”,就是AI技術(shù)運(yùn)用的表現(xiàn)。它實(shí)現(xiàn)了對用戶口味的精準(zhǔn)猜測,讓隨機(jī)播放的歌曲越來越對聽眾的胃口?;贏I技術(shù)的母帶制作服務(wù)(例如LANDR),為音樂人提供了一種成本遠(yuǎn)低于傳統(tǒng)母帶制作服務(wù)的替代性方案,目前已有超過200萬音樂人利用它制作出超過1000萬首歌曲。但對音樂人來說,最擔(dān)心的恐怕是自身的權(quán)益損害問題。
一位外國網(wǎng)友就因制作了說唱歌手Drake和“盆栽哥”TheWeeknd的AI版歌曲HeartonMySleeve引起法律糾紛。問題在于,這樣的行為究竟是一種新技術(shù)勃發(fā)后,創(chuàng)作者們博粉絲一笑的創(chuàng)意行為,還是用技術(shù)圈錢,實(shí)則侵犯了歌手“聲音權(quán)”的侵權(quán)行為?兩者的界限在當(dāng)下并沒有被清晰地劃定。
不可否認(rèn),音樂圈也有人愿意把自己的聲音貢獻(xiàn)出來讓人使用。比如歌手格萊姆斯,但她不是沒有條件的,她的要求是分50%的版稅。如果創(chuàng)作者與歌手能夠達(dá)成某種利益分成上的約定,這倒不失為一種好的模式。
“AI歌手”的誕生讓人害怕的同時(shí)也讓人好奇。是利大于弊,還是弊大于利?現(xiàn)在還難以言明。唯一明確的是,現(xiàn)在才剛剛開始。
(摘自“南風(fēng)窗”微信公眾號,本刊有刪節(jié),豆薇圖)