在過(guò)去的幾十年里,許多經(jīng)典的TVB影視片都離不開(kāi)配音,如果你認(rèn)為周星馳也可以講一口流利的普通話,那就太幼稚了。
另外,如動(dòng)漫等影視中最逼真的聲音合成,也大多通過(guò)配音演員的聲音錄制來(lái)實(shí)現(xiàn)的,然后將他們的聲音剪切成不同的片段,像做拼圖一樣, 將這些聲音“ 拼接” 在一起,形成一整段聲音。
近年來(lái), 隨著黑科技產(chǎn)品不斷迭代升級(jí),更多有趣的應(yīng)用逐漸被發(fā)掘并實(shí)現(xiàn)。在語(yǔ)音合成領(lǐng)域,由于人工智能克隆技術(shù)的出現(xiàn), 昔日繁瑣且枯燥的配音工作有望被取代。
配音將不再是專業(yè)人士的標(biāo)配,任何人都可以自主且簡(jiǎn)單地克隆自己的聲音,而克隆出來(lái)的聲音近乎逼真。
現(xiàn)在,神經(jīng)網(wǎng)絡(luò)可以對(duì)目標(biāo)聲音的未排序數(shù)據(jù)進(jìn)行訓(xùn)練,最終以簡(jiǎn)單快速、容易的方式,生成一段完整的音頻。當(dāng)人們將克隆的音頻從設(shè)備中導(dǎo)出時(shí),音色和音質(zhì)幾乎不會(huì)受到壓縮和影響。盡管有部分環(huán)節(jié)還需要手動(dòng)調(diào)整,但不久的將來(lái)將會(huì)更加完善。
這標(biāo)志著,全民聲音“克隆時(shí)代”的到來(lái)。
這種聲音克隆技術(shù)使用起來(lái)并不復(fù)雜,人們只需要拿著事先準(zhǔn)備好的臺(tái)詞,對(duì)著麥克風(fēng)仔細(xì)錄制30分鐘左右,即可完成第一步克隆工序。錄制的過(guò)程中難免會(huì)讀錯(cuò)字,或者有發(fā)音沒(méi)有很清晰等情況, 這不用太擔(dān)心,只要停下來(lái)重新錄制這部分即可。
全部錄制完之后,將生成的音頻文件導(dǎo)出并做一定的處理,幾個(gè)小時(shí)以后你克隆的聲音就做好了。此刻,你可以互動(dòng)界面中輸入各種你想表達(dá)話語(yǔ),人工智能克隆技術(shù)就可以在較短的時(shí)間內(nèi)生成專屬你自己的“逼真聲音”。
當(dāng)你將這段語(yǔ)音發(fā)給家人或朋友時(shí),他們?cè)诙虝r(shí)間內(nèi)根本無(wú)法分辨真假,這個(gè)克隆技術(shù)令許多人感到興奮。
聲音克隆技術(shù)可讓經(jīng)典再現(xiàn)
2014年,電影《永遠(yuǎn)的蝙蝠俠》中知名演員瓦爾·基爾默,因患喉癌被迫做氣管切開(kāi)手術(shù),導(dǎo)致聲音受損。至此,瓦爾·基爾默與許多優(yōu)秀影片擦肩而過(guò),演藝生涯近乎跌入谷底。
今年8月,一家名為奏鳴曲(Sonantic)的初創(chuàng)公司聲稱,他們已經(jīng)通過(guò)人工智能語(yǔ)音克隆技術(shù)創(chuàng)造出了瓦爾·基爾默的“原聲”。Sonantic公司的這一舉動(dòng)得到了市場(chǎng)普遍稱贊,因?yàn)樗鼮檠輪T提供了其他解決方案無(wú)法提供的技術(shù)。
然而,社會(huì)中也有一些質(zhì)疑的聲音,有人認(rèn)為:“這項(xiàng)技術(shù)有違社會(huì)道德?!绷硗庖晃凰嚾说慕?jīng)歷,就是最好的反例。
在前幾年,對(duì)于社會(huì)大眾來(lái)說(shuō),人工智能聲音克隆技術(shù)既陌生又遙遠(yuǎn),在一些藝術(shù)品中被用于生產(chǎn)贗品。
今年7月,一部關(guān)于安東尼·波登的紀(jì)錄片引發(fā)了爭(zhēng)議,據(jù)制片人向有關(guān)人士透露,他們使用人工智能聲音克隆技術(shù), 為安東尼·波登制作了一段臺(tái)詞音頻,但是當(dāng)時(shí)并沒(méi)有多少人注意。
該“聲音門”被曝光后,許多人譴責(zé)安東尼·波登這一做法。
毫無(wú)疑問(wèn),人工智能聲音克隆技術(shù)具有很好的商業(yè)化前景。
今年年初,維睿通公司就推出了類似的聲音克隆服務(wù),該公司將運(yùn)動(dòng)員和演員的在錄音棚里錄制好的聲音,通過(guò)人工智能克隆技術(shù)獲得其“逼真聲音”,然后再獲得網(wǎng)紅等人的聲音授權(quán),就可以從事代言、廣播節(jié)目等活動(dòng)。之后網(wǎng)紅、運(yùn)動(dòng)員和演員無(wú)需真人出鏡即可實(shí)現(xiàn)同樣的效果。
維睿通公司執(zhí)行副總裁肖恩·金表示:“將一個(gè)人的聲音克隆得形象逼真,以及如何對(duì)其應(yīng)用場(chǎng)景進(jìn)行擴(kuò)展只是時(shí)間的問(wèn)題,我們對(duì)很多不同行業(yè)帶來(lái)的新機(jī)會(huì),感到非常興奮?!?/p>
演員和名人的“聲音”可以毫不費(fèi)力地被出租出去,經(jīng)紀(jì)公司希望能夠通過(guò)克隆和出租公司旗下藝人的聲音,以最小的努力輕松獲得不菲的收入。
演員和明星等角色的聲音克隆技術(shù),可能是未來(lái)幾年最為明顯的商業(yè)化應(yīng)用。隨著這些克隆技術(shù)的成熟,加之克隆出聲音的技術(shù)壁壘較低,將會(huì)有許多初創(chuàng)公司可以提供類似服務(wù)。
海外星云 2021年17期