明確AI歌手翻唱類音視頻的法律邊界,對于尊重和保護相關權利人權益、推動音樂產業(yè)的繁榮和發(fā)展、滿足消費者的多重需求等具有重要意義。
隨著人工智能技術的快速發(fā)展,人工智能生成內容已逐漸成為數(shù)字時代內容生產的一種重要模式。AI歌手翻唱行為所形成的音視頻作為一種新興的文化現(xiàn)象,一方面為音樂愛好者提供了更加豐富多樣的聽覺體驗,推動了音樂文化的創(chuàng)新與傳播;另一方面也引發(fā)了人們對AI歌手翻唱行為可能帶來的法律糾紛的擔憂,因而須確定AI歌手翻唱行為的法律邊界。
AI歌手翻唱類音視頻是生成式人工智能在音樂領域的拓展應用,通過利用AI技術模仿某目標歌手的聲音,對已有音樂作品進行重新演繹,從而生成具有目標歌手音色的新音頻或將此音頻與相應背景畫面等結合而成的新視頻。
“翻唱”一詞是一種擬人化表達,其實際是一個復雜的技術流程,包括聲音樣本的訓練、音頻合成以及聲線的精確替換等。目前,實現(xiàn)這一技術的軟件有很多,其中,Sovits(Single-shot Voice Identity Swapping Technique)是一種用于音色轉換的最為常用的軟件。該軟件的基本原理是通過數(shù)據(jù)收集、數(shù)據(jù)訓練、數(shù)據(jù)推理三個環(huán)節(jié)提取原始音頻的中間特征,然后再合成目標音頻。以AI歌手翻唱A作品為例,在數(shù)據(jù)收集環(huán)節(jié),先收集該歌手曾演唱的歌曲中帶伴奏的音頻,分離伴奏和人聲,提取人聲并將其切割成短的音頻;在數(shù)據(jù)訓練環(huán)節(jié),將上一步中切割好的音頻素材拖入整合包中的數(shù)據(jù)文件夾開始訓練;在模型推理環(huán)節(jié),分離提前收集好的A作品的伴奏和原唱人聲,把人聲拖入“單個音頻上傳”后進行音頻轉換,將訓練后的AI歌手音色的音軌替換原唱的人聲音軌。最后,在完成上述步驟后,打開一款可以進行音頻編輯的軟件,將A作品的伴奏與上一步已替換好的音頻進行合并,便可得到一首由AI歌手“演唱”的作品。AI歌手翻唱類音視頻的制作并不復雜,技術門檻較低,這為普通用戶學習制作AI歌手翻唱類音視頻提供了可能性。此外,一些用戶利用開源社區(qū)的現(xiàn)有聲庫,根據(jù)成熟的算法程序進行“填空式”操作,便可輕松地將不同的聲音與任意歌曲進行搭配組合。這更進一步降低了AI歌手翻唱類音視頻的制作難度,使得非專業(yè)人士也能迅速上手并實現(xiàn)個性化內容的產出,促進了此類音視頻的傳播和流行。
國家互聯(lián)網(wǎng)信息辦公室在2023年8月15日生效的《生成式人工智能服務管理辦法》第四條和第七條明確規(guī)定:提供生成式人工智能產品或服務應當尊重知識產權,用于生成式人工智能產品的預訓練、優(yōu)化訓練數(shù)據(jù)不得侵害他人依法享有的知識產權。這些規(guī)定為AI歌手翻唱類音視頻的制作與傳播設定了明確的法律邊界。
首先,AI歌手翻唱的制作過程需要對已有音樂素材加以利用,包括音頻聲音的收集分流、利用聲音的機器訓練以及合成音頻中其他素材的加工利用。AI歌手翻唱制作對音樂素材的使用,通常是將音樂錄音制品、一般語音文件等上傳至AI模型的服務器,這一行為若未經(jīng)著作權人許可,便以無線方式向公眾開放訪問,使得公眾能夠按照個人意愿在任何時間和地點獲取這些作品,特別是當部分用戶利用現(xiàn)成的聲庫和程序來生成音視頻內容時,便極有可能侵犯著作權人的信息網(wǎng)絡傳播權。
其次,歌手的音樂表演是由歌手通過自身音色,基于氣口、咬字和斷句等方式對樂曲的細化處理以及歌手個人對歌曲獨特的情感表達共同構成的。真人翻唱也是如此,真人翻唱者的音色、唱腔、咬字、情感表達等會完全替換掉原唱者的,形成獨屬于翻唱者的具有獨創(chuàng)性的表達。但AI歌手翻唱則不同,AI歌手翻唱僅僅只是替換了原歌手的音色卻仍保留原唱者在演唱時的細化處理,原歌手因被保留了其演唱技巧仍然享有表演者權。因此,AI歌手翻唱類音視頻若未標明原表演者,可能侵害原表演者表明身份的權利。
再次,AI歌手翻唱類音視頻在合成最終音頻時采用了原歌曲的伴奏,這涉及被覆蓋的原歌曲錄制者的著作權,其一般為大型唱片公司和從事錄音業(yè)務的小型文化傳播公司。根據(jù)《著作權法》第四十四條規(guī)定,錄音錄像制作者對其制作的錄音錄像制品,享有許可他人復制、發(fā)行、出租、通過信息網(wǎng)絡向公眾傳播并獲得報酬的權利,因而AI歌手翻唱制作階段還可能涉及侵犯錄音錄像制作者的權利。
AI歌手翻唱行為在傳播階段主要體現(xiàn)為AI歌手翻唱的音視頻被觀眾瀏覽。在其廣泛傳播的過程中,AI歌手翻唱行為主要涉及對同行商業(yè)競爭利益的侵害和對真人演唱者人格權的侵害。
首先,AI歌手翻唱類音視頻的高流量往往是建立在被采樣音色的歌手本人的高知名度的基礎上。被采樣的高知名度歌手是吸引聽眾點開音頻、下載音頻的直接原因,其為AI歌手翻唱類音視頻創(chuàng)造了巨大的流量和經(jīng)濟利益。因此,當AI技術生成的音色模型高度逼近原歌手本人的聲音,并用于替換人聲制作音視頻時,這些作品便與原歌手本人產生了緊密關聯(lián)。若制作者出于營利目的,在傳播過程中未明確標注“AI生成”字樣,就極易造成聽眾或觀眾的誤解和混淆,還可能因觸犯反不正當競爭法的相關規(guī)定而構成侵權。
其次,聲音作為識別個人身份的重要依據(jù),具有人身屬性,因而聲音權益被納入民法典的人格權保護范圍。聲音權的主要權能包括自我使用權和許可他人使用權。自我使用權是指聲音權人可以依據(jù)自己的意圖,通過藝術加工等形式來制作自己的聲音,可以自我欣賞自己的錄音作品,也可以利用自己的聲音去獲得收益。許可他人使用權是指自然人可以將其聲音授予他人使用,并以此獲利。但作為基本權利,聲音權無論是否出于營利的目的,未經(jīng)他人同意而使用他人的聲音,都屬于侵害他人的聲音權。在殷某某訴北京某智能科技公司的全國首例AI生成聲音侵權案中,法院認為:聲音作為一種人格權益,具有人身專屬性,對錄音制品的授權并不意味著對聲音AI化的授權,未經(jīng)權利人許可,擅自使用或許可他人使用錄音制品中的聲音構成人格權侵權。AI歌手翻唱類音視頻提取原歌手的原始聲音,然后將這些素材作為目標音色輸入模型中進行訓練,生成其音色模型,而后用這個模型替換其他任意音色,這涉及對原歌手聲音的使用,因此會涉及聲音權益方面的侵權。
最后,在某些AI歌手翻唱類視頻中,通常還配以原歌手的肖像進行背景畫面的展示。根據(jù)《中華人民共和國民法典》第一千零一十九條的規(guī)定,未經(jīng)肖像權人同意,不得以發(fā)表、復制、發(fā)行、出租、展覽等方式使用或者公開肖像權人的肖像。AI歌手在未經(jīng)原歌手許可的情況下,擅自使用原歌手的肖像作為音視頻的背景畫面,會侵犯原歌手的肖像權。
在數(shù)字時代,人工智能技術發(fā)展日新月異。AI歌手翻唱類音視頻作為一種音樂創(chuàng)新模式,具有加持數(shù)字身份使已故歌手得以數(shù)字永生,便利用戶參與音樂創(chuàng)作等多重價值。然而,這一創(chuàng)新模式也伴隨著一系列復雜的法律風險,不僅涉及著作權等知識產權的侵權風險,還涉及侵犯姓名權、聲音權、肖像權等人格權的風險。因此,明確AI歌手翻唱類音視頻的法律邊界,對于尊重和保護相關權利人權益、推動音樂產業(yè)的繁榮和發(fā)展、滿足消費者的多重需求等具有重要意義。
(作者邱潤根系南昌大學法學院教授、博士生導師,本文為國家社科基金項目“個人信息的數(shù)據(jù)化商業(yè)利用權益沖突問題研究”〔22BFX083〕階段性成果)
編輯:黃靈" " yeshzhwu@foxmail.com