李倩 李德
摘要:音樂(lè)版權(quán)的保護(hù)實(shí)質(zhì)上是對(duì)創(chuàng)作音樂(lè)者智慧結(jié)晶的保護(hù)。如何提高音樂(lè)版權(quán)的唯一性,防止音樂(lè)抄襲現(xiàn)象的泛濫,一直是音樂(lè)領(lǐng)域的難題。本文基于時(shí)下熱門(mén)的音頻特征提取技術(shù),對(duì)音頻進(jìn)行多特征提?。好窢柕棺V系數(shù)、響度范圍、靜音幀比例等,生成唯一的特征值序列,將其加密后作為水印,利用LSB算法嵌入到音頻中,起到有效的版權(quán)聲明作用,為音頻數(shù)字水印與特征提取結(jié)合提出一種可能性,為音樂(lè)版權(quán)保護(hù)的未來(lái)提出展望。
關(guān)鍵詞:音頻數(shù)字水印 特征提取 版權(quán)保護(hù)
一、緒論
音樂(lè)版權(quán)的保護(hù)旨在保護(hù)音樂(lè)的原創(chuàng)性與知識(shí)產(chǎn)權(quán),版權(quán)保護(hù)的核心是保護(hù)創(chuàng)作者的靈感與智慧體現(xiàn)。然而如今的信息互聯(lián)時(shí)代,竊取音樂(lè)旋律、盜版的手段方式更加五花八門(mén),例如,在未經(jīng)創(chuàng)作者允許的情況下在原聲帶音頻的基礎(chǔ)上修改創(chuàng)作,或者以不明顯的模仿方式直接盜用原曲的旋律與曲調(diào)等。這種盜取避開(kāi)了音頻數(shù)字水印的保護(hù),是否存在抄襲情況始終依賴(lài)于人的經(jīng)驗(yàn)分析。而音頻信號(hào)是帶有語(yǔ)音、音樂(lè)、音效的有規(guī)律的聲波的信息載體,其中語(yǔ)音和音樂(lè)是是音頻信號(hào)的主要內(nèi)容。本文提出音頻數(shù)字水印與特征識(shí)別分析結(jié)合的方式來(lái)有效判定:對(duì)音頻進(jìn)行多特征提取,得到一個(gè)特征值序列,將該序列作為水印利用音頻數(shù)字水印嵌入算法嵌入音頻中,更好的作為版權(quán)保護(hù)音頻。
二、結(jié)合特征提取的版權(quán)保護(hù)實(shí)現(xiàn)
(一)音樂(lè)的三要素
音樂(lè)的三要素分為:旋律、節(jié)奏、和聲。旋律又稱(chēng)“曲調(diào)”,是構(gòu)成音樂(lè)的首要要素。旋律是含有音高和節(jié)奏的人聲或樂(lè)器的樂(lè)音序列,它在音樂(lè)中不同的排列位置產(chǎn)生樂(lè)音的復(fù)合音效;節(jié)奏是由長(zhǎng)短、強(qiáng)弱不同的節(jié)拍組成的有序整體,沒(méi)有節(jié)奏的旋律只是單調(diào)的音符集合,沒(méi)有音樂(lè)的美感,是抄襲者容易篡改的一個(gè)部分;和聲即在同一時(shí)間由兩個(gè)或兩個(gè)以上音高的音組合發(fā)聲形成的聲音,用來(lái)描述不同音高音符之間關(guān)系的不同帶來(lái)的音效的差異,起到渲染烘托的作用。對(duì)于音樂(lè)的特征基于這三個(gè)基本要素進(jìn)行分析提取。
(二)音樂(lè)特征提取
音樂(lè)的特征有很多類(lèi)別,本文使用了幾種簡(jiǎn)單常用但具有唯一識(shí)別音頻的幾個(gè)特征:梅爾倒譜系數(shù)(MFCC)、響度、響度范圍、靜音幀比例。梅爾倒譜系數(shù)(Mel-scale Frequency Cepstral Coefficients)是基于人耳的聽(tīng)覺(jué)機(jī)理在梅爾標(biāo)度頻率域提取出來(lái)的信號(hào)倒譜系數(shù),主要根據(jù)人耳對(duì)音頻的反應(yīng)結(jié)果對(duì)音頻進(jìn)行分析:首先對(duì)音頻信號(hào)進(jìn)行預(yù)處理,然后對(duì)處理后的信號(hào)進(jìn)行快速傅里葉變換,得到譜線(xiàn)能量和Mel濾波能量,將Mel濾波能量進(jìn)行對(duì)數(shù)運(yùn)算后進(jìn)行DCT倒譜,得到MFCC特征;響度反應(yīng)了音頻能量的大小,由于音強(qiáng)與音高的變化都會(huì)引起響度變化,所以響度側(cè)面體現(xiàn)了這兩個(gè)因素在音頻中的影響;響度范圍即音頻中最大響度與最小響度之差;靜音幀比例指短時(shí)能量在一定閾值范圍內(nèi)的音頻幀,靜音幀比例即為其占全部音頻幀的比重。
(三)音頻數(shù)字水印的提取與解碼
利用得到的四個(gè)特征值,對(duì)其進(jìn)行加密后,轉(zhuǎn)換成二進(jìn)制形式,得到四個(gè)二進(jìn)制序列,利用最低比特位替代法(Least Significant Bits, LSB)進(jìn)行嵌入。最低比特位替代法是音頻信息隱藏中使用最廣泛最簡(jiǎn)單的算法之一。本文的使用方法:首先對(duì)原始音頻根據(jù)時(shí)域平均提取采樣點(diǎn),對(duì)其進(jìn)行預(yù)處理,去除部分雜聲減少干擾;再將提取出來(lái)的特征值計(jì)算轉(zhuǎn)換得到一個(gè)標(biāo)識(shí)性的二進(jìn)制特征序列,即為水印內(nèi)容;之后將每個(gè)采樣點(diǎn)的最低的4個(gè)比特位替換成水印二進(jìn)制特征序列的4位對(duì)應(yīng)二進(jìn)制編碼,水印成功被嵌入。提取水印的過(guò)程采用與嵌入完全逆向的方式,找到采樣點(diǎn)的最低位將數(shù)據(jù)提取出來(lái),利用密鑰進(jìn)行解密,得到水印內(nèi)容。整個(gè)過(guò)程的實(shí)現(xiàn)步驟如圖1所示。
三、總結(jié)
將音頻特征生成唯一的標(biāo)識(shí)序列作為水印嵌入音頻中,能夠更加有效地聲明音樂(lè)作品的唯一性,無(wú)論誰(shuí)對(duì)原版音頻做了改動(dòng),特征值都不會(huì)再相同,抄襲者也無(wú)法解析篡改特征值。本文提出的生成音頻數(shù)字水印的特征只選取了主要的幾種,音頻特征還包括線(xiàn)性預(yù)測(cè)倒譜系數(shù)(Linear Prediction Cepstrum Coefficient)、小波系數(shù)等等,越具有標(biāo)識(shí)性的音頻特征值在版權(quán)保護(hù)中的應(yīng)用越有效力。特征提取識(shí)別技術(shù)的發(fā)展對(duì)未來(lái)音樂(lè)版權(quán)的保護(hù)會(huì)有更大的應(yīng)用前景,但對(duì)于音樂(lè)版權(quán)的保護(hù)不能僅僅依賴(lài)技術(shù),更關(guān)鍵的是提高人們對(duì)音樂(lè)著作權(quán)的保護(hù)意識(shí)。國(guó)內(nèi)對(duì)于音樂(lè)作品的版權(quán)定義始終模糊,抄襲現(xiàn)象依舊層出不窮。如何發(fā)揮音頻數(shù)字水印的最大實(shí)際作用,可以基于多大的相似度對(duì)音樂(lè)抄襲定性,是研究者們需要長(zhǎng)期努力的方向。加強(qiáng)對(duì)音樂(lè)版權(quán)的保護(hù)力度,加大對(duì)抄襲盜版違法行為的懲治與抵制,是眾多創(chuàng)作者的心之所向。
參考文獻(xiàn)
[1]高慶.用于版權(quán)保護(hù)的音頻數(shù)字水印算法研究[D].武漢理工大學(xué),2008.
[2]胡耀文.音頻信號(hào)特征提取及其分類(lèi)研究[D].昆明理工大學(xué),2018.
[3]徐罡.音樂(lè)相似性研究及其在檢索系統(tǒng)中的應(yīng)用[D].電子科技大學(xué),2015.
[4]于臘梅.基于版權(quán)保護(hù)的音頻數(shù)字水印概述[J].電聲技術(shù),2019,43(02):15-17.
[5]劉丹,張乃堯,朱漢城.音樂(lè)特征識(shí)別的研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2002(24):74-77.