黃阿羅
摘要:本文通過對音樂信號處理的意義和音樂信號處理應用的可行性分析,提出了具體的聲樂特征提取方法,闡明了聲樂特征能量提取后的對比辦法,用更加量化的方式觀察人的發(fā)音方式,旨在將此方法具體運用在輔助聲樂演唱評價上,進而幫助聲樂演唱和教學活動。
關(guān)鍵詞:音樂信號處理 聲樂演唱評價 輔助作用
眾所周知,在目前的聲樂演唱評價體系中以主觀評價為主,老師或評委的主觀意見為絕對權(quán)威,聲樂教學中也采用的是傳統(tǒng)的言傳身教的教學模式。但隨著文化環(huán)境的多元化,音樂的風格多樣化,表現(xiàn)形式越來越豐富,且人們的審美日趨個性化,對音樂的理解更加多面性,特別是在某些特定的場合,比如聲樂考試和歌唱比賽中,常常需要對一些音樂呈現(xiàn)作出一定程度的客觀評價和分析,即使用聲音的物理指標來評判聲音以彌補傳統(tǒng)評價方式中過多主觀意見帶來的疏漏。作為一種特殊的語音信號,音樂信號分析能夠和信號處理中的許多方法較為緊密的聯(lián)系起來,從而運用到聲樂評價體系中,可以對此起到必要的輔助作用。下面本文就將具體闡述音樂信號處理的意義、應用的可行性及如何將信號處理方法運用于聲樂演唱的評價活動中的方法。
一、音樂信號處理的意義
音樂信號處理是在傳統(tǒng)信號處理基礎上成長起來的,在過去的二十年中,用計算機研究音樂主要是基于音樂符號的,其中具有代表性的是MIDI電子音樂。但是,隨著數(shù)字音頻的出現(xiàn)和計算機處理能力的增加,研究的重點現(xiàn)在逐漸轉(zhuǎn)變?yōu)閷σ魳沸盘柕姆治鎏幚砩?。在歌唱表演中,漂亮的音色是聲樂表達的靈魂,如果能夠研究好靈魂中的實質(zhì)內(nèi)容,對我們評價音質(zhì)的好壞有量化性的作用。因此,從音頻波形中提取出具有實際意義的信息是非常有意義的,也非常適合用信號處理的方法來加以實現(xiàn)。但是,當處理如語音、音樂這種特殊的音頻信號的時候,理解和應用相關(guān)的性質(zhì)是十分重要的。比如,研究相關(guān)問題時,我們要從聽覺特性、語言特性以及音樂特性上進行更為深入的分析。在音樂信號處理上,我們要將其諸多的性質(zhì)利用起來,諸如表現(xiàn)形式的多樣性,各種聲源的協(xié)調(diào)性以及一些固定的模式和旋律上所攜帶的信息。利用好了這些先驗信息,我們就能更好的分析音樂信號。
二、音樂信號處理應用的可行性
在音樂信號處理應用中,實驗性音樂一直和信號處理方法的創(chuàng)新性應用息息相關(guān),并已延展到聲音合成和修剪當中。文獻中指出,對音樂信號分析通常是從以下幾個維度分別進行的,如音高、和聲、旋律、速度、節(jié)奏、韻律以及音色。其中,對音高、和聲、節(jié)奏的分析已經(jīng)有了較為成熟的方法。音樂信號被定義為一系列基本頻率倍數(shù)的正弦波信號的疊加,每一個音符都會在一個特定的音高上給聽眾一個單一特別的感受,因此,音高是音樂的基本要素,根據(jù)音樂信號的特點,可以通過短時傅里葉變換獲得音樂信號的時頻特征,根據(jù)該特征可分析出音樂信號中音高及和聲的變化特點。節(jié)奏可看作推動音樂向前的一系列穩(wěn)定的信號,可以被描述為在時間上按照一定規(guī)律分布的脈沖信號,而速度則是跟這個信號相關(guān)聯(lián)的。速度和節(jié)奏在理解音樂中起著重要的作用,同理,我們也可利用短時傅里葉變換后的所得到的隨時間變化的頻譜求取這一規(guī)律變化的脈沖信號,故我們可將前后頻譜做差分運算,以而捕獲音樂信號中音高頻率的突變點并得到音樂信號中速度、節(jié)奏的變化特點。
以上對音樂信號的分析都有較為成熟的方法和流程,本文所要做的主要工作是分析聲樂信號的泛音、音質(zhì)特點,即發(fā)聲音色特點中的一部分,后文統(tǒng)稱為聲樂演唱的音色特點,并將其創(chuàng)造性地應用到聲樂訓練、評價當中。音色的客觀定義是能夠區(qū)分兩個響度和音高都相同的聲音的特征,這種特征主要是由基音頻率的諧波帶來的。本文主要設計了一種能夠量化分析發(fā)音質(zhì)量好壞的方法,并且,為了能夠更好的符合人的聽覺響應特性,我們利用梅爾頻率對諧波頻率進行分析,進而更好的分析聲樂音色特征的差異。
為比較不同發(fā)聲間的差異,本文設計了基于梅爾頻率的濾波器組,對不同頻段的聲樂演唱信號進行提取分析,并提出了相異聲樂特征向量,由此來反應兩組發(fā)音之間聲樂音色特征的差異,與優(yōu)秀發(fā)音之間做對比,可量化的評判發(fā)音的質(zhì)量,進而應用到聲樂評價及訓練當中。接下來我們就具體介紹音樂信號處理在聲樂評價中運用的方法。
三、聲音信號的提取方法
我們在音樂信號處理運用到聲樂演唱評價中采用的是聲音信號特征的提取方法。如圖1所示,該評價系統(tǒng)分為兩個部分,第一部分是對一些模板音樂信號進行特征數(shù)據(jù)提取學習,作為評價時候的參考模式。例如,我們可以將國際上最優(yōu)秀歌唱家不同音高的發(fā)音進行特征提取訓練學習,存儲到參考模式當中,作為評價過程當中的備選模式。第二部分是對需要評價的音樂信號進行特征數(shù)據(jù)提取,并在參考模式中選取音高相同的模式進行特征對比,找出音色特征中泛音、飽滿度等聲樂特征的差異,從而給出相應的評分。本文所采用的樣本數(shù)據(jù)是從專業(yè)藝術(shù)院校聲樂專業(yè)各年級各種程度的學生演唱的相同片段。與參考模式相近,即與著名歌唱家聲樂音色特征相近的得分較高,反之則得分較低。
在搜集到相關(guān)數(shù)據(jù)后,我們做了一個更接近實際的應用處理流程來提取聲樂演唱中的音色特征。其流程如圖2所示:
下面給出該框圖的簡要解釋。和語音信號的預處理相類似,音樂信號也要進行預加重分幀的處理。為了去除口唇輻射對發(fā)音的影響,因而首先對輸入音樂信號高頻分量進行預加重處理。此后需對采樣所得信號進行分幀處理,需要合理選擇幀長和幀步進。
在對聲樂信號頻譜分析當中,為了盡量改善頻率泄露的情況,通常需要對分幀后的信號進加窗處理。之后為了提取音樂信號的頻率特性,則對加窗后的信號做快速傅里葉變換得到音樂信號的頻譜。當我們演唱一個特定音高的音符的時候,除了在基頻處會產(chǎn)生一根譜線外,在頻譜上的其他部分也會分布的復混合頻譜。這些部分的譜線的能量構(gòu)成了我們發(fā)音的共鳴、泛音的特征,因此,通常我們只對信號的幅度特征感興趣,故將其取平方后得到與能量特征相關(guān)的功率譜。endprint
Stevens等人基于彼此等距的聽眾對音高的感性判斷,提出了梅爾刻度。研究表明該刻度與人耳的聽覺特性能夠很好的擬合,為了更好的度量不同音色帶給人的聽覺效果,故本文采用梅爾刻度對不同頻率進行量度。我們將人耳建模為一組濾波器組,對不同頻率具有選擇特性,根據(jù)梅爾刻度,我們可以設計一系列三角濾波器組模擬人對不同頻率的感知情況,根據(jù)梅爾刻度,我們設計截止頻率和中心頻率都不相同的三角濾波器組。將不同組的梅爾濾波器對由不同數(shù)據(jù)幀求得的功率譜密度函數(shù)進行濾波處理,得到經(jīng)過相應濾波器組濾波后的功率譜,對其求和后,提取不同中心梅爾刻度下音樂信號的能量,該過程即對采樣音樂信號做了平均處理的作用。根據(jù)信號的特征能量與樣例特征能量進行對比,可以得出不同梅爾濾波器組所提取到的樣例能量差別。在聲樂信號分析當中,可提取其梅爾特征能量與要達到的目標音色進行對比分析,對演唱者的音色特征進行評判。評分過程中,可根據(jù)與模式中樣例特征能量的平均差別來進行評判。
通過以上分析,闡明了聲樂特征能量提取后對比辦法,根據(jù)上文中描述的分析過程,可有效的對比不同聲樂信號的特征能量向量之間的不同,用更加量化的方式觀察人的發(fā)音方式,更好地進行客觀評價,并能在一定程度上糾正人發(fā)聲方面的缺陷。
四、結(jié)語
使用一些較為成熟的信號分析方法,可以有效量化分析音樂信號,使得人們不光能從感性的角度感受音樂帶來的美妙體驗,也可從理性的角度看待支撐這些特征背后的數(shù)字信息。這樣不僅能夠使得人們欣賞音樂的角度多元化,也使得在音樂教學和評比當中能夠有更量化的分析、評價工具,用以對不正確的發(fā)聲方式進行一定的客觀評價。將信號處理方法應用到音樂信號分析尤其是聲樂演唱中是一個較新的研究方向,在多個學科的積極合作和努力探索下會將會慢慢形成更加成熟和運用廣泛的成果。
注:
文中所涉及的實驗數(shù)據(jù)結(jié)果由電子科技大學碩士生李莽提供。
基金項目:
四川省教育廳資助科研項目(項目編號13SB0035)。
參考文獻:
[1]Daniel P·W·Ellis,Anssi Klapuri and Gael Richard.Signal Processing for Music Analysis[M].IEEE Journal of Selected Topics in Signal Processing,Oct.2011.
[2]C·Roads.The Computer Music Tutorial[M].Cambridge,MA: MIT Press,1996.
[3]M·S·Puckette.The Theory and Technique of Electronic Music[M].Singapore: World Scientific,2007.
[4]R·Parncutt.A perceptual model of pulse salience and metrical accent in musical rhythms[M].Music Percept,1994.
[5]R·Zhou,M·Mattavelli,and G·Zoia.Music onset detection based on resonator time frequency image[M].IEEE Trans.Audio,Speech,Lang.Process,Nov.2008.
[6]A·J·Eronen and A·P·Klapuri.Music tempo estimation with k-NN regression[M].IEEE Trans. Audio,Speech,Lang.Process,Jan.2010.
[7]M·Goto.An audio-based real-time beat tracking system for music with or without drum-sounds[M].J·New Music Res,2001.
[8]M·Alonso,G·Richard,and B. David.Accurate tempo estimation based on harmonic noise decomposition[M].EURASIP J·Adv·Signal Process,2007.
[9]A·P·Klapuri, A·J·Eronen,and J. Astola.Analysis of the meter of acoustic musical signals[M].IEEE Trans.Audio,Speech,Lang.Process.2006.
[10]J·Paulus, M·Müller,and A. Klapuri.Audio-based music structure analysis[M].in Proc. 11th Int.Conf.Music Inf.Retrieval (ISMIR),Utrecht,The Netherlands,2010.endprint