基于RBF徑向基網(wǎng)絡(luò)的演唱評價模型研究
袁劍
(西安音樂學(xué)院計算機(jī)教研室西安710061)
針對演唱評分方法易受到主觀因素的影響,提出采用廣義回歸RBF神經(jīng)網(wǎng)絡(luò)模擬評委進(jìn)行穩(wěn)定打分并分析網(wǎng)絡(luò)結(jié)構(gòu)在聲樂評價中的優(yōu)勢,對聲樂藝術(shù)評價建立評價指。將定性評價轉(zhuǎn)換為定量成績向量輸入神經(jīng)網(wǎng)絡(luò)生成評分。用單聲部民族唱法進(jìn)行實驗,將輸出結(jié)果與預(yù)期分值進(jìn)行比對。結(jié)果表明,該模型能有效降低人為因素的干擾,模擬專家進(jìn)行穩(wěn)定打分。
RBF徑向基函數(shù)網(wǎng)絡(luò);廣義回歸神經(jīng)網(wǎng)絡(luò);演唱;評價模型
Class NumberTP183
聲樂表演是一門藝術(shù),它要求演唱者以技巧、藝術(shù)素養(yǎng)做出個性化的演繹。通常對演唱效果的評價以去掉最高值與最低值后求平均,此評價方法帶有不少主觀因素。傳統(tǒng)聲樂評價本身是一種評委的主觀感受,評委評價標(biāo)準(zhǔn)有所差異,即使是同一評委也有因人而異的可能[1]。傳統(tǒng)的評價方法未說明評價指標(biāo)與結(jié)果之間的關(guān)系。聲樂藝術(shù)的評價應(yīng)用非線性方法構(gòu)建評價指標(biāo)與演唱效果之間的關(guān)系和評價體系。人工神經(jīng)網(wǎng)絡(luò)是一種能夠?qū)ψ匀唤绻δ芎瘮?shù)逼近的信息處理系統(tǒng),在聲樂藝術(shù)評價中使用神經(jīng)網(wǎng)絡(luò)更能體現(xiàn)指標(biāo)與效果之間的非線性關(guān)系,評價結(jié)果更加客觀合理。目前,聲樂評價中使用較多的是BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)可以實現(xiàn)輸入和輸出間的任意線性或非線性的函數(shù)映射[2]。然而,BP網(wǎng)絡(luò)是一種全局逼近網(wǎng)絡(luò),訓(xùn)練速度很慢且容易陷入局部極小值,需經(jīng)過反復(fù)試湊和訓(xùn)練,無法保證每次訓(xùn)練BP算法的收斂性和全局最優(yōu)性,并且BP神經(jīng)網(wǎng)絡(luò)缺乏簡單有效的參數(shù)確定方法,因此算法不穩(wěn)定,不適合實時性要求高的場合。文章擬采用一種收斂速度快,逼近能力和學(xué)習(xí)速度都優(yōu)于BP的廣義回歸向基函數(shù)(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)。它是徑向基網(wǎng)絡(luò)的一種變形形式,具有良好的非線性逼近性能,特別適合解決曲線擬合問題。徑向基神經(jīng)網(wǎng)絡(luò)已成功應(yīng)用于非線性函數(shù)逼近、模式識別等[3]。與BP相比,RBF網(wǎng)絡(luò)能更好地解決局部最小點的問題。
廣義回歸網(wǎng)絡(luò)建立在非參數(shù)回歸的基礎(chǔ)上,以樣本數(shù)據(jù)為后驗條件,執(zhí)行Pazzen非參數(shù)估計,依據(jù)最大原則計算網(wǎng)絡(luò)輸出,當(dāng)隱層神經(jīng)元足夠多時,網(wǎng)絡(luò)能夠以任意精度逼近一個平滑函數(shù)[1]。廣義回歸神經(jīng)網(wǎng)絡(luò)其結(jié)構(gòu)如圖1所示。
圖1 廣義徑向基網(wǎng)絡(luò)結(jié)構(gòu)
輸入層神經(jīng)元個數(shù)同于輸入向量的維數(shù),傳輸函數(shù)為線性函數(shù)。隱含層為徑向基層,神經(jīng)元個數(shù)為訓(xùn)練樣本個數(shù),基函數(shù)為高斯函數(shù),第i個神經(jīng)元的中心向量為xi。加和層中第一種神經(jīng)元為分母單元,計算隱含層各神經(jīng)元的代數(shù)和,加和層第二種神經(jīng)元為分子單元,計算隱含層神經(jīng)元的加權(quán)和,權(quán)值為各訓(xùn)練樣本的期望輸出值。輸出層將加和層的分母單元、分子單元的輸出相除,即得網(wǎng)絡(luò)輸出y。在廣義回歸神經(jīng)網(wǎng)絡(luò)中x,y是兩個隨機(jī)變量,且x的觀測值為x0,樣本數(shù)據(jù)集為,在輸入為x的條件下,y的預(yù)測輸出為
0y(x0),其估算密度函數(shù)為
則
n為樣本容量,p為隨機(jī)變量x的維數(shù)。σ為高斯函數(shù)的標(biāo)準(zhǔn)差,稱為光滑因子,σ過大則y(x0)近似與樣本變量的平均值,對數(shù)據(jù)的細(xì)節(jié)便會部分不能成功逼近。σ過小,則網(wǎng)絡(luò)失去推廣能力,陷入過學(xué)習(xí)狀態(tài)。因此在構(gòu)建評價模型時需要根據(jù)評價項目的取值范圍選取合適的σ,通常平滑因子應(yīng)和輸入數(shù)據(jù)的平均間距相當(dāng)。
3.1 聲樂評價體系構(gòu)建
聲樂評價的對象不同,聲樂評價的體系構(gòu)建也應(yīng)不同。本文以獨唱為評價對象,構(gòu)建評價模型。模型中將評分類別分為音準(zhǔn)與完整性、技巧、舞臺表現(xiàn)、作品理解與情感四個大類,每類包含多個小項。每個評委只需對表演給出部分項目的級別,而不用給出具體的數(shù)值。此方法較以往只打總分的方法更能體現(xiàn)演唱的藝術(shù)內(nèi)涵。獨唱評價標(biāo)準(zhǔn)設(shè)計如表1所示。
表1 獨唱表演評價標(biāo)準(zhǔn)
評價體系有X個評價項目,每個項目由nl(l= 0,1,…,X-1)個評委打分,各項目有Mj(j=0,1,…,X-1)個級別,評價分值為i(i=0,1,…,Mj-1),第j個級別的評委有ki(i=0,1,…,Mj-1)個,則若各個評價級別的取值范圍為[] 0,F(xiàn)l,即滿分為Fl(l=0,1,…,X-1),則某項目第i個級別的權(quán)值為則該評價項目的實際分值為將權(quán)值代入后得Sl=即評價標(biāo)準(zhǔn)中第l項的分值。評價體系采用定性的方式描述評價項目,項目分類級別各不相同,具體數(shù)量根據(jù)測評對象實際情況而定。級別越多區(qū)分度越精確。演唱者實力相當(dāng)時需要增加項目的級別。評委只需對所評價的項目定級,由評價體系公式計算得到該項目的成績,并作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),最終成績由神經(jīng)網(wǎng)絡(luò)輸出。對藝術(shù)的衡量標(biāo)準(zhǔn)本身就是一種定性描述。但應(yīng)當(dāng)注意的是在實際應(yīng)用中評價級別的劃分應(yīng)足夠的細(xì)致,才能體現(xiàn)表演之間細(xì)微的差異。
3.2 RBF網(wǎng)廣義回歸絡(luò)評價模型構(gòu)
網(wǎng)絡(luò)評價模型的原理是使用神經(jīng)網(wǎng)絡(luò)來構(gòu)建一個穩(wěn)定的打分系統(tǒng)。先請一個評委按照評價體系為各項評價項目定級,按照評價體系中的各項公式計算出各個項目的分值,此分值是神經(jīng)網(wǎng)絡(luò)的輸入。同時請該評委給出一個合理的總分值,總分值為樣本,用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。使網(wǎng)絡(luò)模擬評委進(jìn)行成績的評定,即用神經(jīng)網(wǎng)絡(luò)來模擬一個專家的評分思維習(xí)慣。為了選擇合適的網(wǎng)絡(luò),需進(jìn)行試驗,在相同樣本的情況下進(jìn)行,對正則徑向基神經(jīng)網(wǎng)絡(luò)、廣義徑向基神經(jīng)網(wǎng)絡(luò)、廣義回歸徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行測試。測試結(jié)果如下:訓(xùn)練樣本為4×16的矩陣,測試數(shù)據(jù)為4×5的矩陣,網(wǎng)絡(luò)測試數(shù)據(jù)的期望輸出為:92.75,75,98,72,90。所有實驗網(wǎng)絡(luò)平滑因子SP=1.5。正則RBF輸出值為92.75,75,97.64,89.75,7.47。廣義RBF的輸出值為92.75,7596.88,71.85,83.63。廣義回歸徑向基網(wǎng)絡(luò)的輸出值為92.75,75,98.21,71.45,90.00。當(dāng)測試數(shù)據(jù)與訓(xùn)練樣本不同時廣義回歸徑向基網(wǎng)絡(luò)輸出結(jié)果與期望值最為接近,在模擬評分思維習(xí)慣時,廣義回歸神經(jīng)網(wǎng)絡(luò)最優(yōu),因此在構(gòu)建評價模型中使用該網(wǎng)絡(luò)。
在模型驗證試驗中,采用民族唱法單聲部獨唱,演唱者年齡為18~26歲的的青年人,其中男聲3人,女生3人,分3次進(jìn)行測評。為了有較高的區(qū)分度,每個評價項目的評價級別理論上可分為10~25個級別,在試驗中使用25個級別。在網(wǎng)絡(luò)模型中訓(xùn)練樣本為50組數(shù)據(jù),由一位評委給出50個分值作為訓(xùn)練網(wǎng)絡(luò)輸出的目標(biāo)值對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,同時由該評委對實驗中的6位測試者給出分值作為實驗的參照值。實驗中對收回的評分表進(jìn)行分值統(tǒng)計,分別計算出每個演唱者的各項分值,將各演唱者的分值向量作為網(wǎng)絡(luò)的輸入進(jìn)行仿真,將仿真結(jié)果與評委給出的參照值加以對比。實驗代碼使用Matlab實現(xiàn),其代碼如下:
P=[];
T=[];
plot(P,T,‘+’);
sp=2.5;
net=newgrnn(P,T,sp);
Y=sim(net,P);
plot(Y,T,‘O’);
Q=[];
A=sim(net,Q);
plot(Q,A,‘*’)
B=[];
plot(B,A,‘O’);
其中P為樣本矩陣;T為樣本的目標(biāo)輸出向量。Q為測試矩陣,A為網(wǎng)絡(luò)的測試輸出,即網(wǎng)絡(luò)模擬給出的測試者分值,B為實驗參考值即給定的目標(biāo)值。網(wǎng)絡(luò)的訓(xùn)練結(jié)果如圖2所示。
圖2 網(wǎng)絡(luò)訓(xùn)練樣本與輸出目標(biāo)圖
對6位演唱者分值的網(wǎng)絡(luò)仿真結(jié)果如圖3所示。
圖3 網(wǎng)絡(luò)測試輸出與目標(biāo)值
網(wǎng)絡(luò)的輸出值與給定的參考值如表2所示。
表2 網(wǎng)絡(luò)的測試輸出結(jié)果與目標(biāo)輸出值
以上結(jié)果說明,網(wǎng)絡(luò)給出的結(jié)果能夠模擬一個評委的打分。網(wǎng)絡(luò)的模擬精度是由樣本的數(shù)量和樣本的取值決定的。當(dāng)樣本的數(shù)量足夠大,涵蓋取值范圍內(nèi)數(shù)據(jù)時,網(wǎng)絡(luò)的精度則會大幅度提高。
在對聲樂藝術(shù)的評價中,評價是基于主觀的,用定量的方法容易出現(xiàn)不穩(wěn)定的偏差,定性描述更符合對藝術(shù)的評價。文章構(gòu)建了一種對聲樂藝術(shù)進(jìn)行評價的模型,只需按照評分項目給出定性的描述,模型統(tǒng)計這種描述并轉(zhuǎn)換為評價向量作為廣義回歸RBF神經(jīng)網(wǎng)絡(luò)的輸入由神經(jīng)網(wǎng)絡(luò)給出最終分值。文章提出的模型要應(yīng)用到不同的測試環(huán)境時需要大量不同的樣本才有實際意義,而現(xiàn)實中大量的樣本不易得到,且徑向基函數(shù)光滑因子SP的選取與數(shù)據(jù)距離有關(guān),需要反復(fù)實驗因此影響到了本模型的實用性。不同的演唱方法、聲部、環(huán)境都會對實際的評價結(jié)果產(chǎn)生影響,要構(gòu)建實用的網(wǎng)絡(luò)模型則需要在更多的環(huán)境中進(jìn)行實驗。文中的實驗僅是對民族唱法進(jìn)行研究,對其他唱法的樣本收集與分析需要進(jìn)一步研究。
[1]袁劍.BP神經(jīng)網(wǎng)絡(luò)在聲樂評價中的應(yīng)用[J].計算與機(jī)數(shù)字工程,2012,38(12):44-48.
YUAN Jian.Application of BP Neural Network in Vocal Assessment System[J].Computer&Digital Engineering,2012,38(12):44-48.
[2]許東,吳錚.基于MATLAB 6.X的系統(tǒng)分析與設(shè)計——神經(jīng)網(wǎng)絡(luò)第二版[M].西安:西安電子科技大學(xué)出版社,2002,19-28.
XIU Dong,WU Zheng.System analysis and design Based on MATLAB 6.X--The second edition of neural network[M].Xi'an:Xidian University Press,2002,19-28.
[3]http://www.cnblogs.com/yangxi/archive/2013/05/30/3107921. html
[4]朱良俊,張燕平.幾種徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的比較[J].福建廣播電視大學(xué)學(xué)報,2007,64(4):68-70.
ZHU Liangjun,ZHANG Yanping.The Comparison of Some radial basis function neural networks(RBF)[J]. Journal of fujian radio and TV university,2007,64(4):68-70.
[5]余成寬.表現(xiàn)性評價在聲樂教學(xué)中的應(yīng)用研究[D].長春:長春師范學(xué)院,2010:3-52.
YU Chengkuan.The Case Evaluation of Ordinary College(Teacher Education)Undergraduate Student[D].Changchun:Changchun Normal University,2010:3-52.
[6]李小武,羅蘭娥.BP神經(jīng)網(wǎng)絡(luò)在評價歌唱藝術(shù)嗓音中的應(yīng)用[J].現(xiàn)代電子技術(shù),2012,35(14):146-148.
LI Xiaowu,LUO Laner.Application of BP neural network in evaluation of artistic voice[J].Modern Electronics Technique,2012,35(14):146-148.
[7]吳媛,丁亞軍,錢盛友,等.基于神經(jīng)網(wǎng)絡(luò)的藝術(shù)嗓音客觀評價方法[J].電聲技術(shù),2015,39(12):57-60.
WU Yuan,DING Yajun,Qian Shengyou,et al.An Objective Evaluation Method of Artistic Voice Based on Neural Network[J].Audio Engineering,2015,39(12):57-60.
[8]張軼.高師聲樂教學(xué)評價標(biāo)準(zhǔn)體系的研究[J].人民論壇,2015,11(500):163-164.
ZHANG Yi.The Research on evaluation standard system of vocal music teaching in Higher Normal Colleges[J]. People's Tribune,2015,11(500):163-164.
[9]楊勇.智能化綜合評價理論與方法研究[D].杭州:浙江工商大學(xué),2014:49-124.
YANG Yong.A Study on Theory and Method in Intellectualization of Evaluation[D].Hangzhou:Hangzhou Industrial and commercial university,2014:49-124.
[10]苗雨,章莉.歌唱藝術(shù)評價相關(guān)問題研究[J].大舞臺,2012,43(7):40-50.
MIAO Yu,ZHANG Li.Research on the related issues of the evaluation of singing art[J].Big stage,2012,43(7):40-50.
[11]苗雨.基于人工智能技術(shù)的歌唱發(fā)音質(zhì)量客觀評價研究綜述[J].音樂探索,2012,23(3):119-127.
MIAO YU.A review of the study on the objective evaluation of vocal quality based on artificial intelligence technology[J].Explorations in Music,2012,23(3):119-127.
[12]羅宇佳.高等學(xué)校音樂表演專業(yè)學(xué)業(yè)表現(xiàn)性評價研究[D].西安:陜西師范大學(xué),2012:63-204.
LUO Jiayu.The study of Academic performance evaluation of music performance in Universities[D].Xi'an:Shanxi Normal University,2012:63-204.
[13]李炳男.RBF神經(jīng)網(wǎng)絡(luò)和HMM用于音樂識別的算法研究[D].太原:太原理工大學(xué),2010:25-36.
LI Bingnan.Study of Music Recognition Algorithm Based on RBF Neural Network and HMM[D].Taiyuan:Taiyuan University of Technology,2010:25-36.
[14]蘇美娟.徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法研究[D].蘇州:蘇州大學(xué),2007:1-22.
SU Meijuan.Research on Radial Basis Function Neural Network Learning Algorithms[D].Suzhou:Suzhou University,2007,1-22.
[15]孟新洋,柯琳.加強和完善民族聲樂的評價機(jī)制[J].音樂創(chuàng)作,2010,246(2):131-133.
MENG Xinyang,KE Lin.To strengthen and improve the evaluation mechanism of national vocal music[J].Musical Works,2010,246(2):131-133.
Singing Performance Evalurion Mode Research Based on RBF Neural Network
YUAN Jian
(Computer Staff Room,Xi'an Conservatory of Music,Xi'an710061)
To giving a correct assessment of a singer's performance is affected by multiple factors.GRNN RBF neural network can simulate a nonlinear system.This article establishes the evaluation model and use neural network to output a reasonable score. At last,this article uses an example to analysis the feasibility of the model.The experimental results show that the model can effectively reduce the interference by human in folk singing evaluation.
radial basis function neural network,general regression neural RBF network,vocal,evaluation mode
TP183
10.3969/j.issn.1672-9722.2017.06.019
2016年12月7日,
2017年1月17日
國家自然科學(xué)基金項目(編號:61174207);陜西省教育廳科學(xué)研究計劃項目(編號:16JK1671)資助。
袁劍,女,碩士,講師,研究方向:智能信息處理,數(shù)據(jù)挖掘,教育信息技術(shù)。