孟令紅
摘要:為了提高音樂分類和檢測(cè)正確率,設(shè)計(jì)了一種復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)模型。首先分析當(dāng)前音樂分類和檢測(cè)的研究進(jìn)展,指出各種音樂分類和檢測(cè)模型存在的缺陷,然后采集音樂分類和檢測(cè)信號(hào),引入去噪技術(shù)對(duì)噪聲進(jìn)行消除處理,從信號(hào)中提取特征,最后將特征和音樂類型分別作為神經(jīng)網(wǎng)絡(luò)的輸入和輸出向量,通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練建立音樂分類和檢測(cè)模型。在相同環(huán)境下,與其它音樂分類和檢測(cè)模型進(jìn)行了對(duì)比測(cè)試,結(jié)果表明,無噪聲環(huán)境下,這個(gè)模型的音樂分類和檢測(cè)精度超過95%,在復(fù)雜噪聲環(huán)境下,文中模型的音樂分類和檢測(cè)精度超過90%,遠(yuǎn)遠(yuǎn)超過音樂處理的實(shí)際應(yīng)用控制范圍,音樂分類和檢測(cè)效果優(yōu)于對(duì)比模型,具有一定的實(shí)際應(yīng)用價(jià)值。
關(guān)鍵詞:噪聲干擾;音樂分類;檢測(cè)精度;提取特征向量;神經(jīng)網(wǎng)絡(luò);仿真測(cè)試
中圖分類號(hào):TP181
文獻(xiàn)標(biāo)志碼:A
MusicClassificationandDetectionModelinComplexNoiseEnvironment
MENGLinghong
(
HebeiRadioandTelevisionStation,Shijiazhuang050031,China
)
Abstract:Inordertoimprovetheaccuracyofmusicclassificationanddetection,amusicclassificationanddetectionmodelincomplexnoiseenvironmentisdesigned.Firstly,thispaperanalyzesthecurrentresearchprogressofmusicclassificationanddetection,andpointsoutthedefectsofmusicclassificationanddetectionmodels.Thenthemodelcollectsmusicclassificationanddetectionsignals,introducesdenoisingtechnologytoeliminatethenoise,extractsfeaturesfromthesignals,andfinallytakesfeaturesandmusictypesasinputandoutputvectorsofneuralnetwork,respectively.Themodelestablishessoundthroughthetrainingofneuralnetwork.Theresultsshowthattheaccuracyoftheproposedmodelisover95%innoiselessenvironmentandover90%innoisingenvironment,whichisfarbeyondtheactualapplicationcontrolrangeofmusicprocessing,andtheeffectofmusicclassificationanddetectionisbetterthanthecomparisonmodel,andithasacertainpracticalapplicationvalue.
Keywords:noiseinterference;musicclassification;detectionaccuracy;featurevectorextraction;neuralnetwork;simulationtest
0引言
隨著人們生活水平的不斷提高,人們享受生活的方式多元化,其中聽音樂成為一種重要的消遣方式。但是在音樂采集過程中,由于環(huán)境中一些不利影響的干擾,使得音樂包括了一些對(duì)音質(zhì)有損的信息,這些信息統(tǒng)稱為噪聲。在復(fù)雜噪聲環(huán)境,有時(shí)噪聲會(huì)淹沒了有用的音樂信號(hào),使得人們無法識(shí)別正確的音符,因此如何進(jìn)行噪聲環(huán)境中的音樂分類和檢測(cè)具有十分重要的研究意義[13]。
當(dāng)前復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)模型主要有兩大類型,一類是線性的音樂分類和檢測(cè)模型,最具有代表的為k最近鄰算法,其音樂分類和檢測(cè)過程十分簡(jiǎn)單,使得音樂分類和檢測(cè)效率相當(dāng)高,但是音樂分類和檢測(cè)精度比較低,使得使用范圍受到了限制[45];另一類為非線性的音樂分類和檢測(cè)模型,最具代表性為人工神經(jīng)網(wǎng)絡(luò)算法,如BP神經(jīng)網(wǎng)絡(luò)的音樂分類和檢測(cè)模型,深度置深網(wǎng)絡(luò)的音樂分類和檢測(cè)模型等[68],它們的音樂分類和檢測(cè)要優(yōu)于線性的音樂分類和檢測(cè)模型,但是當(dāng)音樂的噪聲環(huán)境比較復(fù)雜時(shí),它們的音樂分類和檢測(cè)效果急劇下降,對(duì)噪聲的魯棒性比較低,使得音樂分類和檢測(cè)錯(cuò)誤率變大,難以滿足音樂分類和檢測(cè)的實(shí)際應(yīng)用要求[911]。
為了提高音樂分類和檢測(cè)正確率,設(shè)計(jì)了一種復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)模型。在相同條件,與其它音樂分類和檢測(cè)模型進(jìn)行了對(duì)比測(cè)試,結(jié)果表明,無論是無噪或者噪聲環(huán)境下,本文模型的音樂分類和檢測(cè)精度均要明顯優(yōu)于對(duì)比模型,對(duì)比結(jié)果有效的證明了本文音樂分類和檢測(cè)模型的有效性和優(yōu)越性。
1多種噪聲環(huán)境下的音樂分類和檢測(cè)模型
1.1音樂噪聲的去除技術(shù)
當(dāng)音樂含有噪聲時(shí),音樂信號(hào)變化曲線就會(huì)發(fā)生改變,設(shè)含噪
聲為t(n),有用、干凈的音樂信號(hào)為s(n),那么復(fù)雜噪聲環(huán)境中的音樂信號(hào)如式(1)。
y(n)=s(n)-at(n)
(1)
式中,a表示噪聲類型,如白噪聲、高斯噪聲等。
噪聲t(n)通常使得音樂信號(hào)存儲(chǔ)空間增加,變化曲線發(fā)生變異,無法正確識(shí)別音樂信號(hào)類型,因?yàn)樾枰肼曀鸬呢?fù)面影響,本文選擇軟閾值的小波變換對(duì)音樂信號(hào)噪聲進(jìn)行去除,設(shè)一個(gè)含有噪聲的音樂信號(hào)去除前后變化曲線如圖1所示。可以明顯看出,無噪音樂信號(hào)和含有噪聲的音樂信號(hào)變化特征差別十分明顯,其中縱坐標(biāo)為信號(hào)幅度,橫坐標(biāo)為采集時(shí)間,如圖1所示。
1.2音樂分類和檢測(cè)特征提取
音樂分類和檢測(cè)的特征很多,由于音樂中包含信息發(fā)生變化時(shí),其短時(shí)能量頻譜就會(huì)發(fā)生相應(yīng)的改變,因此短時(shí)能量頻譜是一種有效的信號(hào)識(shí)別特征。本文選擇短時(shí)能量頻譜特征進(jìn)行音樂分類和檢測(cè)建模。設(shè)音樂的采樣頻率為fi,音樂的頻譜信號(hào)方差值計(jì)算公式如式(2)。
sp=∑Ni=1(fi-i)2p(fi)∑Nn=1p(fi)
(2)
音樂短時(shí)能量頻譜特征計(jì)算公式如式(3)。
ff=∑Ni=1(fi-i)2p(fi)sp3∑Nn=1p(fi)
(3)
1.3BP神經(jīng)網(wǎng)絡(luò)算法
音樂短時(shí)能量頻譜特征數(shù)量為BP神經(jīng)網(wǎng)絡(luò)輸入層的節(jié)點(diǎn)數(shù)量,音樂類型為BP神經(jīng)網(wǎng)絡(luò)的輸出層的輸出,隱含層映射函數(shù)為:
f:Rm→R,神經(jīng)網(wǎng)絡(luò)其輸入和輸出分別如式(4)、式(5)。
Sj=∑mi=1wijx(i)-θj
(4)
bj=11+exp∑mi=1wijxi-θj,j=1,2,…,p
(5)
式中,wij和θj為隱含層的節(jié)點(diǎn)權(quán)值和閾值。
根據(jù)同樣的原理,可以得到輸出層的輸入和輸出如式(6)、式(7)。
L=∑pj=1wjkbj-θk
(6)
xi+1=1(1+exp(∑pk=1wkjbj-θk))
(7)
式中,wkj和θk分別為輸出層的節(jié)點(diǎn)和閾值。
1.4噪聲環(huán)境中的音樂分類和檢測(cè)步驟
Step1:對(duì)音樂的噪聲場(chǎng)景進(jìn)行模擬,然后從噪聲場(chǎng)景中采集大量的音樂信號(hào),并去除前面和最后一段音樂信號(hào),保持音樂信號(hào)的連續(xù)性。
Step2:引入去噪技術(shù),對(duì)音樂信號(hào)進(jìn)行噪聲消除處理,去除音樂信號(hào)中噪聲,得到干凈有用的音樂信號(hào),有利于后續(xù)的音樂分類和檢測(cè)。
Step3:從無噪的音樂信號(hào)中提取短時(shí)能量頻譜特征,并采用如下方式對(duì)短時(shí)能量頻譜特征進(jìn)行預(yù)處理如式(8)。
ff′i=max-ffimax-min
(8)
式中,max和min分別表示短時(shí)能量頻譜特征的最大和最小值。
Step4:短時(shí)能量頻譜特征和音樂類型分別作為BP神經(jīng)網(wǎng)絡(luò)的輸入和輸出向量,通過訓(xùn)練確定BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)。
Step5:采用最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)的BP神經(jīng)網(wǎng)絡(luò)建立音樂分類和檢測(cè)的分類器,并對(duì)分類器的性能進(jìn)行分析和測(cè)試。
綜合上述可知,復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)流程,如圖2所示。
2音樂分類和檢測(cè)模型的性能對(duì)比測(cè)試
2.1測(cè)評(píng)平臺(tái)
為了測(cè)試復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)效果,在相同測(cè)試平臺(tái)上,選擇BP神經(jīng)網(wǎng)絡(luò)的音樂分類和檢測(cè)模型,該模型沒有引入去噪技術(shù),和基于KNN的音樂分類和檢測(cè)模型,該模型采用了去噪技術(shù),但是采用KNN建立音樂分類分類器,采用復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)精度和檢測(cè)效率對(duì)各模型的性能進(jìn)行分析,選擇的測(cè)試平臺(tái)設(shè)置,如表1所示。
2.2測(cè)評(píng)對(duì)象
為了使音樂分類和檢測(cè)效果具有說服力,選擇5種音樂,每一種音樂包括有噪和無噪數(shù)據(jù),它們的樣本數(shù)如表2所示。
2.3音樂分類和檢測(cè)精度分析
采用本文模型、BP神經(jīng)網(wǎng)絡(luò)、KNN對(duì)表2中的音樂進(jìn)行分類和檢測(cè),得到的實(shí)驗(yàn)結(jié)果如圖3、圖4所示。
從圖3和圖4的音樂分類和檢測(cè)精度進(jìn)行對(duì)比和分析可以發(fā)現(xiàn):
(1)KNN的音樂分類和檢測(cè)精度最低,無法準(zhǔn)確描述音樂信號(hào)包含的信息,雖然引入了去噪技術(shù),對(duì)噪聲的干擾可以進(jìn)行抑制,但是由于KNN只能建立音樂分類和檢測(cè)的線性分類器,使得音樂分類和檢測(cè)錯(cuò)誤率比較高,實(shí)際應(yīng)用價(jià)值很低。
(2)BP神經(jīng)網(wǎng)絡(luò)的音樂分類和檢測(cè)精度要高于KNN的音樂分類和檢測(cè)精,可以更好的描述音樂信號(hào)變化特點(diǎn),這是因?yàn)锽P神經(jīng)網(wǎng)絡(luò)可以建立非線性的音樂分類和檢測(cè)分類器,但是由于沒有引入去噪技術(shù),無法消除噪聲對(duì)音樂分類和檢測(cè)的影響,使得音樂分類和檢測(cè)錯(cuò)誤率相對(duì)比較大,音樂分類和檢測(cè)效果有待改善。
(3)本文模型的音樂分類和檢測(cè)精度最高,可以更加全面、準(zhǔn)確描述音樂信號(hào)包含的信息,大幅度減少了音樂分類和檢測(cè)錯(cuò)誤率,對(duì)于有噪音樂,音樂分類和檢測(cè)精度超過了90%,對(duì)于無噪的音樂,音樂分類和檢測(cè)精度更是達(dá)到了95%以上,完全可以滿足音樂檢索的實(shí)際應(yīng)用要求,獲得較好的音樂分類和檢測(cè)結(jié)果,這主要是由于本文模型利用了去噪技術(shù)和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),克服了當(dāng)前音樂分類和檢測(cè)過程中存在的不足,對(duì)比結(jié)果體現(xiàn)了本文音樂分類和檢測(cè)模型的優(yōu)越性。
2.4音樂分類和檢測(cè)效率析
對(duì)于有噪的音樂,統(tǒng)計(jì)3種模型的音樂分類和檢測(cè)時(shí)間,如圖5所示。
從圖5可以看出,KNN的音樂分類和檢測(cè)時(shí)間最少,速度最快,但是由于音樂分類和檢測(cè)精度太低,不能滿足音樂分類和檢測(cè)的實(shí)際應(yīng)用要求,本文模型的音樂分類和檢測(cè)時(shí)間要少于BP神經(jīng)網(wǎng)絡(luò),說明通過對(duì)噪聲的消除,很好的抑制了噪聲對(duì)音樂分類和檢測(cè)的干擾,提高了音樂分類和檢測(cè)效率。
3總結(jié)
音樂分類和檢測(cè)是音樂檢索的重要技術(shù),由于噪聲的干擾,當(dāng)前音樂分類和檢測(cè)模型無法獲得理想的音樂分類和檢測(cè)結(jié)果,使得音樂分類和檢測(cè)錯(cuò)誤率比較高,為了獲得更優(yōu)的音樂分類和檢測(cè)效果,設(shè)計(jì)了一種復(fù)雜噪聲環(huán)境中的音樂分類和檢測(cè)模型。首先采集音樂分類和檢測(cè)信號(hào),并進(jìn)行噪聲消除處理,然后提取音樂分類和檢測(cè)特征向量,并采用神經(jīng)網(wǎng)絡(luò)對(duì)各種類型的音樂信號(hào)變化特點(diǎn)進(jìn)行描述,建立了音樂分類和檢測(cè)模型,測(cè)試結(jié)果表明,本文模型是一種精度高、魯棒性強(qiáng)的音樂分類和檢測(cè)精模型,具有十分廣泛的應(yīng)用前景。
參考文獻(xiàn)
[1]
杜威,林滸,孫建偉,等.一種基于分層結(jié)構(gòu)的音樂自動(dòng)分類方法[J].小型微型計(jì)算機(jī)系統(tǒng),2018,39(5):888892.
[2]楊曉宇,黃浩,王浩華.基于改進(jìn)的T型關(guān)聯(lián)度在音樂分類中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2017,47(20):155163.
[3]顏景斌,吳石,伊戈?duì)枴ぐ虐栠_(dá)維奇.基于單類支持向量機(jī)的音頻分類[J].計(jì)算機(jī)應(yīng)用,2009,29(5):14191422.
[4]倪璐.基于Android與JAVA的音樂在線分類管理與播放系統(tǒng)研究[J].自動(dòng)化技術(shù)與應(yīng)用,2020,39(2):4547.
[5]陳志高,張旭龍,肖寒,等.基于UNet和BGRURNN的實(shí)用歌聲檢測(cè)系統(tǒng)[J].微型電腦應(yīng)用,2019,35(10):109112.
[6]孫慧芳,龍華,邵玉斌,等.基于過零率及頻譜的語(yǔ)音音樂分類算法[J].云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,41(5):925931.
[7]王潔,朱貝貝.面向中文歌詞的音樂情感分類方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(8):2429.
[8]符朝興,沈威,高述勇,等.PCA改進(jìn)RPROP方法的BP算法在音樂信號(hào)分類中的應(yīng)用[J].測(cè)控技術(shù),2019,38(7):8488.
[9]鄭旦.基于深度置信網(wǎng)絡(luò)的多特征融合音樂分類算法[J].電子設(shè)計(jì)工程,2020,28(4):132136.
[10]黃歡歡,盧亞玲.改進(jìn)的BP算法在音樂分類中的應(yīng)用研究[J].武漢輕工大學(xué)學(xué)報(bào),2018,37(4):7075.
[11]龔安,丁明波,竇菲.基于DBN的多特征融合音樂情感分類方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(9):158164.
(收稿日期:2020.03.12)