王 磊,張華鐘,陳安東
(江蘇省鐵路集團(tuán)有限公司,江蘇 南京 210018)
傳統(tǒng)的鐵道松動(dòng)的檢測手段主要是通過經(jīng)驗(yàn)豐富的鐵道工人通過敲打鐵軌,通過鐵軌回音來識(shí)別鐵軌是否發(fā)生松動(dòng)[1-2]。這種方式對(duì)工人的技術(shù)要求較高,并且識(shí)別的成功率不穩(wěn)定,容易出現(xiàn)漏判,誤判的情況。為了提高識(shí)別的準(zhǔn)確率,降低人為因素的影響,同時(shí)針對(duì)目前鐵道安全檢測系統(tǒng)尚待升級(jí),政府和百姓愈發(fā)重視交通安全性的現(xiàn)狀,我們提出了結(jié)合計(jì)算機(jī)人工智能算法的思路,構(gòu)建全自動(dòng)化的智能識(shí)別系統(tǒng)。
梅爾頻率倒譜系數(shù)(MFCC)在1980年由Davis和Mermelstein所提出,是一種在語音識(shí)別中廣泛使用的特征。MFCC是梅爾頻率倒譜的系數(shù),來自于音訊片段的倒頻譜[3]。倒譜和梅爾頻率倒譜的差異主要是梅爾頻率倒譜的頻帶劃分是等距劃分的,它比用于正常的對(duì)數(shù)倒頻譜中的線性間隔的頻帶更能近似人類的聽覺系統(tǒng)。通過這樣的表示手段,可以在多個(gè)領(lǐng)域中使聲音信號(hào)有更好的表示[4]。
MFCC特征提取主要分為以下幾個(gè)步驟。
(1)將聲音信號(hào)分解為多框。(2)將聲音信號(hào)高通濾波。(3)通過FFT將信號(hào)變換至頻域。(4)將頻譜通過梅爾濾波器,得到梅爾刻度。(5)在每個(gè)梅爾刻度上提取對(duì)數(shù)值。(6)對(duì)結(jié)果進(jìn)行IDFT變換,變換到倒頻譜域。(7)MFCC就是這個(gè)倒頻譜圖的幅度。
概率線性判別分析(PLDA)最早由Prince等人提出,PLDA與LDA相比,PLDA也是將數(shù)據(jù)投影到低維空間中,從而最大化類間距離。PLDA具備LDA不具備的優(yōu)勢,它能同時(shí)考慮到數(shù)據(jù)和噪聲來建模,實(shí)現(xiàn)比LDA更佳的實(shí)驗(yàn)效果[5]。
主成分分析是從原始樣本數(shù)據(jù)里的多個(gè)參量提取出幾個(gè)貢獻(xiàn)率較高的主成分,每個(gè)主成分都可以最大程度體現(xiàn)樣本數(shù)據(jù)的最主要特征,相互獨(dú)立,在保留樣本數(shù)據(jù)主要特征的同時(shí),最大限度的減少數(shù)據(jù)量[6-7]。PCA將原始數(shù)據(jù)中大量的參量通過分析最后獲取幾個(gè)貢獻(xiàn)率最大的主成分,降低建模難度,同時(shí)選出更為精簡更能突出數(shù)據(jù)特征的數(shù)據(jù)。但是,在實(shí)際案例樣本的研究中,為了完成多元統(tǒng)計(jì)分析中的數(shù)據(jù)特征提取,需要記錄眾多影響結(jié)果的主成分。因?yàn)槊總€(gè)參量都從不同的角度上反映了數(shù)據(jù)的特征,如需要反映一個(gè)人的總體情況,可以從身高,外貌,品質(zhì)的不同角度來體現(xiàn)一個(gè)人的特征;而且參量與參量之間可能存在著一定的聯(lián)系,例如學(xué)生的學(xué)習(xí)成績和家庭關(guān)系的和睦程度是有著一定的聯(lián)系的,因而原始統(tǒng)計(jì)數(shù)據(jù)反映的信息存在重復(fù)點(diǎn)。當(dāng)然,目前已經(jīng)有一些方法可以較好的規(guī)避重復(fù)性帶來的數(shù)據(jù)冗余以及其對(duì)提取主成分的影響。
PCA是從數(shù)個(gè)主成分來體現(xiàn)出樣本整體特征,將我們原始數(shù)據(jù)中許多相關(guān)性很高的參量轉(zhuǎn)化成彼此相互獨(dú)立或不相關(guān)的主成分。通常是選出少數(shù)幾個(gè),能體現(xiàn)數(shù)據(jù)的主要特征的幾個(gè)主成分,用來代表原始數(shù)據(jù)的主要特征并完成數(shù)據(jù)降維[8]。
(1)數(shù)據(jù)采集
本實(shí)驗(yàn)通過專業(yè)的聲波儀每隔10 m采集一次鐵棒敲擊鐵軌的聲音,并通過鐵道專業(yè)人士檢查鐵軌是否出現(xiàn)松動(dòng)。未松動(dòng)標(biāo)簽設(shè)置為0,松動(dòng)標(biāo)簽設(shè)置為1;一共采集了200例未松動(dòng)鐵軌的聲音信號(hào),183例松動(dòng)鐵軌的聲音信號(hào)。
(2)結(jié)果分析
數(shù)據(jù)處理如圖1所示,我們首先將200例未松動(dòng)鐵軌的聲音信號(hào)和183例松動(dòng)鐵軌的聲音信號(hào)按照7:3劃分為訓(xùn)練集和測試集。訓(xùn)練集:160例未松動(dòng)鐵軌的聲音信號(hào)和150例松動(dòng)鐵軌的聲音信號(hào);測試集:40例未松動(dòng)鐵軌的聲音信號(hào)和33例松動(dòng)鐵軌的聲音信號(hào)。然后分別提取訓(xùn)練集和測試集的MFCC特征,將提取出的特征作為PLDA模型的輸入構(gòu)建識(shí)別模型,最終結(jié)果顯示針對(duì)測試集中未松動(dòng)鐵軌識(shí)別準(zhǔn)確率100%,松動(dòng)鐵軌識(shí)別準(zhǔn)確率為98.5%,表現(xiàn)出了MFCC-PLDA模型有著極好的識(shí)別效果。PCA-PLDA模型對(duì)測試集中未松動(dòng)鐵軌識(shí)別準(zhǔn)確率90%,松動(dòng)鐵軌識(shí)別準(zhǔn)確率為95%。該模型的分類效果相對(duì)比MFCC-PLDA模型效果要差,主要原因可能與MFCC更適合提取聲音相關(guān)的特征,而主成分分析法相對(duì)語音重要特征提取的能力較MFCC要弱一些[9]。此外我們還將MFCC-PLDA識(shí)別模型的結(jié)果與有經(jīng)驗(yàn)的鐵路工人根據(jù)經(jīng)驗(yàn)來判別的結(jié)果進(jìn)行了對(duì)比,工人根據(jù)經(jīng)驗(yàn)針對(duì)測試集中未松動(dòng)鐵軌識(shí)別準(zhǔn)確率90%,松動(dòng)鐵軌識(shí)別準(zhǔn)確率為96.67%;工人識(shí)別結(jié)果明顯低于MFCC-PLDA模型結(jié)果,與PCA-PLDA模型的結(jié)果相當(dāng),再次表明了未來通過人工智能算法可以比人工更好解決該問題。
圖1 MFCC-PLDA數(shù)據(jù)分析模型
本研究基于鐵軌松動(dòng)這一研究點(diǎn),通過MFCC算法進(jìn)行語音特征提取,然后使用PLDA分類器構(gòu)建一種全新的自動(dòng)化識(shí)別方法來替代傳統(tǒng)的人工識(shí)別手段,此外我們還與PCA-PLDA模型進(jìn)行了對(duì)比,最終模型的識(shí)別結(jié)果顯示模式識(shí)別算法可以有效地提高了自動(dòng)化識(shí)別的精確率和工作效率,為未來構(gòu)建智能化的鐵道安全監(jiān)控系統(tǒng)奠定了基礎(chǔ)。