房若宇,李鈺杰,施相宇,姚星星
(1.浙江大學(xué) 物理學(xué)院,浙江 杭州 310058;2.浙江大學(xué) 竺可楨學(xué)院,浙江 杭州 310058)
作為一種用途廣泛的電子測量儀器,示波器可把電信號轉(zhuǎn)換為可視的圖像進(jìn)行直觀觀察和定量分析,因此在大學(xué)物理實驗教學(xué)中必不可少[1-4],并且應(yīng)用于有關(guān)教學(xué)設(shè)備的構(gòu)建和教學(xué)系統(tǒng)的設(shè)計[5-6],以及基于計算機仿真軟件應(yīng)用的實驗教學(xué)[7,8]。除了示波器的使用這一常規(guī)教學(xué)實驗之外,若干基于示波器的拓展性實驗如光學(xué)波片原理的演示、空氣中超聲速的測量和簡諧振動合成的觀察等被設(shè)計和應(yīng)用于教學(xué)之中[9-12],在此基礎(chǔ)上達(dá)到了較好的教學(xué)改革的效果[13-14]。相較于傳統(tǒng)的模擬示波器,數(shù)字示波器具有不同的原理和電路結(jié)構(gòu),能夠?qū)⑤斎胄盘栟D(zhuǎn)換為數(shù)字信號進(jìn)行顯示[1,15-17],具有波形參數(shù)測量、數(shù)據(jù)存儲和波形分析等多重功能。本文設(shè)計和實踐了一個新的使用數(shù)字示波器進(jìn)行語音識別的教學(xué)實驗。通過壓電陶瓷把人聲帶的振動轉(zhuǎn)換為電信號輸入數(shù)字示波器以分析受試者的聲音特征,并構(gòu)建了相應(yīng)的語音樣本數(shù)據(jù)庫,進(jìn)而通過分析受試者的聲音特征實現(xiàn)了對特定測試者的語音識別。
本文系通過壓電陶瓷的壓電效應(yīng)把人發(fā)聲部位的機械振動信號轉(zhuǎn)換為電壓信號輸入數(shù)字示波器進(jìn)行聲音特征的分析。
壓電陶瓷材料被拉伸或壓縮時,其相對的兩個表面會出現(xiàn)等量異號極化電荷;外力越大,表面極化電荷越多。壓電陶瓷被施加外電場時得到極化,此時如受到外界力的作用,電疇的界限將發(fā)生移動,方向發(fā)生偏轉(zhuǎn),導(dǎo)致極化強度改變,從而在垂直極化方向的平面上引起極化電荷變化而產(chǎn)生可被數(shù)字示波器識別的電勢差。因此,使用壓電陶瓷片,借助數(shù)字示波器可測量聲帶振動。
聲音的三種基本特性為音色(決定于發(fā)聲體的材料和結(jié)構(gòu))、音調(diào)(決定于頻率)和響度(決定于振幅)。對于不同的人來說,可通過聲音的波形圖象和發(fā)音頻率進(jìn)行聲音識別。實驗中將壓電陶瓷片貼在受試者喉部靠近聲帶處,發(fā)聲時聲帶產(chǎn)生振動。振動幅度越大,對應(yīng)響度越大,轉(zhuǎn)化為示波器信號時對應(yīng)的電壓值也越大;聲帶振動越快,對應(yīng)頻率越大,在示波器上顯示的波形的頻率越高。
實驗采用RIGOL DS2072A型數(shù)字示波器,有關(guān)參數(shù)為:模擬帶寬70 MHz,模擬通道數(shù)2,最高實時采樣率2 GSa/s,最大儲存深度56 Mpts,最高波形捕獲率50,000 wfms/s。
實驗所使用的壓電陶瓷片(型號:FT-27T-4.1A1;外徑27±0.1 mm,內(nèi)徑9±0.2 mm,諧振頻率4.1±0.5K Hz,諧振阻抗300 Ωmax)及其接線方式如圖1所示。金屬震動片及壓電陶瓷片總厚度為0.35±0.05 mm,金屬震動片厚度為0.15±0.05 mm。
圖1 壓電陶瓷片及接線方式
樂音以A=440 Hz為標(biāo)準(zhǔn),每跨一個八度,對應(yīng)的頻率翻倍。一個八度對應(yīng)12個半音,分別為:
C#CD#DEF#FG#GA#AB
這十二個半音,若f1與f2距離n個半音,則由:
(1)
可求出所有的音階。實驗中為了驗證用數(shù)字示波器顯示的圖形來測量頻率的準(zhǔn)確性,由一位受試者唱一個八度的音階進(jìn)行檢測。
測量前,調(diào)節(jié)示波器參數(shù),使水平方向掃描速率為500 ms,垂直方向衰減約為20 mV。將壓電陶瓷片緊貼在受試者喉部靠近聲帶處,保持按壓力度適中且較為恒定。當(dāng)發(fā)聲結(jié)束后示波器屏幕顯示完整的波形。
為測量同一發(fā)聲者所發(fā)出的不同頻率的聲音特性,在受試者先聆聽一段標(biāo)準(zhǔn)音階后,再發(fā)出較為標(biāo)準(zhǔn)的音階,并按上述同樣的方法進(jìn)行測量。通過讀取n個周期的總時長,計算得到受試者發(fā)出的每個音階對應(yīng)的平均頻率。
同一受試者以輕、中、響三種音量發(fā)出同一種聲音,由數(shù)字示波器記錄相應(yīng)聲音的波形。用光標(biāo)法測量電壓峰-峰值ΔY,所得數(shù)據(jù)如表1所示??梢婋S著音量增加,示波器測得的電壓ΔY值也隨之增大。因此用數(shù)字示波器測量聲帶振動時,能夠反映人聲的響度特性。
表1 不同音量下的壓電效應(yīng)電壓
為測量同一受試者所發(fā)出的不同頻率的聲音的特性,記錄該受試者發(fā)出標(biāo)準(zhǔn)音階的聲音的波形,測量n個周期的總時長計算得到每個音階對應(yīng)的平均頻率,數(shù)據(jù)結(jié)果如表2所示。通過比對測得音階頻率和標(biāo)準(zhǔn)音階頻率,發(fā)現(xiàn)二者基本吻合(圖2)。
表2 同一受試者不同音階的振動頻率
音階
可見數(shù)字示波器能夠很好地對受試者的音高進(jìn)行定量測量。音量和音高作為人聲的兩個重要特征,分別通過數(shù)字示波器測得信號的幅度和頻率得到了較為準(zhǔn)確的記錄和反映,證實了數(shù)字示波器采集人聲樣本是可行的。
為實現(xiàn)人聲識別,首先需要建立含多個受試者聲音樣本的數(shù)據(jù)庫。實驗采集了含5個受試者聲音頻率特性的語音樣本數(shù)據(jù)庫。讓各受試者以數(shù)字“1”“5”“8”“9”為發(fā)聲內(nèi)容,通過數(shù)字示波器采集相應(yīng)的聲音頻率,如表3所示。
表3 5位受試者的聲音頻率樣本數(shù)據(jù)
實驗隨機抽取了數(shù)據(jù)庫中的一位受試者作為測試樣例,按照上述方法采集其聲音樣本,數(shù)字示波器采集的其讀出四個數(shù)字的聲音的波形如圖3所示。其讀出數(shù)字“1”“5”“8”“9”的聲音頻率分別為164.5,156.3,130.9和152.4 Hz。圖4為測試樣本頻率和數(shù)據(jù)庫樣本頻率對照結(jié)果,可見測試樣例曲線(灰色)和樣例1的曲線(黑色)幾乎完全重合。
圖3 被測試者讀出四個數(shù)字的聲音波形
為了進(jìn)一步衡量該測試樣本和數(shù)據(jù)庫中已有樣本的相似度,我們分別引入歐氏距離:
(2)
和曼哈頓距離:
(3)
其中,i為數(shù)據(jù)庫樣本序號,j為測試內(nèi)容,f′為測試樣本頻率,f為數(shù)據(jù)庫中的樣本頻率。計算結(jié)果表示于表4和圖5。
表4 聲音樣本的歐氏距離和曼哈頓距離
計算得測試者聲音樣本的歐氏距離和曼哈頓距離分別為3.002和7.160,通過比對可知該兩個數(shù)值和1號樣本最為接近(表4,圖5)。事實上,抽取的測試者確實是1號受試者。以上實驗結(jié)果證實了使用數(shù)字示波器分析聲音的頻率特征能夠有效地進(jìn)行人聲識別。
數(shù)字
組別
本文利用壓電陶瓷片把人發(fā)出聲音的機械振動轉(zhuǎn)化為電信號,通過數(shù)字示波器分析聲音的音質(zhì)特征,實現(xiàn)了對聲音響度和音調(diào)的定量測量,獲得了和理論值相符的結(jié)果。另外,通過建立含多個測試者的語音樣本數(shù)據(jù)庫,通過對于測試者聲音頻率的比對成功實現(xiàn)了對特定測試者的語音識別。該實驗不僅豐富了示波器的實驗教學(xué)內(nèi)容,同時也拓展了數(shù)字示波器的應(yīng)用場景。