孫鵬程
國家廣播電視總局203臺(tái) 內(nèi)蒙古 呼和浩特市 010070
覆蓋全球各地的中波、短波和調(diào)頻廣播是新聞、娛樂和信息傳播的重要載體,也是輿論宣傳的重要工具。國際電信聯(lián)盟(ITU)規(guī)定了廣播頻段用途劃分。 中波廣播頻率范圍526.5~1606.5kHz,短波廣播頻率范圍1.8~26.5MHz,中國短波廣播范圍2.3~26.1MHz,調(diào)頻廣播頻率范圍87~108MHz。廣播頻率帶寬中波9kHz,短波10kHz,立體聲調(diào)頻256kHz。廣播頻率間隔中波9kHz,短波5kHz,立體聲調(diào)頻100kHz。在沒有同頻的情況下,中波120個(gè)頻率,短波825個(gè)頻率,調(diào)頻210個(gè)頻率,同時(shí)還存不同地區(qū)使用相同頻率廣播的電臺(tái),僅呼和浩特地區(qū)每季實(shí)際達(dá)到保證收聽的中、短波、調(diào)頻廣播電臺(tái)可以多達(dá)1000個(gè)以上。
為研究、協(xié)調(diào)頻率資源的更好利用,國際上ITU 成員國對(duì)無線電廣播進(jìn)行監(jiān)測(cè),并通過ITU 下設(shè)的國際頻率登記委員會(huì)(IFRB)和“世界無線電行政大會(huì)”(WARC)協(xié)調(diào)電波秩序。中國《無線電管理?xiàng)l例》也規(guī)定了無線電頻率資源使用和監(jiān)測(cè)的法規(guī),對(duì)無線電臺(tái)站進(jìn)行檢查和監(jiān)測(cè),保障無線電臺(tái)站的正常使用,維護(hù)正常的無線電波秩序。廣播電臺(tái)收測(cè)識(shí)別是這些研究協(xié)調(diào)管理的重要數(shù)據(jù)基礎(chǔ)。
廣播收測(cè)通過監(jiān)聽全部廣播頻點(diǎn),全部時(shí)間的廣播,確定一周內(nèi)每天每個(gè)時(shí)間各個(gè)頻點(diǎn)都有哪些電臺(tái)在廣播。按照國際電聯(lián)無線電規(guī)則規(guī)定各種廣播應(yīng)該在整點(diǎn)前后5 分鐘內(nèi)播報(bào)識(shí)別信號(hào),如果為避免節(jié)目中斷而沒有整點(diǎn)播報(bào),則應(yīng)該在開播、停播時(shí)播發(fā)識(shí)別信號(hào)。對(duì)于四千多個(gè)可能的頻率點(diǎn)進(jìn)行7 天×24 小時(shí)的監(jiān)測(cè),這意味著有六十多萬條10 分鐘的記錄。這些記錄全部聽一遍要4600 多人天的工作量。所以自動(dòng)廣播節(jié)目識(shí)別的方法將大大節(jié)約人力,及時(shí)為廣播監(jiān)測(cè)監(jiān)管、新聞?shì)浾撔麄?、無線電臺(tái)管理部門提供重要的基礎(chǔ)信息。
由于各個(gè)電臺(tái)在固定時(shí)刻,大多是整點(diǎn),會(huì)用典型的間奏曲和語音播報(bào)電臺(tái)呼號(hào)和節(jié)目,自然人們希望通過不常變化的間奏曲和電臺(tái)播報(bào)音頻和廣播節(jié)目音頻匹配,從而自動(dòng)識(shí)別廣播節(jié)目。但是電波經(jīng)過遠(yuǎn)距離傳播后,產(chǎn)生較大信道效應(yīng),從而使得不同時(shí)間,不同頻率廣播的相同節(jié)目在音頻波形上很大不同。
用同一臺(tái)接收機(jī)在同一天不同時(shí)間段,錄制不同頻率的“中國之聲”整點(diǎn)間奏曲開始0.5 秒的波形和時(shí)頻圖譜,如圖1 所示??梢钥吹缴厦娴囊纛l波形相當(dāng)不同,但是下面的時(shí)間-頻率二維圖譜非常接近。所以傳統(tǒng)上,可以通過比對(duì)不同音頻的時(shí)頻圖譜來做音頻識(shí)別。大多數(shù)情況這種時(shí)頻圖譜是通過短時(shí)傅里葉變換,將時(shí)域波形分割成前后部分重疊的短片段,再對(duì)各個(gè)短片段做傅里葉功率譜,就得到了信號(hào)在時(shí)間—頻率二維的分布圖譜。通常將這種二維分布用偽彩色圖片顯示。偽彩色圖譜里用不同顏色代表遞減的功率分布。圖中可以明顯看到各個(gè)頻率分量隨時(shí)間的變化和節(jié)奏。
在圖譜比對(duì)方法中,二維相關(guān)是一種傳統(tǒng)方法。但是由于接收機(jī)頻響不同,發(fā)射臺(tái)設(shè)備和配置不同,接收到的音頻在時(shí)頻圖譜上回帶有響應(yīng)頻率分布畸變,而這些畸變會(huì)顯著干擾相關(guān)計(jì)算的判決。
圖1 不同時(shí)間和頻率接收相同節(jié)目的音頻波形和時(shí)頻圖譜
基于時(shí)間頻率二維分布圖譜中包含大量音頻特征的顯示,本文作者設(shè)計(jì)了一種提取音頻特征而較好忽略無線電信道傳輸畸變和接收機(jī)頻譜響應(yīng)的方法。簡(jiǎn)單來說,在時(shí)頻圖譜中尋找特征點(diǎn),具體來說可以是時(shí)間、頻率局部區(qū)域的功率峰值。時(shí)頻圖譜中可以看出條狀的音頻信息和零散分布的噪聲。由于噪聲在頻域被圖譜分隔,不會(huì)影響有用音頻特征點(diǎn)的提取。
特征點(diǎn)提取后設(shè)計(jì)者提取特征信息并編碼。由于音頻主要信息在于頻率和時(shí)間,而不在于功率,所以僅僅提取特征點(diǎn)的頻率、時(shí)間,這樣正好避免了傳輸信道衰落變化和接收機(jī)頻響帶來的功率波動(dòng)。設(shè)計(jì)者對(duì)特征點(diǎn)采用了相對(duì)時(shí)頻位置的編碼,這樣進(jìn)一步去除了相對(duì)時(shí)間差異和整體頻率偏差帶來的干擾。這種特征編碼是一種長序列哈希編碼,事先采集足夠的節(jié)目開始曲短音頻,對(duì)每個(gè)模板生成哈希編碼,對(duì)于任何一個(gè)待識(shí)別錄音同樣進(jìn)行哈希編碼,然后將待識(shí)別編碼和所有模板編碼匹配,得出各個(gè)模板的匹配分值,再通過最佳匹配得出識(shí)別結(jié)果。
如果最佳匹配分值高于置信門限,就軟件輸出識(shí)別結(jié)果。由于時(shí)頻分析基本上是一種線性變換,如果電臺(tái)串音,會(huì)表現(xiàn)為同時(shí)保留2 個(gè)節(jié)目的特征,所以軟件可以在識(shí)別成功時(shí),再對(duì)第二匹配判斷,如果第二匹配分值合理,也會(huì)提出串音告知。
設(shè)計(jì)者從實(shí)際監(jiān)測(cè)錄音文件中提取了中國國際廣播電臺(tái)蒙古語、漢語及多種外語的播報(bào)音短音頻,制作了哈希碼模板,然后試驗(yàn)用短波接收機(jī)錄制了一些整點(diǎn)播報(bào)的音頻。設(shè)計(jì)者編寫了軟件,對(duì)這些音頻進(jìn)行編碼匹配。通過一段約2 分鐘的波斯語播報(bào)錄音及其和對(duì)應(yīng)模板匹配的結(jié)果,如圖2 所示。圖中上部是待識(shí)別錄音的時(shí)域曲線,中部是該錄音的時(shí)頻圖譜,下部是該錄音哈希碼和波斯語播報(bào)模板哈希碼的移動(dòng)匹配分?jǐn)?shù)過程。可以看出當(dāng)模板時(shí)間移動(dòng)到待識(shí)別哈希碼對(duì)應(yīng)時(shí)段時(shí),出現(xiàn)匹配峰值。
在2019年春季換頻之前,設(shè)計(jì)者錄制了某天多個(gè)時(shí)間段多個(gè)頻率的中國國際廣播電臺(tái)的整點(diǎn)播報(bào)錄音。選取可聽度較好的錄音樣本,時(shí)間為整點(diǎn)前30 秒到整點(diǎn)后90 秒。從互聯(lián)網(wǎng)資源和人工收測(cè)中挑取多個(gè)語種播報(bào),生成模板序列,對(duì)這些錄音匹配識(shí)別。樣本總數(shù)85 個(gè),扣除沒有合適模板匹配不上40 個(gè),沒有模板誤報(bào)語種6 個(gè),實(shí)際有效樣本39 個(gè),其中準(zhǔn)確識(shí)別35 個(gè)約占90%,錯(cuò)誤識(shí)別4 個(gè),約占10%。而這4 個(gè)錯(cuò)誤識(shí)別全是播報(bào)語種不在模板語種集合,預(yù)計(jì)各個(gè)語種播報(bào)模板完善后這種錯(cuò)報(bào)可以消除。所以試驗(yàn)結(jié)果證明基于哈希編碼匹配方法可以準(zhǔn)確的識(shí)別廣播節(jié)目。如表1 所示。
圖2 中國國際廣播電臺(tái)波斯語整點(diǎn)播報(bào)匹配
表1 樣本錄音識(shí)別結(jié)果表
本文提出的基于哈希編碼匹配方法來識(shí)別廣播節(jié)目的方法較好地克服了廣播信道畸變、不同接收機(jī)頻率響應(yīng)的影響有四點(diǎn)成果。第一,達(dá)到了不需要訓(xùn)練,不挑接收機(jī)的效果。第二,這種基于時(shí)頻特征編碼的方法具有較好的抗噪聲能力,對(duì)待識(shí)別的音頻質(zhì)量要求非常寬松。第三,這種方法適用于任何語言,并且同時(shí)提取語音和音樂特征,適用性較好。第四,基于時(shí)頻圖譜編碼的識(shí)別算法是一種順序處理算法,處理速度較快。