鄧城 張欽鋒 詹宏林 麥強
摘要:針對會議中采用的同聲傳譯系統(tǒng)存在設備鋪設麻煩,信號受到干擾重疊或用戶數(shù)量有限等問題,根據(jù)會議同聲傳譯系統(tǒng)在室內(nèi)使用的特點,提出利用照明LED光源進行可見光通信來實現(xiàn)信號的傳輸。綜合利用,STC單片機、LED驅(qū)動電路,LED燈、光電傳感器,藍牙模塊和樹莓派等硬件模塊,通過科大訊飛開放平臺進行語音識別、轉(zhuǎn)寫、機器翻譯,實現(xiàn)了中英同聲傳譯功能。通過實驗對系統(tǒng)可靠性進行了驗證,系統(tǒng)能夠準確進行語音翻譯,并通過LED燈將信息發(fā)送至接收端,完成同聲傳譯功能。
關(guān)鍵詞:LED可見光通信;機器翻譯;語音合成
中圖分類號:TN929 文獻標識碼:A 文章編號:1007-9416(2019)11-0025-02
0 引言
隨著國際文化交流日益頻繁,各國語言存在差異,翻譯人員的需求劇增,而人工智能的高速發(fā)展,機器翻譯的準確率越來越高,利用語音轉(zhuǎn)寫與機器翻譯可以實現(xiàn)同聲傳譯的功能。
目前會議采用的無線同聲傳譯系統(tǒng)的通信方式主要有紅外輻射式、藍牙傳輸式和射頻發(fā)射式。但由于在會場場地限制下,存在著安裝、調(diào)試很不方便,R容易被干擾,無法大量用戶同時使用等問題。
本文根據(jù)同聲傳譯會議系統(tǒng)的特點和應用范圍,提出利用會場照明LED燈進行通信的新方式,設計一套采用LED可見光通信技術(shù)的會場同聲傳譯系統(tǒng)。利用科大訊飛平臺,實現(xiàn)人工智能同聲傳譯,減少了對翻譯人員的依賴,并用了LED可見光通信技術(shù),通過LED燈光進行高頻閃爍,進行數(shù)據(jù)的傳輸。因為閃爍頻率高,人眼無法識別,所以LED燈在正常照明的同時,還是實現(xiàn)了通信的功能。同時用戶只需要在燈光能照到的地方就可以接收到信號,實現(xiàn)了大用戶量實時通信,參會人數(shù)不受限制,可廣泛應用于各種會議現(xiàn)場,具有一定市場前景。
1 系統(tǒng)工作原理與設計方案
1.1 系統(tǒng)工作原理
基于LED可見光通信的中英同聲傳譯系統(tǒng)是發(fā)言人通過麥克風說完一句話后,翻譯器會將發(fā)言的語音翻譯成中文或者英文的文本,并通過無線通信發(fā)送至會議室頂端的LED燈具,再以二進制形式通過LED燈光發(fā)送。聽眾戴上安裝有接收器的耳機,在會場LED燈光照射范圍內(nèi)就可以接收到信號,通過接收器解碼和語音合成后還原出中文或者英文的語音信號,并利用按鍵來選擇播放中文或者英文。
系統(tǒng)工作原理示意圖如圖1所示,主要由語音采集及人工智能翻譯,LED可見光通信信號發(fā)射,光信號接收與語音播放三個部分構(gòu)成。
語音采集及人工智能翻譯的工作原理是基于科大訊飛開放平臺進行語音翻譯,通過麥克風接收語音信號,將語音信號轉(zhuǎn)換為文本,再通過機器翻譯轉(zhuǎn)換為對應的中英文本。
LED可見光通信信號發(fā)射的工作原理是通過微控制芯片來控制LED燈,以每秒數(shù)百萬次的閃爍,其中燈亮代表1,燈滅代表0。將文本以二進制形式編碼調(diào)制成燈光信號,從而進行有效的中文和英文的文本傳輸了。
光信號接收與語音播放的工作原理是通過光電傳感器接收LED燈的光信號,并將光信號轉(zhuǎn)換為電信號,經(jīng)過信號處理后,進行語音合成播放。
1.2 系統(tǒng)設計方案
根據(jù)系統(tǒng)的工作原理,將系統(tǒng)框架分成了語音處理與翻譯端、LED可見光通信發(fā)射端,光信號接收與播放端,如圖2所示。
語音處理與翻譯端是通過樹莓派3B+將麥克風的語音信號錄制為WAV格式,并將音頻文件上傳至科大訊飛開放平臺,通過平臺將語音轉(zhuǎn)換為文本,再將文本進行機器翻譯為目標語言文本,最后通過藍牙將文本發(fā)送LED燈具。
LED可見光通信發(fā)射端是通過藍牙模塊接收語音處理與翻譯端的文本信息后,利用單片機進行編碼,并通過驅(qū)動電路將信息調(diào)制到LED燈光進行發(fā)射。
光信號接收與播放端是通過PIN光電二極管將LED燈光信號轉(zhuǎn)換為電信號,再進行IV轉(zhuǎn)換放大比較處理,通過單片機進行解碼,并將用戶選擇的語言文本送到訊飛SX-TTSCv4.0語音合成模塊進行語音合成播放。
2 系統(tǒng)軟件設計
2.1 語音翻譯處理流程
語音翻譯部分主要流程如圖3所示,首先樹莓派初始化,掃描錄音按鍵,判斷錄音鍵是否按下,如果按下開始錄音,反之繼續(xù)判斷。錄音完成后,判斷按鍵1(中文轉(zhuǎn)英文)和按鍵2(英文轉(zhuǎn)中文)是否按下,如果按下開始轉(zhuǎn)換并從串口發(fā)送數(shù)據(jù),反之就繼續(xù)錄音直到按鍵按下后結(jié)束(最長時間為1分鐘)。
2.2 語音轉(zhuǎn)寫處理流程
語音轉(zhuǎn)寫流程圖如圖4所示,首先調(diào)用預處理接口,上傳音頻文件的基本信息、分片信息及相關(guān)的可配置參數(shù)。調(diào)用成功,返回任務ID。預處理成功,調(diào)用文件上傳接口。
按預處理設置的分片信息依次上傳音頻切片,直到全部切片上傳成功;上一切片成功上傳,才可進行下一切片的上傳操作。調(diào)用過程中若出現(xiàn)異常,可重試若干次。
全部文件切片上傳成功后,調(diào)用該接口,通知服務端進行文件合并與轉(zhuǎn)寫操作。該接口不會返回轉(zhuǎn)寫結(jié)果,而是通知服務端將任務列入轉(zhuǎn)寫計劃。轉(zhuǎn)寫的結(jié)果通過getResult接口獲取。
2.3 機器翻譯處理流程
機器翻譯流程圖如圖5所示,首先通過接口密鑰基于hamc-sha256計算簽名,將簽名以及其他參數(shù)放在Http Request Header中,請求參數(shù)以及圖片數(shù)據(jù)放在Http Request Body中,以POST表單的形式提交,向服務器端發(fā)送Http請求后,接收服務器端的返回結(jié)果。
3 系統(tǒng)測試分析
為了驗證發(fā)送端串口通過LED燈光發(fā)送的數(shù)據(jù)與接收端接收的數(shù)據(jù)是否一致,采用示波器測試發(fā)送端的串口發(fā)送數(shù)據(jù)的波形,再與接收端發(fā)送到科大訊飛語音芯片上的波形進行對比,并且通過擴音器來驗證播放的語音。如圖6所示,為發(fā)送和接收端的示波器波形圖,可以發(fā)現(xiàn)發(fā)送端與接收端的數(shù)據(jù)波形是一致的,而且語音合成芯片成功播報出對應的語音。
4 結(jié)語
本設計方案提出了一種能應用于室內(nèi)會議場所的同聲傳譯系統(tǒng),該系統(tǒng)通過LED可見光通信進行數(shù)據(jù)通信,解決了現(xiàn)有系統(tǒng)安裝調(diào)試麻煩,用戶數(shù)量有限的問題。通過對系統(tǒng)的工作原理分析,設計了一套完整的系統(tǒng)方案和系統(tǒng)軟件。通過實驗驗證了收發(fā)數(shù)據(jù)的一致性,該方案可以有效完成中英翻譯播放功能,并且實現(xiàn)了LED兼顧照明的同時完成通信功能,具有一定的市場應用價值。
參考文獻
[1] 麥強,卓惠佳,廖曉琳,劉洋.可見光通信調(diào)光技術(shù)研究[J].中國新通信,2018,20(24):16-18.
[2] 于正永,唐萬春.一種全雙工VLC無線導覽系統(tǒng)的設計及實現(xiàn)[J].無線光通信,2017(10):37-41.
[3] 王浪.室內(nèi)可見光通信LEDs選擇及調(diào)制技術(shù)的研究[D].長春:吉林大學,2017.