陳飛
摘要:該文針對藍牙耳機功能單一、續(xù)航能力短等問題,選取QuickLogic音頻芯片和CSR藍牙芯片,基于Iflytek AI智能語音服務(wù)設(shè)計了具有云交互能力的智能耳機。該耳機通過語音喚醒關(guān)鍵字控制、發(fā)送語音信息,實現(xiàn)獲取新聞、問題、音樂等內(nèi)容;通過關(guān)鍵字命令控制,無須手動切換,實現(xiàn)音頻播放控制,極其方便實用。功耗模塊設(shè)計能檢測耳機的工作狀態(tài),靈活休眠、喚醒耳機設(shè)備,有效地提升了耳機的續(xù)航能力。
關(guān)鍵詞:語音喚醒;云交互;智能耳機;功耗控制
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)28-0234-02
The Design and Implementation of a Low-Power Cloud Interactive Headphone Based on Bluetooth
CHEN Fei
(Shenzhen Grandsun Electronic Co., Ltd., Nanjing 211100, China)
Abstract: In view of few functions and short battery life of Bluetooth headphones, this article selects QuickLogic audio chip and CSR Bluetooth chip to design smart headphone with cloud interactive capabilities based on Iflytek AI intelligent voice service. The device awaken by keyword from deep sleep, and then the voice information is sent to cloud and parsed to obtain various news, questions, music and other content; through the keyword command control, user can conveniently control audio playback without manually operation. Power module can detect the working status of the headphone, flexible sleep, wake up the headphone device and effectively enhance power saving.
Key words: Sound wake-up; Cloud interaction; Smart headphone; Power control
藍牙技術(shù)是一種可靠的短距離無線連接技術(shù),以2.4至2.485 GHz的ISM頻段為載波進行通訊,目前最新的藍牙5.0版本能夠?qū)崿F(xiàn)高達2Mbps的速率。因其低延時,低功耗高速率特性能實現(xiàn)高品質(zhì)音樂傳輸,各式各樣藍牙耳機應(yīng)運而生。藍牙耳機最大的優(yōu)勢在于能實現(xiàn)高保真音樂播放,同時用戶可以不用攜帶音頻設(shè)備而在較大范圍內(nèi)隨意移動,十分便利,因此應(yīng)用空間極大。但功能單一,續(xù)航時間短是大多數(shù)藍牙耳機普遍存在的問題。本文利用CSR藍牙技術(shù)芯片[1]和Quicklogic音頻處理芯片[2]與手機云處理應(yīng)用相結(jié)合,設(shè)計一種智能的云交互藍牙耳機,使用戶能隨時聆聽感興趣的音樂、問題、新聞等。新穎的命令模式,可以通過語音就能實現(xiàn)音頻的播放、切換、音量調(diào)節(jié)等操作。配戴檢測機制能及時檢測耳機是否佩戴,從而靈活控制電源通斷,從而延長續(xù)航時間。
1 系統(tǒng)結(jié)構(gòu)
智能藍牙耳機系統(tǒng)主要由三大部分組成,耳機系統(tǒng)、手機端云應(yīng)用、云端。耳機系統(tǒng)包括音頻處理模塊,藍牙模塊,功耗控制模塊。手機端云應(yīng)用是自主設(shè)計的,工作于便攜智能設(shè)備(如手機)上的應(yīng)用程序,系統(tǒng)總統(tǒng)結(jié)構(gòu)如圖1。
音頻模塊負責(zé)音頻采集,本地語音識別。語音識別用于喚醒云交互,或者控制音頻播放。通過對硬件資源、處理能力的研究,選取Quicklogic芯片EOS S3(下文簡稱S3)實現(xiàn)音頻處理,該芯片具有豐富的音頻及輸入輸出端口,可以實現(xiàn)模擬或數(shù)字麥克風(fēng)接入、音頻數(shù)據(jù)采集或輸出等功能。功耗控制模塊的核心為距離探測傳感器,當檢測到未配戴時,使耳機系統(tǒng)進入休眠模式,達到省電效果。以CSR為核心的藍牙模塊實現(xiàn)耳機設(shè)備與手機端的連接和數(shù)據(jù)傳輸。語音數(shù)據(jù)從音頻芯片讀取,能實現(xiàn)藍牙電話、持續(xù)音頻數(shù)據(jù)流發(fā)送。手機設(shè)備端應(yīng)用通過在云端處理藍牙音頻數(shù)據(jù),解析語音的意圖,根據(jù)解析結(jié)果做出相應(yīng)處理。
2 系統(tǒng)硬件設(shè)計
2.1 EOS S3音頻硬件實現(xiàn)
傳感器芯片S3具有豐富的硬件接口和強大的音頻處理能力,核心為Cortex-M4F及uDSP,可運行實時操作系統(tǒng)實現(xiàn)軟件控制,高達512K SRAM確保軟件高速運轉(zhuǎn),可實現(xiàn)音頻算法如噪聲抑制(ANS)[3],回聲消除(AEC)[4]等。DMA及FIFO設(shè)計能加速內(nèi)部音頻數(shù)據(jù)傳輸,盡最大可能減少延時。兩路I2S 和PDM接口適應(yīng)模擬或數(shù)字麥克風(fēng)連接,同時實現(xiàn)與外部I2S設(shè)備通信。8路帶中斷能力IO能輕松實現(xiàn)與外設(shè)的連接控制。UART通信端口可用來實現(xiàn)命令控制字傳輸。
本設(shè)計采用雙數(shù)字麥克風(fēng)與PDM接口相連,在芯片內(nèi)部轉(zhuǎn)換為PCM數(shù)據(jù)。UART,I2S與中斷IO分別與藍牙芯片CSR對于端口相連。圖2中EOS S3是音頻芯片的主要實現(xiàn)電路。
2.2 功耗控制電路
接近傳感器芯片采用SFH7776,具有一路I2C和一路中斷IO。通過I2C配置參數(shù)實現(xiàn)中斷產(chǎn)生條件,如低于1CM或大于10CM時產(chǎn)生中斷。圖2所示,接近傳感器與S3相連,上電時通過I2C在S3內(nèi)編程配置,中斷信號連接到S3,條件滿足時,喚醒S3。S3根據(jù)實際狀態(tài),決定是否需要喚醒藍牙模塊。
2.3 藍牙模塊
CSR8670是專為高質(zhì)量音頻傳輸設(shè)計的可編程藍牙處理芯片。集成雙聲道模式藍牙音頻,擁有一顆低功耗的DSP做音頻處理。雙聲道16-bit ADC 高達48K采樣率,雙聲道16bit DAC 高達96K采樣率[3],高保真音頻輸出。 I2S接口支持主流的24bit音頻數(shù)據(jù)格式。充電電路支持高達200ma電流輸出,減少充電電路設(shè)計的額外開銷。藍牙電路硬件設(shè)計結(jié)構(gòu)如圖2中所示。圖中ANT處為射頻電路,是與遠端數(shù)據(jù)交互的接口,UART、I2S、CSRIRQ,CSRWAKIRQ1網(wǎng)絡(luò)標簽與音頻芯片S3對應(yīng)連接,實現(xiàn)消息交互。
3 軟件設(shè)計
3.1 EOS S3軟件框架
S3音頻采集、處理軟件(如圖3)基于FreeRTOS實現(xiàn),該系統(tǒng)免費開源,具有可裁剪、可移植、調(diào)度靈活、多任務(wù)等特性。
音頻數(shù)據(jù)采集與發(fā)送、語音喚醒、噪聲消除、中斷處理是需要實現(xiàn)的主要功能。系統(tǒng)上電復(fù)位,初始化時鐘、中斷、硬件資源,然后啟動各任務(wù)線程。語音數(shù)據(jù)緩存滿時,由中斷內(nèi)發(fā)送消息給噪聲處理線程做ANC處理,然后再發(fā)送給語音關(guān)鍵字檢測線程。經(jīng)過ANC處理的數(shù)據(jù)除去大部分噪聲,盡最大可能保留真實語音信息,能提高喚醒準確率。關(guān)鍵字算法檢測分兩種,一種為喚醒模式,一種為命令模式。喚醒模式只檢測喚醒關(guān)鍵字,當檢測到關(guān)鍵字時,發(fā)送中斷到CSR8670,開啟語音傳輸,與云端進行語音交互。命令模式檢測不同的喚醒關(guān)鍵字,然后再檢測命令,比如控制命令“艾倫,暫?!敝?,“艾倫”是關(guān)鍵字,“暫?!眲t為命令。命令由UART發(fā)送到CSR8670,經(jīng)過處理后發(fā)送到手機端解析,執(zhí)行相應(yīng)操作。
3.2 藍牙模塊軟件框架
藍牙模塊需要實現(xiàn)的功能有I2S主接收、UART接收、音頻DAC輸出、中斷處理等。圖4為軟件處理流程圖。藍牙模塊處理的數(shù)據(jù)有音頻數(shù)據(jù)和控制命令兩種。音頻數(shù)據(jù)主要針對SCO、A2DP、語音交互等模式。語音交互時,音頻數(shù)據(jù)直接發(fā)送給手機端云應(yīng)用做語義分析。從UART端接收的控制命令需要解析與編碼,針對不同的命令,如音量增加、暫停等做封裝再發(fā)送。中斷程序接收到S3的喚醒中斷信號后,喚醒藍牙芯片,進入工作模式。
3.3 云應(yīng)用軟件框架
手機端應(yīng)用CloudEcho 基于Iflytek AI語音引擎實現(xiàn),負責(zé)處理藍牙音頻信息,數(shù)據(jù)信息,音頻播放,音頻云端解析等任務(wù)。Iflytek的AI 語音引擎具有強大的語音處理能力,此處主要用語意理解,語音合成等服務(wù)。圖5為應(yīng)用與語音引擎之間的處理流程。語意理解的所有回答通過開放技能或自定義技能給出,返回結(jié)果為文字或者語音數(shù)據(jù)。為文字時,通過語音合成服務(wù)轉(zhuǎn)換為語音以藍牙播出,為音頻數(shù)據(jù)時,直接通過藍
牙播出。CloudEcho對耳機和云端的數(shù)據(jù)分別處理,實現(xiàn)智能問答、音頻播放等。
4 結(jié)論
本文所設(shè)計的智能藍牙云交互耳機具有友好的體驗效果,雙聲道音頻設(shè)計和高采樣率DAC解析實現(xiàn)高品質(zhì)音頻播放。多樣化本地命令控制輕松實現(xiàn)音樂播放控制。功耗控制方案有效節(jié)省閑時功耗。此方案所選取的硬件成本略高,但對于高端智能無線耳機的解決方案具有較好的參考價值。
參考文獻:
[1] Cambridge Silicon Radio. BlueCore Bluetooth chipset. Online at https://www.qualcomm.com/products/bluetooth.
[2] QuickLogic, Introducing the new EOS S3 LV (Low Voltage) platform - the latest addition to the EOS S3 Voice and Sensor Processing Platform Family.[2018].https://www.quicklogic.com/platforms/sensor-processing/eos/.
[3] J. Thiemann “Acoustic Noise Suppression for Speech Signals Using Auditory Masking Effects” // Ph.D. thesis, Department of Electrical & Computer Engineering, McGill University, Montreal, Canada,2001.
[4] Y. Lu, R. Fowler, W. Tian, and L. Thompson, Enhancing echo cancellation via estimation of delay, IEEE Transactions on Signal Processing ,2005, 53(11):4159-4168.
【通聯(lián)編輯:唐一東】