范存艷
摘? 要:本文對公共服務機器人的人機交互功能需求進行了分析,設計了一款基于瑞芯微RK3399芯片為核心的具有語音識別、人臉識別等功能的人機交互系統(tǒng),并針對人機交互功能需求完成了系統(tǒng)相關硬件電路的設計,所設計的系統(tǒng)可基本滿足市面上已量產(chǎn)的所有服務機器人的人機交互功能,實用性較強,具有推廣應用的價值。
關鍵詞:服務機器人,人機交互系統(tǒng),RK3399
0 引言
近些年,隨著人工智能技術的飛速發(fā)展,做為人工智能技術主要載體的公共服務機器人也開始在酒店物品運送、商場促銷導購、政務辦理等各個領域得到較大規(guī)模的應用。面部識別、語音識別等人機交互功能已成為公共服務機器人的標配功能。這些功能在帶來較好的人機交互體驗的同時,也提高了控制系統(tǒng)的復雜度,對控制系統(tǒng)的性能、成本也提出了更高要求。
基于此,本文設計了一種面向公共服務機器人的人機交互系統(tǒng),采用模塊化設計思路,降低控制系統(tǒng)復雜度,并充分考慮成本因素,可以基本滿足不同應用領域對公共服務機器人人機交互系統(tǒng)的需求,并兼顧成本考慮。
1 人機交互系統(tǒng)總體設計
目前,用于公共服務場景的機器人的人機交互功能主要是機器人通過視覺、語音技術與人進行交互且由于機器人本身計算能力和存儲能力有限,為使人機交互有較好的體驗,需要機器人連接外網(wǎng)獲取部署在云端服務器上的語音、視覺知識庫及其它豐富資源。如圖1所示,為服務機器人人機交互系統(tǒng)總體設計框圖。人機交互功能是機器人對外感知與實現(xiàn)的載體,主要應具有顯示屏、攝像頭、MIC陣列及揚聲器等常用外設,且由于機器人在人機交互時需要連接云端外網(wǎng)及本地局域網(wǎng),所以還應具有WIFI、藍牙及LTE功能,另外機器人還需要與自主移動底盤、電池等外設通訊、讀寫操作優(yōu)盤等,所以還應具有以太網(wǎng)、RS232及USB等擴展能力接口。所以,考慮到上述功能及接口需求并結合運行語音識別及視覺識別算法對計算能力的需求,本設計采用了瑞芯微的RK3399做為服務機器人人機交互系統(tǒng)的核心。圍繞RK3399搭建硬件電路,設計RK3399主板,并擴展攝像頭、觸摸顯示屏、揚聲器及MIC陣列等外設。
2 人機交互系統(tǒng)硬件設計
如圖2所示,RK3399是基于Big.Little大小核架構的低功耗高性能處理器,它包括雙核Cortex-A72、4核Cortex-A53以及獨立的NEON協(xié)處理器,可應用于計算機、個人移動互聯(lián)網(wǎng)及數(shù)字多媒體等設備。RK3399內(nèi)置多種功能強大的嵌入式硬件引擎,支持多格式視頻、高品質(zhì)的JPEG的編解碼,以及特殊圖像的預處理和后處理。內(nèi)置特殊的MMU 2D 硬解碼器能最大限度地提高顯示性能,提供流暢的體驗操作。RK3399具有高性能的雙通道存儲器接口,能夠提供高內(nèi)存帶寬,同時為應用提供了一套完整的外設接口。
考慮需要運行語音識別、人臉識別等人工智能算法,對計算能力有較高要求,所以系統(tǒng)存儲采用4GB DDR3+32GB EMMC配置。由于是機器人應用,對系統(tǒng)軟件的兼容性和穩(wěn)定性要求較高,所以本設計中采用安卓7.1版本。
2.1 語音相關電路設計
語音識別技術主要分為音頻的采集、識別、理解和合成。音頻的采集主要通過MIC陣列,目前主流技術有環(huán)形6MIC陣列以及線形4MIC陣列,二者區(qū)別在于聲源定位范圍不同,6MIC陣列為360°而4MIC陣列為180°。本文中采用6MIC采集兼容4MIC方式。由于模擬MIC采集的音頻信號為小信號,在傳輸過程中易受干擾,影響語音識別效果,所以陣列MIC選用I2S接口數(shù)字硅麥。陣列通過RK3399自帶3路I2S接口采集6路MIC音頻,每2路MIC共用一路I2S。在機器人播放語音時,為保證仍能進行正常對話,需要設計回聲消除電路。如圖3所示,由于需回采音頻功放輸出端模擬信號,需將模擬音頻轉換為數(shù)字音頻,所以采用TLV320ADC3101音頻ADC芯片,將模擬回采信號轉換為I2S音頻并輸出到RK3399第4路I2S接口。
音頻的識別、理解與合成需要連接本地私有云或外網(wǎng)公有云。合成后的語音通過音頻輸出電路播放。音頻輸出電路設計如圖4、圖5所示,采用數(shù)字音頻輸出芯片ES8316,將RK3399輸出的I2S數(shù)字音頻轉換為模擬音頻,并通過兩個音頻功放芯片CS8508E進行功率放大輸出。單個功放芯片最大輸出功率為15W,可滿足市面上主流服務機器人應用需求。
2.2 視覺識別相關電路設計
RK3399支持雙ISP,像素處理能力高達13MPix/s,支持雙路攝像頭數(shù)據(jù)同時輸入。所以本設計中綜合了成本以及功能需求選用13Mpixel的MIPI-CSI接口攝像頭做為人機交互系統(tǒng)中人臉識別、拍照及視頻通話應用的主攝像頭。RK3399有兩組MIPI-CSI輸入,均內(nèi)置ISP處理器,在雙MIPI輸入的時候可以同時使用。
2.3 顯示相關電路設計
目前市面上主流服務機器人均采用觸摸顯示屏,屏幕大小從6寸~32寸。且有部分機器人采用雙屏設計,一個較小的屏幕放在機器人頭部,用來做為機器人表情顯示。另一個較大的屏幕放在機器人胸前,用來進行業(yè)務辦理等操作。目前主流液晶屏多采用EDP接口或MIPI_DSI接口。一般較大的屏幕多采用EDP,較小的屏幕多采用MIPI_DSI接口。本設計采用兼容性設計,利用RK3399自帶的EDP接口和MIPI_DSI接口分別各擴展一塊顯示屏,實現(xiàn)雙屏顯示。用一塊10.1寸液晶屏完成機器人面部表情顯示功能,采用MIPI接口,另一塊15.6寸液晶屏采用完成業(yè)務辦理操作功能,采用EDP接口。如圖6所示為15.6寸液晶屏EDP顯示電路。
觸摸屏多采用USB、I2C或UART接口,觸摸屏廠家可根據(jù)客戶要求配不同的觸摸芯片,本設計中針對兩塊屏幕,觸摸芯片分別采用USB和I2C接口。
2.4無線功能相關電路設計
服務機器人人機交互系統(tǒng)通過語音識別、人臉識別、聲紋識別等人工智能技術與人進行信息交互,而人工智能技術對系統(tǒng)計算力和知識庫要求較高。目前公共服務機器人設計普遍的做法是將語音、人臉在本地進行采樣,將知識庫布置在云端,包括本地局域網(wǎng)私有云及公網(wǎng)公有云,信息采樣后機器人通過局域網(wǎng)或外網(wǎng)連接云端知識庫進行計算、查詢等操作,最后從云端將查詢結果返回本地。所以人機交互系統(tǒng)需要具備WIFI、藍牙、有線以太網(wǎng)及4G_LTE無線功能。如圖8所示,為WIFI&BT電路,RK3399通過芯片自帶的SDIO接口和UART接口擴展WIFI&BT芯片AP6356S。AP6356S芯片是WIFI、BT功能二合一芯片,符合IEEE 802.11 a/b/g/n/ac 2x2 MIMO標準,可以雙通道傳輸及支持雙頻段(2.4GHz&5GHz),且支持藍牙4.1。還可根據(jù)使用方式不同將AP6356S配置成熱點模式或客戶端模式。
當公共服務機器人處于某些沒有WIFI的環(huán)境時,為連接外網(wǎng)云端,需具有4G_LTE功能。如圖7所示,為4G模塊擴展電路。RK3399通過USB2.0接口及系統(tǒng)自帶I2C接口擴展移遠通信EC25 Mini PCIe模塊。EC25模塊是LTE Cat 4無線通信模塊,采用PCI Express? Mini Card標準接口。支持最大下行速率150Mbps和最大上行速率50Mbps。模塊采用堆疊方式安裝在RK3399主板上。
人機交互系統(tǒng)無線功能采用WIFI優(yōu)先模式,當WIFI和LTE功能均開啟時,LTE功能無效。而當WIFI斷網(wǎng)時,LTE自動代替WIFI連接外網(wǎng)。
2.5 電源輸入及外設接口電路設計
人機交互系統(tǒng)所需電源由RK3399主板進行電源轉換產(chǎn)生??紤]系統(tǒng)供電可能為電池或直流穩(wěn)壓電源,且公共服務機器人供電電壓普遍為直流9~24V,所以電源部分采用BQ25703充電控制器對輸入電源進行轉換。BQ25703可實現(xiàn)輸入電源的升壓與降壓轉換,且可同步給鋰電池充電。本設計中將轉換后的電源電壓穩(wěn)壓在14.8V,可對4串三元鋰電池進行充電。再通過MP8756開關電源芯片將14.8V電壓轉換為3.3V及5V常規(guī)電壓給RK3399板卡芯片供電。由于RK3399芯片系統(tǒng)對電源上電時序和電壓要求較嚴格,采用瑞芯微電源管理芯片RK808給RK3399芯片系統(tǒng)供電。
RK3399自帶2路USB2.0、2路USB3.0及TYPE C接口,考慮對外連接外設和系統(tǒng)內(nèi)部自用需求,系統(tǒng)原生的USB接口不夠,所以分別用USB2.0 HUB和USB3.0 HUB芯片GL850和GL3523進行擴展。
RK3399內(nèi)部集成了一個千兆以太網(wǎng)MAC,可以外接不同以太網(wǎng)PHY,實現(xiàn)百兆/千兆網(wǎng)絡功能。本設計中采用RTL8211E千兆以太網(wǎng)PHY擴展出以太網(wǎng)接口。
3 結論
本文為公共服務機器人人機交互系統(tǒng)提供了一種設計方案,選用RK3399芯片為控制核心,圍繞該芯片實現(xiàn)了人機交互系統(tǒng)硬件電路的設計及外設擴展??梢曰緷M足不同應用領域對公共服務機器人人機交互系統(tǒng)的需求,且由于集成度較高,使得硬件成本較低,比較有推廣價值。
參考文獻:
[1]鄧衛(wèi)斌,于國龍.社交機器人發(fā)展現(xiàn)狀及關鍵技術研究[J].科學技術與工程,2016,16(12):163-
170.