劉寧 牛特
摘要:針對在地鐵運(yùn)營服務(wù)中面臨的運(yùn)營安全管理不規(guī)范、信息咨詢服務(wù)待優(yōu)化、信息推送形式單一等諸多問題,通過分析地鐵運(yùn)營實(shí)際需求,在AI機(jī)器人服務(wù)方案基礎(chǔ)上,結(jié)合機(jī)器視覺、語音交互、人臉識別、3D SLAM及避障等關(guān)鍵技術(shù),設(shè)計(jì)了AI機(jī)器人在地鐵運(yùn)營服務(wù)中的功能,實(shí)現(xiàn)了運(yùn)營安全管理、信息咨詢優(yōu)化和廣告宣傳等應(yīng)用,對智慧軌道交通進(jìn)行了新的探索。
關(guān)鍵詞:AI機(jī)器人;地鐵運(yùn)營;機(jī)器視覺;語音交互;人臉識別;避障技術(shù)
中圖分類號:TP393文獻(xiàn)標(biāo)志碼:A文章編號:1008-1739(2020)24-54-4
0引言
近年來,隨著我國人工智能和機(jī)器人技術(shù)的不斷發(fā)展,AI機(jī)器人開始滲透到國民經(jīng)濟(jì)各行業(yè)當(dāng)中。這些機(jī)器人的使用不僅可以降低人力成本,而且能夠提升工作精準(zhǔn)度和專業(yè)度,從而提高生產(chǎn)效率。在某些行業(yè),AI機(jī)器人已經(jīng)取代人力,成為行業(yè)勞動生產(chǎn)力的主力軍。隨著機(jī)器人的大量使用,我國已經(jīng)成為全球最大的AI機(jī)器人市場。
在地鐵行業(yè),智慧地鐵和智能運(yùn)營等概念逐步提出并快速發(fā)展。利用傳感檢測、機(jī)器視覺、大數(shù)據(jù)分析、人工智能等技術(shù)打造的智能服務(wù)機(jī)器人,已逐步開始應(yīng)用且不斷發(fā)展,機(jī)器人助力地鐵運(yùn)營已成為常態(tài)。
隨著我國城市化進(jìn)程不斷加快,城市軌道交通也在飛速發(fā)展。截止2018年底,中國大陸地區(qū)共有35個(gè)城市開通城市軌道交通運(yùn)營線路185條,運(yùn)營線路總長度5 761.4 km,全年累計(jì)完成客運(yùn)量210.7億人次[1]。作為城市經(jīng)濟(jì)發(fā)達(dá)程度的重要標(biāo)志,地鐵建設(shè)對于城市均衡發(fā)展和居民出行便利意義重大,但是受線路長、站點(diǎn)多、客流大等因素的影響,還普遍存在運(yùn)營安全管理不規(guī)范、信息咨詢服務(wù)待優(yōu)化、信息推送形式單一等問題,這些問題的存在給傳統(tǒng)的地鐵運(yùn)營服務(wù)提出了更高要求。
1 AI機(jī)器人服務(wù)方案
1.1總體架構(gòu)
基于技術(shù)的不斷進(jìn)步,提出了智慧軌道交通的新概念。在此概念之下,利用圖像處理、機(jī)器視覺、語音交互技術(shù)、人臉識別、物體識別、3D SLAM技術(shù)、避障技術(shù)及大數(shù)據(jù)智能分析等技術(shù)打造的智能機(jī)器人,取得了良好的應(yīng)用和發(fā)展,機(jī)器人助力地鐵運(yùn)營已成為常態(tài)。目前的地鐵機(jī)器人系統(tǒng)架構(gòu)采用分層設(shè)計(jì),整體分為基礎(chǔ)層、支撐層、應(yīng)用層和展現(xiàn)層4層,以及安全保障和標(biāo)準(zhǔn)規(guī)范兩大體系,如圖1所示。
①基礎(chǔ)層構(gòu)建AI機(jī)器人的多維感知體系,包含感知類和設(shè)施類。感知類可以分為視頻傳感、GPS定位、紅外傳感、超聲波傳感、圖像傳感、機(jī)械臂、激光傳感、藍(lán)牙;設(shè)施類可以分為云平臺、通信網(wǎng)絡(luò)及應(yīng)用服務(wù)器等。
②支撐層為智能AI機(jī)器人提供支撐服務(wù),包括圖像處理、人臉識別、3D SLAM、大數(shù)據(jù)分析、語音識別、物體識別、避障技術(shù)及GPS導(dǎo)航等。
③應(yīng)用層提供各種應(yīng)用,分為運(yùn)營安全、信息咨詢、廣告宣傳和其他內(nèi)容4大類。
④展現(xiàn)層包含全身半身動作、液晶顯示器、人臉識別、手機(jī)App、物品識別和藍(lán)牙識別。
2 AI機(jī)器人關(guān)鍵技術(shù)
2.1機(jī)器視覺技術(shù)
機(jī)器視覺是一項(xiàng)綜合技術(shù),包括圖像處理、機(jī)械工程技術(shù)、控制、電光源照明、光學(xué)成像、傳感器、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)等。機(jī)器視覺能夠?qū)y量目標(biāo)或研究對象轉(zhuǎn)換成規(guī)定格式的數(shù)字圖像信息,圖像處理系統(tǒng)選擇預(yù)先設(shè)置的圖像處理算法,根據(jù)圖像承載的像素、亮度、顏色等物理信息進(jìn)行各種運(yùn)算來獲取目標(biāo)物體的特征信息。機(jī)器視覺圖像處理技術(shù)基于FPGA的底層圖像信號處理器(Image Signal Processor,ISP)算法[2]。
2.2語音交互技術(shù)
語音交互功能是機(jī)器人的基本智能交互功能之一,主要包括6個(gè)技術(shù)模塊[3],如圖2所示。
①語音識別模塊:實(shí)現(xiàn)用戶輸入語音到文字的識別轉(zhuǎn)換。
②語言解析模塊:對語音識別結(jié)果進(jìn)行分析理解,獲得給定輸入的內(nèi)部表示。
③問題求解模塊:依據(jù)語言解析器的分析結(jié)果進(jìn)行問題的推理或查詢,求解用戶問題的答案。
④對話管理模塊:基于對話歷史調(diào)度人機(jī)交互機(jī)制,輔助語言解析器對語音識別結(jié)果進(jìn)行正確的理解,為問題求解提供幫助,并指導(dǎo)語言的生成過程。
⑤語言生成模塊:根據(jù)解析模塊得到的內(nèi)部表示,在對話管理機(jī)制的作用下生成自然語言句子。
⑥語音合成模塊:將生成模塊生成的句子轉(zhuǎn)換成語音輸出。
2.3人臉識別和物體識別技術(shù)
人臉識別是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。物體識別是對三維世界的客體及環(huán)境的感知和認(rèn)識,屬于高級的計(jì)算機(jī)視覺范疇。
①實(shí)例學(xué)習(xí):將人臉檢測視為區(qū)分非人臉樣本與人臉樣本的2類模式,通過對人臉樣本集合非人臉樣本集進(jìn)行學(xué)習(xí)以產(chǎn)生分類器。
②子空間方法:在人臉識別中利用的是主元子空間,而人臉檢測利用的是次元子空間,用待檢測區(qū)域在次元子空間上的投影能量,即待檢測區(qū)域到特征臉子空間的距離作為檢測統(tǒng)計(jì)量。
③空間匹配濾波器方法:包括各種模板匹配方法、合成辨別函數(shù)方法等,以數(shù)字圖像處理與識別為基礎(chǔ)的結(jié)合人工智能、系統(tǒng)學(xué)等學(xué)科的研究方向[4]。
2.4 3D SLAM技術(shù)
同時(shí)定位與建圖(Simultaneous Localization and Mapping,SLAM)是指機(jī)器人在自身位置不確定的條件下,在完全未知環(huán)境中創(chuàng)建地圖,同時(shí)利用地圖進(jìn)行自主定位和導(dǎo)航[5]。機(jī)器人在位置環(huán)境中從一個(gè)未知位置開始移動,在移動過程中根據(jù)位置估計(jì)和傳感器數(shù)據(jù)進(jìn)行自身定位,同時(shí)建造增量式地圖。
基于霍夫曼方法的SLAM的基本過程是:①使用擴(kuò)展卡爾曼濾波(Extend Kalman Filter,EKF)進(jìn)行定位;②獲取所有路標(biāo)和機(jī)器人的位置信息作為先決條件;③使用矢量方程存儲路標(biāo)和機(jī)器人的位置;④通過循環(huán)迭代減少每次的誤差量。
2.5避障技術(shù)
避障是指機(jī)器人在行走過程中,通過傳感器感知在其規(guī)劃路線上存在靜態(tài)或動態(tài)障礙物時(shí),按照一定的算法實(shí)時(shí)更新路徑,繞過障礙物,最后達(dá)到目標(biāo)點(diǎn)。機(jī)器人避障技術(shù)的基礎(chǔ)是移動機(jī)器人自身狀態(tài)的確定和周圍環(huán)境信息的獲取,這些信息都是通過安裝在機(jī)器人上的傳感器獲取的。通過傳感器進(jìn)行前端信息的獲取并提取特征,最終進(jìn)行決策融合達(dá)到聯(lián)合識別的結(jié)果[6],如圖4所示。
3 AI機(jī)器人的應(yīng)用
結(jié)合地鐵運(yùn)營管理業(yè)務(wù)實(shí)際,并且利用上述關(guān)鍵技術(shù),系統(tǒng)主要實(shí)現(xiàn)了以下幾個(gè)方面的實(shí)際應(yīng)用。
3.1運(yùn)營安全管理
運(yùn)營安全管理主要有以下方面的應(yīng)用:
①安檢核查:機(jī)器人采用人臉識別和物體識別技術(shù),進(jìn)行安檢核查。
②特殊通道檢票:機(jī)器人在特殊通道進(jìn)行出入登記和檢票。
③夜間巡邏:在夜間地鐵站關(guān)閉后,由機(jī)器人對地鐵站進(jìn)行無死角巡邏,一旦發(fā)現(xiàn)可疑蹤跡和安全隱患,可以立即上報(bào)。
④應(yīng)急指揮疏散:在出現(xiàn)緊急事故時(shí),機(jī)器人可協(xié)助現(xiàn)場工作人員對乘客進(jìn)行緊急疏散。
⑤救援探測:在出現(xiàn)危險(xiǎn)事故時(shí),可利用機(jī)器人進(jìn)入危險(xiǎn)區(qū)域進(jìn)行救援探測,節(jié)省救援時(shí)間,降低人員傷亡幾率。
⑥上車安全確認(rèn):機(jī)器人確認(rèn)安全門是否正常關(guān)閉,并且自行上報(bào)。
3.2信息咨詢優(yōu)化
信息咨詢優(yōu)化主要有以下方面的應(yīng)用:
①語音對話:機(jī)器人具有智能語音對話功能,可提供地鐵運(yùn)營、換乘相關(guān)地鐵班次等相關(guān)咨詢。
②導(dǎo)航引路:機(jī)器人可學(xué)習(xí)規(guī)定區(qū)域內(nèi)的地圖信息、位置信息等,為乘客提供精確的導(dǎo)航引路功能,并滿足智能避障功能。
③聯(lián)系客服:機(jī)器人具有語音通信功能,并與車站無線和車站電話互聯(lián)互通,乘客可以通過機(jī)器人呼叫地鐵客服咨詢問題,投訴、上報(bào)可疑事件等。
3.3廣告宣傳
廣告宣傳主要有以下方面的應(yīng)用:
①分流引導(dǎo):機(jī)器人可在地鐵入口處進(jìn)行限流,待接到放行指令后再繼續(xù)放行乘客進(jìn)站乘車,同時(shí)可引導(dǎo)密集通道處的乘客到人數(shù)相對較少的通道內(nèi)排隊(duì)等候。
②廣告運(yùn)營:機(jī)器人可通過播放預(yù)定義的視頻或通過客戶端推送視頻播放廣告。
③系統(tǒng)對接:機(jī)器人顯示屏可以根據(jù)地鐵運(yùn)營需要,與乘客信息系統(tǒng)對接,并通過機(jī)器人上的攝像頭及傳感器來統(tǒng)計(jì)各種廣告對乘客的吸引程度。
3.4其他內(nèi)容優(yōu)化
其他方面的應(yīng)用有2個(gè):
①遠(yuǎn)程控制:地鐵運(yùn)營人員可以通過手機(jī)App遠(yuǎn)程控制機(jī)器人,對站內(nèi)運(yùn)營情況、人員工作狀態(tài)、突發(fā)情況進(jìn)行巡視,便于遠(yuǎn)程了解各站的運(yùn)營情況。
②行李托運(yùn):機(jī)器人可為乘客提供負(fù)重托運(yùn)服務(wù),采用模塊化設(shè)計(jì),能夠進(jìn)行多種方式組合的托運(yùn)。
4結(jié)束語
目前機(jī)器人技術(shù)發(fā)展日新月異,機(jī)器人從單體作業(yè)向可自主學(xué)習(xí)、自律行動的方向發(fā)展。除了傳感器技術(shù)、軟件信息處理能力的提升進(jìn)步之外,深度學(xué)習(xí)等AI技術(shù)(圖像與語音識別、機(jī)器、學(xué)習(xí))的跨越式發(fā)展,也推動了機(jī)器人自身能力的進(jìn)一步提升,使機(jī)器人能夠從事更加高級的工作。機(jī)器人從過去的簡單重復(fù)性勞動,變得能夠互聯(lián)、共享,甚至協(xié)同工作。
基于AI機(jī)器人的地鐵運(yùn)營應(yīng)用是一項(xiàng)復(fù)雜的工程。地鐵機(jī)器人在地鐵中的應(yīng)用越來越受關(guān)注,隨著機(jī)器人技術(shù)的發(fā)展,其自身的功能和性能將會進(jìn)一步提高,可以開發(fā)出更多的地鐵應(yīng)用模式,在這個(gè)過程中可能會遇到一些新的問題,期望越來越多的人共同來探索和解決。
參考文獻(xiàn)
[1]佚名.城市軌道交通2018年度統(tǒng)計(jì)和分析報(bào)告[J].城市軌道交通,2019(4):16-34.
[2]龔愛平.基于嵌入式機(jī)器視覺的信息采集與處理技術(shù)研究[D].杭州:浙江大學(xué),2013.
[3]李振宇.面向教育機(jī)器人的語音交互系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].武漢:華中師范大學(xué),2018.
[4]沈?qū)W舉,王永仲,姚廣濤.Vander Lugt相關(guān)器中幾種空間匹配濾波器算法比較[J].光學(xué)技術(shù),2008(2):314-316.
[5]耿長良.3D SLAM技術(shù)在軌道交通竣工測量中的應(yīng)用[J].北京測繪,2020,34(10):1463-1467.
[6]呂漫麗.基于多傳感器信息融合的移動機(jī)器人避障研究[D].吉林:東北電力大學(xué),2008.