阿爾德巴蘭(上海)有限公司
NAO
——?jiǎng)?chuàng)造交互型的機(jī)器人
阿爾德巴蘭(上海)有限公司
本文介紹NAO機(jī)器人的基本功能以及阿爾德巴蘭公司的發(fā)展歷程。
機(jī)器人,NAO,可編程,交互,開源
機(jī)器人NAO是各種軟、硬件巧妙結(jié)合的獨(dú)特產(chǎn)物,由大量傳感器、電機(jī)和軟件構(gòu)成,所有軟件由專門設(shè)計(jì)的操作系統(tǒng)NAOqi來控制。
NAO雖然目前還尚未進(jìn)入家庭,但已在教育界成為一顆耀眼的明星。在70多個(gè)國家里,它走入中學(xué)和大學(xué)的信息技術(shù)和科技專業(yè)課堂,許多大學(xué)生借助NAO,以寓教于樂、學(xué)以致用的方式學(xué)習(xí)編程。
NAO也征服了一大批程序開發(fā)人員。在他們眼里,NAO是一個(gè)功能強(qiáng)大、具有驚人表現(xiàn)力的應(yīng)用程序創(chuàng)建平臺(tái),可以讓大量設(shè)想變?yōu)楝F(xiàn)實(shí),由此開辟出程序開發(fā)的新天地,也為日后創(chuàng)作出面向大眾的機(jī)器人鋪平了道路。
NAO是一個(gè)身高58cm的可編程仿人機(jī)器人,內(nèi)含以下構(gòu)件:
1)擁有25個(gè)自由度的身體,主要元件為電機(jī)和電動(dòng)致動(dòng)器;
2)傳感器系統(tǒng),包括:2個(gè)攝像頭、4個(gè)麥克風(fēng)、聲納測距儀、2套紅外線接收器和發(fā)送器、1個(gè)慣性器件板、9個(gè)觸摸傳感器和8個(gè)壓力傳感器;
3)多種交流設(shè)備,包括語音合成器、LED燈及2個(gè)高保真揚(yáng)聲器;
4)英特爾ATOM 1.6 GHz處理器(位于頭部),運(yùn)行Linux內(nèi)核,并支持Aldebaran公司獨(dú)家開發(fā)的中間件(NAOqi);
5)第二個(gè)CPU位于軀干;
6)27.6瓦時(shí)電池,根據(jù)使用情況,可為NAO提供超過1.5個(gè)小時(shí)的自主動(dòng)力。
2.1 全方位行走
NAO行走使用的是一個(gè)簡單的動(dòng)態(tài)模型(直線倒立擺)和二次規(guī)劃,通過關(guān)節(jié)傳感器反饋的信息保持穩(wěn)定,保證行走的魯棒性,免受小干擾,并可吸收軀干在正向和側(cè)向平面上的擺動(dòng)。NAO可在多種地面上行走,如地毯、瓷磚地、木地板等,而且在行走過程中能夠順利地從一種地面走到另一種地面上。
NAO的運(yùn)動(dòng)模塊基于廣義逆運(yùn)動(dòng)學(xué),可處理笛卡爾坐標(biāo)系、關(guān)節(jié)控制、平衡、冗余性和任務(wù)優(yōu)先性。換言之,如果用戶要求NAO伸出手臂,由于需要同時(shí)考慮到其手臂和腿部的關(guān)節(jié),NAO在執(zhí)行這個(gè)動(dòng)作時(shí)會(huì)向前俯身。
為保持平衡,NAO會(huì)自動(dòng)停止移動(dòng)。
2.2 摔倒管理器
摔倒管理器可在NAO摔倒時(shí)起到一定的保護(hù)作用,其主要功能是探測NAO的質(zhì)量中心是否超出了支撐多邊形。后者由機(jī)器人的足底與地面的接觸點(diǎn)來決定。一旦探測到機(jī)器人摔倒?fàn)顩r,所有運(yùn)動(dòng)任務(wù)都會(huì)被終止,NAO的雙臂會(huì)根據(jù)摔倒方向采取保護(hù)姿勢(shì),機(jī)器人的質(zhì)心會(huì)降低,剛度會(huì)降至零。
NAO擁有兩個(gè)攝像頭,可追蹤、記憶并識(shí)別不同的圖像和人臉。
NAO配備了2個(gè)920p攝像頭,每秒最多可攝取30個(gè)圖像。一個(gè)攝像頭位于NAO前額,負(fù)責(zé)水平掃視。另一個(gè)位于嘴部,掃描周圍環(huán)境。用戶可通過軟件獲得NAO看到的圖片和視頻流。
NAO包含有一系列算法,可幫助機(jī)器人探測并識(shí)別出看到的人臉或形狀。這樣,NAO就可以認(rèn)出和它說話的人,也可以找到皮球或更加復(fù)雜的物品。這些算法以盡量減少CPU使用資源為宗旨特別開發(fā)而成。
此外,用戶可以通過NAO的軟件開發(fā)工具包(SDK)自行開發(fā)模塊,并與OpenCV接口(OpenCV是最初由英特爾公司開發(fā)的開源計(jì)算機(jī)視覺模塊庫);用戶也可直接在NAO上運(yùn)行模塊,或是將其傳送到與NAO相連的電腦上執(zhí)行,從而可以很容易地使用OpenCV的顯示功能,通過反饋的圖像來開發(fā)和測試算法。
NAO使用4個(gè)麥克風(fēng)來探測聲音,并可通過語音識(shí)別和聲音合成功能,運(yùn)用8種語言與人交流。
4.1 聲源定位
聲源定位功能可幫助機(jī)器人辨別出聲源方向。為了獲得魯棒且有用的輸出數(shù)據(jù),并同時(shí)考慮到內(nèi)存和CPU的限制,NAO的聲源定位基于一個(gè)名為“到達(dá)時(shí)間差”的方法。當(dāng)近處一個(gè)聲源發(fā)出聲音時(shí),NAO的4個(gè)麥克風(fēng)接收到聲波的時(shí)間會(huì)略有不同。
例如,如果一個(gè)人站在NAO左邊和它說話,其聲波會(huì)首先到達(dá)左側(cè)麥克風(fēng),在幾微秒后到達(dá)位于前方和后方的麥克風(fēng),最后到達(dá)右側(cè)麥克風(fēng)。這種時(shí)間差名為“雙耳時(shí)間差”,可對(duì)其進(jìn)行數(shù)學(xué)處理,以確定聲源的位置。由此,NAO在每次聽到聲音時(shí),都可通過4個(gè)麥克風(fēng)上的“雙耳時(shí)間差”數(shù)據(jù),經(jīng)過運(yùn)算,確定聲源的方向(方位角和仰角)。這個(gè)功能由名為“ALAudioSourceLocalization”的NAOqi模塊來完成,并提供C++和Python接口,可使用Python腳本或NAOqi模塊進(jìn)行精確互動(dòng)。
此外,Chorégraphe軟件中包含兩個(gè)指令盒,幫助用戶在行為程序中很容易地使用該功能,如:探測、追蹤并識(shí)別人;探測、追蹤并識(shí)別發(fā)聲物體;在某個(gè)特定方向進(jìn)行語音識(shí)別;在某個(gè)特定方向識(shí)別說話的人;遠(yuǎn)程跟蹤/安全應(yīng)用程序;娛樂用應(yīng)用程序。
4.2 音頻信號(hào)處理
在機(jī)器人上,嵌入式處理器的運(yùn)算能力往往很有限,因此有必要在電腦或服務(wù)器上進(jìn)行某些遠(yuǎn)程運(yùn)算。這一點(diǎn)在處理音頻信號(hào)時(shí)尤其重要,在一個(gè)遠(yuǎn)程處理器上進(jìn)行語音識(shí)別往往會(huì)更加有效、快速和準(zhǔn)確。大多數(shù)智能手機(jī)都可完成此類遠(yuǎn)程語音識(shí)別。
不過,一些機(jī)器人用戶會(huì)更喜歡將自行開發(fā)的信號(hào)處理算法直接安裝在機(jī)器人上。NAOqi的環(huán)境使用簡單對(duì)象訪問協(xié)議(Simple Object Access Protocol,SOAP),通過網(wǎng)絡(luò)收發(fā)音頻信號(hào),借助高級(jí)Linux聲音構(gòu)架庫(ALSA)產(chǎn)生聲音并儲(chǔ)存在NAO上。
ALAudioDevice模塊管理音頻輸入和輸出。
NAO的語音功能可幫助用戶在電信和人機(jī)互動(dòng)領(lǐng)域開展廣泛的研究和實(shí)驗(yàn)工作。例如,用戶可把NAO用作交流工具,像對(duì)人一樣和NAO對(duì)話。
5.1 觸摸傳感器
除了攝像頭和麥克風(fēng)以外,NAO還配備了電容式傳感器,分別位于頭頂(分為三部分)和雙手。
用戶可以通過觸摸機(jī)器人向其發(fā)送信息,例如輕按頭部一次,讓NAO停止動(dòng)作。這些傳感器也可用于觸發(fā)一些相關(guān)動(dòng)作。
該系統(tǒng)配有LED燈,可顯示接觸類型。用戶還可設(shè)定復(fù)雜的序列。
5.2 聲納測距儀
NAO配備有2個(gè)聲納信道,2個(gè)發(fā)送器和2個(gè)接收器。由此,NAO可估測與周圍障礙物之間的距離,探測范圍為0-70cm。
如果與障礙物相距不到15cm,NAO不會(huì)收到具體的距離數(shù)據(jù),只會(huì)知道附近有一個(gè)物體。
6.1 以太網(wǎng)及無線上網(wǎng)
目前,NAO支持Wi-Fi 無線上網(wǎng)(b/g/n)和以太網(wǎng)。這是目前最常用的網(wǎng)絡(luò)通信協(xié)議。此外,NAO還可通過安裝在雙眼內(nèi)的紅外線收發(fā)器連接到周圍的物體上。NAO與Wi-Fi IEEE 802.11g標(biāo)準(zhǔn)兼容,可在WPA和WEP網(wǎng)絡(luò)使用,從而可以連接到大多數(shù)家用和企業(yè)網(wǎng)絡(luò)。NAO的操作系統(tǒng)支持以太網(wǎng)和Wi-Fi 連接。在設(shè)置Wi-Fi時(shí),只需輸入密碼即可。
NAO的聯(lián)網(wǎng)功能為開發(fā)其應(yīng)用提供了大量空間,用戶可使用網(wǎng)絡(luò)上的任意一臺(tái)電腦來控制NAO或?yàn)槠渚幊?。如?/p>
1)通過IP地址,NAO可以知道自己身處何地,并向用戶提供個(gè)性化的天氣預(yù)報(bào);
2)向NAO提出一個(gè)關(guān)于某主題的問題,它會(huì)自動(dòng)鏈接到維基百科,找到并讀出相應(yīng)的解釋 ;
3)將NAO連至一個(gè)音頻流,它會(huì)為用戶播放某個(gè)在線電臺(tái)的廣播節(jié)目;
4)使用XMPP技術(shù)(類似Google Chat討論技術(shù)),遠(yuǎn)程控制NAO并獲取其攝像頭的視頻流。
6.2 紅外線
NAO可憑借紅外線技術(shù)與其他NAO及其他使用紅外線的設(shè)備進(jìn)行交流。用戶可設(shè)置NAO,通過紅外線交流來控制其他設(shè)備(如“NAO,請(qǐng)把電視打開!”)。NAO還可接收由遙控器等紅外線發(fā)射器發(fā)送的指令。當(dāng)然,兩個(gè)機(jī)器人NAO之間可直接交流。
紅外線技術(shù)是目前最常見的設(shè)備控制方法,這使NAO很容易適應(yīng)家庭自動(dòng)化應(yīng)用。NAO還可確定紅外線信號(hào)是來自左側(cè)還是右側(cè)。
5年多以來,Aldebaran Robotics(阿爾德巴蘭機(jī)器人公司)一直致力于為機(jī)器人平臺(tái)開發(fā)嵌入式系統(tǒng),并希望與廣大仿人機(jī)器人研究人員、程序開發(fā)員及新興項(xiàng)目策劃和執(zhí)行人員分享多平臺(tái)建設(shè)工具、中央交流庫和其他基本模塊。用戶可憑借Aldebaran Robotics公司的豐富經(jīng)驗(yàn),專注于開發(fā)精彩的創(chuàng)新程序。此外,用戶還可獲得強(qiáng)大的創(chuàng)新技術(shù)支持,而創(chuàng)新正是迅速成長的NAO社團(tuán)的一大特色。
機(jī)器人技術(shù)及其相關(guān)應(yīng)用尚處于起步階段。因此,用戶社團(tuán)成員之間應(yīng)積極合作,長期互通有無,著眼于未來,共同探索新的應(yīng)用程序。
2005年,Bruno Maisonnier先生創(chuàng)立Aldebaran(阿爾德巴蘭)公司,吸引了另五位機(jī)器人愛好者加盟,形成了“Aldebaran車間”。
“Aldebaran”一詞意為畢宿五,是金牛座最亮的一顆星,直徑是太陽的44倍。建立于公元前300年的波斯古國曾把畢宿五與心宿二、軒轅十四和北落師門合稱四大王星,用于航海及陸地導(dǎo)航。
公司創(chuàng)建一年后,一支由12人組成的小團(tuán)隊(duì)創(chuàng)造出第一個(gè)真正意義上的NAO模型。這個(gè)模型雖然還無法滿足大眾的需要,但已引起專業(yè)研究人員的注意。
2008年,NAO接替索尼愛寶機(jī)器狗,當(dāng)選為機(jī)器人世界杯RoboCup Soccer的標(biāo)準(zhǔn)聯(lián)盟平臺(tái),NAO逐步成為大學(xué)里用于科研和教學(xué)的標(biāo)準(zhǔn)平臺(tái)。
2010年,20個(gè)NAO在上海世博會(huì)的法國館和巴黎大區(qū)館的舞臺(tái)上呈現(xiàn)了精彩的舞蹈表演,成為近1000萬參觀者注意的焦點(diǎn)。
隨著時(shí)間推移,NAO的版本不斷推陳出新。2011年推出的最新版NAO Next Gen融合了互動(dòng)領(lǐng)域主要的科技成果。與此同時(shí),機(jī)器人教學(xué)市場從大學(xué)擴(kuò)展到中學(xué)。Aldebaran公司還設(shè)立了“Developer Program”(開發(fā)人員計(jì)劃),旨在鼓勵(lì)程序開發(fā)人員使用NAO,創(chuàng)建大眾型應(yīng)用程序。
2013年推出的“Autism Solution for Kids ”(兒童自閉癥解決方案,簡稱為“ASK NAO”)運(yùn)用機(jī)器人技術(shù),向特教人員和患有自閉癥的兒童提供了一個(gè)全新的教學(xué)工具。
時(shí)至今日,近400名Aldebaran員工在參與構(gòu)筑我們的未來生活,已有超過5000個(gè)NAO活躍在世界各地。