王姍姍
波士頓動(dòng)力的四足機(jī)器人Sport和兩足機(jī)器人Atlas
2013年,Google一口氣收購了8家機(jī)器人創(chuàng)業(yè)公司,后面幾年中命途多舛的波士頓動(dòng)力(Boston Dynamics)是其中之一。同年,亞馬遜也在用名為Kiva的倉庫機(jī)器人搬運(yùn)包裹。
2014年年初,《經(jīng)濟(jì)學(xué)人》把人類與機(jī)器人和諧共處的圖景搬上了封面:一個(gè)市郊公園里,機(jī)器狗在草地上玩耍;一臺(tái)履帶式機(jī)器人蹲在老人輪椅前喂飯;還有一位和成年人身高差不多的機(jī)器人,任由它的“食指”被一位兩歲左右的孩子牽著散步;天空中的無人機(jī)則忙著四處送貨。《經(jīng)濟(jì)學(xué)人》判斷,芯片、數(shù)字傳感器和寬帶通訊能力將幫助機(jī)器人實(shí)現(xiàn)“質(zhì)的突破”。
波士頓動(dòng)力的四足機(jī)器人Sport和兩足機(jī)器人Atlas
看看波士頓動(dòng)力隨后幾年的命運(yùn),我們知道,上述判斷下得過早—更強(qiáng)的計(jì)算能力、更豐富的數(shù)據(jù)維度、更快的傳輸速度,當(dāng)然有助于機(jī)器人算得更快,但要實(shí)現(xiàn)“質(zhì)的突破”,機(jī)器人還需要一場(chǎng)算法革命:工程師決定機(jī)器人如何行動(dòng),讓位于機(jī)器人自主決策。
2019年,位于瑞士蘇黎世的機(jī)器人公司ANYbotics推出一臺(tái)機(jī)器人,名為ANYmal,發(fā)音與animal(動(dòng)物)相同,寓意它是一臺(tái)更接近動(dòng)物的自主機(jī)器人,而非完全聽命于程序的提線木偶。
與之前所有機(jī)器人的研發(fā)理念(包括曾經(jīng)名聲大噪的波士頓動(dòng)力)不同,ANYmal幾乎不依賴工程師灌輸?shù)摹爸R(shí)”。剛被制造出來時(shí),它不會(huì)站立,也不會(huì)走路,和剛出生的小狗沒什么不同。但依靠?jī)?nèi)置的深度強(qiáng)化學(xué)習(xí)算法(deep r einforcement learning,簡(jiǎn)稱DR L,將強(qiáng)化學(xué)習(xí)與深度神經(jīng)網(wǎng)絡(luò)結(jié)合),經(jīng)過摔倒后就嘗試站起來的試錯(cuò)訓(xùn)練,1500代之后,這只機(jī)器狗就可以從摔倒時(shí)的側(cè)臥狀態(tài)翻身站起來。
為加快ANYmal的學(xué)習(xí)速度,ANYbotics同時(shí)在電腦上構(gòu)建了模擬器,讓2000多只二維的機(jī)器狗一起學(xué)習(xí)走路、應(yīng)對(duì)各種刁難,將這些二維機(jī)器狗學(xué)習(xí)到的運(yùn)動(dòng)策略轉(zhuǎn)交給ANYmal,它也能迅速應(yīng)用到現(xiàn)實(shí)世界中。
聽起來和人工智能很像?ANYmal就是人工智能—準(zhǔn)確說是深度學(xué)習(xí)(通過建構(gòu)深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的學(xué)習(xí))機(jī)器,只不過被賦予了物理身體。二者的結(jié)合革新了機(jī)器人行業(yè)。
《經(jīng)濟(jì)學(xué)人》2014年年初刊登封面文章《機(jī)器人崛起》(Rise of the Robots》。
2020年10月,這只名為ANYmal的機(jī)器狗登上了《Science》雜志子刊—《Science Robotics》的封面,再次激發(fā)人們對(duì)于機(jī)器人的興趣,以及對(duì)機(jī)器人新范式—將深度學(xué)習(xí)與傳統(tǒng)機(jī)器人結(jié)合—的討 論。
而在差不多時(shí)間,波士頓動(dòng)力的命運(yùn)就沒那么好了,它離開前東家Google已有3年,在新主人軟銀手中的狀態(tài)則是又一次待價(jià)而沽。2021年7月,它被再次轉(zhuǎn)手,成為現(xiàn)代汽車的子公司。
從外在表現(xiàn)看,波士頓動(dòng)力在2020年推出的首款零售四足機(jī)器人Spot并不遜色于ANYmal,這只黃色的機(jī)器狗能夠慢走、小跑、跳躍、飛奔。波士頓動(dòng)力另一款兩足機(jī)器人Atlas更是多次驚艷大眾。2017年10月,Atlas就成功表演了空翻技能;2018年5月,它學(xué)會(huì)了室外奔跑;今年8月,在一則長(zhǎng)達(dá)9 0秒的視頻中,Atlas成功跑完了復(fù)雜的障礙賽。
然而無論Spot和Atlas的運(yùn)動(dòng)能力多么出眾,它們都難以像ANYmal那樣稱得上“智能”。波士頓動(dòng)力的機(jī)器人的動(dòng)作多數(shù)是人類手動(dòng)編寫的,如果它要決定下一步如何行走,首先得查詢一個(gè)步態(tài)行為庫。
以Altas執(zhí)行的跑酷行為來舉例,波士頓動(dòng)力的研發(fā)團(tuán)隊(duì)為機(jī)器人提供了一張地圖,其中包括研發(fā)人員希望它到達(dá)的地方、路上存在的障礙以及沿途面對(duì)障礙它應(yīng)該做出的動(dòng)作。Atlas事先“知道”要去尋找需要跳的障礙盒子,如果盒子向側(cè)面移動(dòng)0.5米,Atlas能通過實(shí)時(shí)感知數(shù)據(jù)重新規(guī)劃跳躍動(dòng)作的執(zhí)行時(shí)間。但如果盒子被移動(dòng)得太遠(yuǎn),Atlas就會(huì)因?yàn)檎也坏剿O聛怼?p>
今年8月特斯拉AI日上發(fā)布的人形機(jī)器人Tesla Bot。
自主學(xué)習(xí)機(jī)器人ANYmal。
換句話說,At las在跑酷中所做的每個(gè)動(dòng)作,都是一個(gè)事先編輯好的行為庫,它擁有一定的可選擇性,但不能窮盡所有變化。
波士頓動(dòng)力代表了機(jī)器人行業(yè)在ANYmal誕生之前的經(jīng)典范式。不必驚訝,那些有著“工業(yè)機(jī)器人”之稱、在工廠流水線上擰螺絲的機(jī)械手臂,以及在電商倉庫中來來回回揀貨的物流機(jī)器人,還有家里的掃地機(jī)器人……這些所謂“機(jī)器人”實(shí)現(xiàn)智能的方式都是如此,它們并不需要多聰明,更不需要自作主張,就能完成封閉空間內(nèi)從A點(diǎn)到B點(diǎn)的移動(dòng)。
波士頓動(dòng)力也許代表著人類運(yùn)用控制論操控機(jī)器實(shí)現(xiàn)自動(dòng)化的巔峰,但它并不通向未來。
控制?還是自主學(xué)習(xí)??jī)煞N完全不同的技術(shù)路徑,將機(jī)器人行業(yè)在時(shí)間軸上劃為新舊兩個(gè)時(shí)代,也掀起了新一輪的機(jī)器人投資熱潮。
2020年,國(guó)內(nèi)機(jī)器人企業(yè)融資數(shù)為115起,這個(gè)數(shù)字很快就會(huì)被超越。僅2021年前4個(gè)月,同類投資項(xiàng)目已經(jīng)達(dá)到67起,其中單筆融資金額達(dá)到億元的項(xiàng)目超過30個(gè)。從分類上看,熱門領(lǐng)域雖然仍屬于工業(yè)、物流、醫(yī)療、家用等傳統(tǒng)市場(chǎng),但相較于上一輪投資熱潮,新一輪投資開始關(guān)注自主學(xué)習(xí)的技術(shù)路線,并更多流入物流和家用等與移動(dòng)相關(guān)的機(jī)器人。騰訊、美團(tuán)、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)公司押注的主要都是這類產(chǎn)品。
今年以來,騰訊Robotics X實(shí)驗(yàn)室推出自稱越障能力更強(qiáng)的輪腿式機(jī)器人Ollie;小米和小鵬汽車兩家公司炮制出了家庭陪伴場(chǎng)景下的機(jī)器狗產(chǎn)品,它們都與波士頓動(dòng)力的Spot相似,在技術(shù)路徑上并不先進(jìn),但這只是開端。
作為都擁有造車業(yè)務(wù)的公司,小米和小鵬的最終對(duì)標(biāo)對(duì)象都是特斯拉。在今年8月的特斯拉A I日之后,馬斯克已經(jīng)將特斯拉定位為“全球最大的機(jī)器人公司”。
馬斯克對(duì)于機(jī)器人的構(gòu)想正在被更多人接受,那就是—未來所有的機(jī)器,都將是機(jī)器人。
如果此時(shí)你還在糾結(jié)人工智能、自動(dòng)駕駛、機(jī)器人之間的差別,甚至聊天機(jī)器人算不算機(jī)器人的問題,那你不必糾結(jié)了,它們都為實(shí)現(xiàn)機(jī)器智能而分頭尋找過出路,但正在融合。馬斯克已經(jīng)示范了如何從制造傳統(tǒng)機(jī)器入手,最終制造出自主決策機(jī)器的路徑。如外界所知,他從輔助自動(dòng)駕駛開始,一開始僅將汽車的視覺問題即感知層面的問題交給深度學(xué)習(xí)接管;在決策層,由于深度學(xué)習(xí)的決策缺乏可解釋性,在訓(xùn)練初期更缺乏安全性,所以特斯拉在駕駛決策中仍然采用傳統(tǒng)的規(guī)劃法,通過手動(dòng)輸入一些規(guī)則并創(chuàng)建一個(gè)有限狀態(tài)機(jī)—與波士頓動(dòng)力差不多,讓汽車在封閉道路上實(shí)現(xiàn)相對(duì)可控的自動(dòng)駕駛。
機(jī)器人簡(jiǎn)史
資料來源:根據(jù)公開資料整理
但馬斯克并沒有放棄完全自動(dòng)駕駛,相反,他通過讓系統(tǒng)跟人類駕駛員學(xué)習(xí)從而不斷逼近自動(dòng)駕駛。如今跑在全球道路上的數(shù)萬輛特斯拉都是這樣的學(xué)習(xí)機(jī)器,哪怕司機(jī)不打開自動(dòng)駕駛功能,特斯拉也會(huì)有一個(gè)影子模式在時(shí)刻對(duì)比自動(dòng)駕駛和人類駕駛員的操作,并上報(bào)兩者的不一致。用這些被標(biāo)注的數(shù)據(jù)訓(xùn)練,最終既可以教會(huì)機(jī)器開車,也能避免通過試錯(cuò)才能學(xué)習(xí)的可怕后果。
更進(jìn)一步,8月20日,馬斯克在特斯拉A I日上又發(fā)布了一款人形機(jī)器人Tesla Bot,搭載與汽車相同的智能相機(jī)Autopilot C ameras和自動(dòng)駕駛系統(tǒng)FullSelf-Driving(FSD),兩者都是特斯拉汽車的核心,前者解決感知問題,后者解決決策問題。Tesla Bot和特斯拉汽車產(chǎn)生的數(shù)據(jù)都會(huì)上傳到名為Dojo的超級(jí)計(jì)算機(jī),在此訓(xùn)練的Autopilot也將成為二者的共同大腦。這一點(diǎn)很容易就讓人想到人工智能領(lǐng)域熱衷談?wù)摰慕K極目標(biāo)—通用人工智能。
一個(gè)會(huì)開車的人形機(jī)器人會(huì)比其他同類聰明多少還很難說,但假如特斯拉讓這款人形機(jī)器人做傳統(tǒng)汽車的司機(jī),它就能使傳統(tǒng)汽車也變成自動(dòng)駕駛汽車—這款機(jī)器人身高173厘米、體重56.7公斤,與普通成年人差不多。
正如通用的機(jī)械手臂并未完全取代工廠里的專用機(jī)一樣,具備自主學(xué)習(xí)能力的機(jī)器人也不一定比自動(dòng)化的機(jī)器更有未來。但只要?jiǎng)?chuàng)業(yè)者愿意,他們也可以像ABB、庫卡、特斯拉一樣,吃掉傳統(tǒng)流水線和汽車廠商的可觀市場(chǎng)。而且,只要他們?cè)敢?,還可以效仿馬斯克,控制論和自主學(xué)習(xí)兩條技術(shù)路線并行,最終創(chuàng)造出真正的機(jī)器人公司,前提是先在生產(chǎn)線上把機(jī)器成批制造出來。
不管你有沒有準(zhǔn)備好,各種各樣的機(jī)器人已經(jīng)出現(xiàn)在我們的生活環(huán)境中:餐廳、酒店、住院病房、購物中心甚至家里的臥室。當(dāng)機(jī)器人長(zhǎng)得越來越像人,人類又該如何自處和與之相處?機(jī)器人進(jìn)入具體應(yīng)用場(chǎng)景后所帶來的倫理問題和挑戰(zhàn),比單純討論AI技術(shù)要復(fù)雜得多。大多數(shù)這類主題的科幻小說,故事情節(jié)所反映出的看法都不怎么樂觀。
挑戰(zhàn)之一來自人如何從心理上接納機(jī)器人。1970年,日本機(jī)器人學(xué)家森昌弘提出過一個(gè)“恐怖谷”假說,意思是當(dāng)人發(fā)現(xiàn)機(jī)器人與人類在外表、動(dòng)作上相似,會(huì)對(duì)機(jī)器人產(chǎn)生正面情感;但當(dāng)相似達(dá)到特定程度,接近人可與之共情的同類,此時(shí)機(jī)器人如果偶爾表現(xiàn)出與人的差異,人類對(duì)機(jī)器人的反應(yīng)就會(huì)突然變得負(fù)面,認(rèn)為它“僵硬恐怖、猶如行尸走肉”,出現(xiàn)情感的波谷;只有當(dāng)機(jī)器人與人的相似度繼續(xù)上升,達(dá)到與人無異的水平,人類對(duì)機(jī)器人的情感才會(huì)再度回到正面,從而發(fā)生移情。中間的心理跳躍過程如同一個(gè)V字形的峽谷。
2019年,工業(yè)機(jī)器人安裝量排名前5位的市場(chǎng)
資料來源:國(guó)際機(jī)器人聯(lián)合會(huì)(IFR)
這種心理過山車的出現(xiàn)并不遙遠(yuǎn)。8月20日的特斯拉AI日上,馬斯克已經(jīng)宣布其人形機(jī)器人Tesla Bot的第一個(gè)實(shí)體版本明年就會(huì)面世。
就在幾天前,搜狗創(chuàng)始人王小川還在社交媒體上評(píng)論一則視頻新聞?wù)f,“不要虐待機(jī)器人”。在那條視頻里,一位酒店客人將一臺(tái)試圖進(jìn)入電梯的機(jī)器人踹倒在地。那臺(tái)機(jī)器人的長(zhǎng)相距離人類還很遙遠(yuǎn)—只是一個(gè)圓柱體的送貨機(jī)—就已引發(fā)兩派意見。一種是像王小川這樣,認(rèn)為機(jī)器人應(yīng)該被友好對(duì)待,就像人應(yīng)當(dāng)相互友好對(duì)待一樣;另一種態(tài)度則是,機(jī)器人不能和人搭同一臺(tái)電梯,因?yàn)樗K歸是機(jī)器,有電池,有系統(tǒng),它有可能爆炸,還有可能失控。
等著看吧,畢竟經(jīng)過上百年發(fā)展,寵物在人類社會(huì)中的地位變得越來越高,在很多場(chǎng)所都可以與人平起平坐的時(shí)候,仍有很多社會(huì)在為能不能吃狗肉吵得不可開交,我們有足夠的理由相信機(jī)器人的入世之途不會(huì)更順?biāo)臁?/p>
機(jī)器人產(chǎn)業(yè)發(fā)展的3種模式
資料來源:波士頓咨詢
當(dāng)然,新一代機(jī)器人帶來的更大挑戰(zhàn)還在于深度強(qiáng)化學(xué)習(xí)本身。這項(xiàng)技術(shù)使得機(jī)器人不僅長(zhǎng)得像人,決策也容易出人意料,甚至帶來不可預(yù)知的后果。
簡(jiǎn)單解釋一下這項(xiàng)技術(shù)背后的原理,你就會(huì)明白我們?cè)趽?dān)憂什么。相較于之前的人工智能技術(shù)—無論是被稱作“專家系統(tǒng)”的控制論式智能,還是需要打過標(biāo)簽、有正確答案才能學(xué)習(xí)的有監(jiān)督學(xué)習(xí)—深度強(qiáng)化學(xué)習(xí)更為智能,它不怎么需要人類專家的知識(shí),也不需要標(biāo)簽樣本,就能通過數(shù)字神經(jīng)網(wǎng)絡(luò)和獎(jiǎng)勵(lì)函數(shù)一點(diǎn)一點(diǎn)實(shí)現(xiàn)目標(biāo),相當(dāng)于是通過不斷試錯(cuò)學(xué)會(huì)東西的。
你可以從AlphaGo的表現(xiàn)上看出使用了強(qiáng)化學(xué)習(xí)算法的深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大力量。2017年,《麻省理工科技評(píng)論》將這種技術(shù)評(píng)為當(dāng)年“十大突破性技術(shù)”之一。然而由于其決策的不可解釋性,這項(xiàng)革命性的技術(shù)也被稱為“黑盒”。不管人們認(rèn)為人工智能有多愚蠢,并因此在智力上藐視它,都回避不了愚蠢的代價(jià)需要人來承擔(dān)的事實(shí)。
2030年,專業(yè)服務(wù)機(jī)器人的市場(chǎng)規(guī)模將大大超過工業(yè)機(jī)器人和協(xié)作機(jī)器人
資料來源:波士頓咨詢
迄今為止,各大公司仍然只敢將這項(xiàng)技術(shù)用于解決感知層面的問題,比如識(shí)別各種圖片和聲音,至多將其擴(kuò)大應(yīng)用至商品、廣告、短視頻、新聞等消費(fèi)信息的推薦上,即便推薦得不合消費(fèi)者心意,也不會(huì)危及生命。但汽車就不同了,所以如今跑在路上的所謂自動(dòng)駕駛汽車都沒有將決策真正交給AI(前面已經(jīng)講述了馬斯克是如何巧妙解決這個(gè)問題 的)。
機(jī)器人司機(jī)自主決策的后果,會(huì)和自動(dòng)駕駛汽車差不多,你準(zhǔn)備好了嗎?