陳銳
本田在2000年發(fā)布的ASIMO,因為始終找不到應用場景,已于2018年停產(chǎn)。
1986年,工程師廣瀨真人加入本田公司后,被分配到一個秘密組建的機器人研發(fā)機構(gòu),上司派給他的任務(wù)只有一句話:“做個阿童木出來!”
14年后,本田的人形機器人ASIMO問世。當年,它就登上了日本最受歡迎的電視節(jié)目《NHK紅白歌合戰(zhàn)》的舞臺,與動畫形象阿童木以及偶像團體SMAP共同演出。
ASIMO可以獨立行走、上下樓梯、與人握手,代表當時全球最先進的人形機器人水平。彼時不論是業(yè)界還是消費者,都相信機器人將很快進入日常生活。
但接下來的20年,ASIMO的腳步停留在舞臺上,沒有變成真正的商品,因為人們不知道能讓它做什么。理想中的端茶倒水、與人交流,它沒法真正完成。與人形機器人在技術(shù)上一脈相承的四足機器人—比如索尼的Aibo、波士頓動力的機器狗Spot—也面臨同樣的困境:它們能做的事越來越多,但找不到商業(yè)應用的場景。
“機器人”(Robot)這個詞原本的含義很明確,就是“人形機器”(humanoidrobot),它被設(shè)想為一種可以替代人做任何事的“仆人”。就在ASIMO找不到場景突破的20年間,各式各樣廣義的“機器人”產(chǎn)品卻找到了應用場景。憑借更高的效率,它們已開始頻繁替代人工:掃地機器人描摹了數(shù)千萬家庭的房型圖,語音助手成了智能手機的標配,自動機械臂已經(jīng)是各類生產(chǎn)線上不可或缺的“工人”。
本田在2018年宣布停止研發(fā)下一代ASIMO,轉(zhuǎn)而沿用它的技術(shù)開發(fā)“更實用的機器人產(chǎn)品”??瓷先ィ藗冏畛鯇τ跈C器人的想象已經(jīng)被擱置了。
但2021年,一批新的技術(shù)公司—特斯拉、小鵬、小米等—相繼宣布了自己的四足或雙足機器人計劃,有的已經(jīng)能看到實物,有的還只是概念,但它們都明確表示對這一市場的重視。
馬斯克說“特斯拉最終會是一個機器人公司”;何小鵬在微博寫道:“如果說智能汽車是智能智造的皇冠,那么智能機器人將是機器智能的皇冠?!?/p>
這輪復興并非大公司創(chuàng)始人滿足個人愛好的玩票。機器人所處的發(fā)展階段與20年前相比已經(jīng)有了重大改變,這些公司相信自己是在押注下一個能和智能手機相提并論的重大機會。
盡管每家公司的首款產(chǎn)品形態(tài)各異,但它們都有一樣的終極目標:造出能夠替代人做各種工作的“通用型機器人”。畢竟,一個可以照顧幼兒或老人的機器人保姆—比如《超能陸戰(zhàn)隊》里的大白(Baymax)—顯然會成為未來人類的剛需。
所以問題就變成了:為什么這樣一個設(shè)想一定要具化成一個人形機器人?換作更專業(yè)的說法就是,為什么必須是一個雙足雙臂、有靈巧手的仿人機器人?
這或許是某種來自科幻作品的執(zhí)念。當然,它也是一種基于消費需求的合理想象。
“人類已經(jīng)把世界改造成最適合人類生活的樣子。尤其是在城市,一切環(huán)境要素的尺寸、功能、使用邏輯,都是根據(jù)人來設(shè)定的。所以如果你需要一個全能的機器人,它很有可能就是人的樣子?!苯鑼Α兜谝回斀?jīng)》雜志說,他是鵬行智能的早期團隊成員。
鵬行智能在發(fā)布機器馬的概念視頻中,重點展示了和兒童的互動。
鵬行智能的前身Dogotix成立于2016年,是中國最早研究四足機器人運動控制技術(shù)的團隊之一。2020年,小鵬汽車戰(zhàn)略投資了鵬行智能,后者在今年9月發(fā)布了第一款產(chǎn)品的造型圖,一匹機器小馬。
和特斯拉直接推出人形機器人不同,鵬行智能選擇從技術(shù)上相似、難度沒有那么大的四足機器人開始,這也是大多數(shù)創(chuàng)業(yè)公司選擇的路線。
鵬行智能的機器馬在概念視頻中就重點展示了和兒童的互動,公布視頻后,它也著重收集了家長群體的反饋。
同樣,小米的四足機器狗“鐵蛋”也把目標定為陪伴娛樂,并且公布了9999元的定價。所以現(xiàn)階段,這些公司能做的,還只是一個昂貴的、針對少部分人群的新玩具。
問題是,如果只是一個昂貴的玩具,那不論是四足還是雙足機器人,所處的將是一個有明顯天花板的市場。
這些公司必須證明,自己有能力把四足和雙足機器人從一個小眾技術(shù)產(chǎn)品,變成可以真正改變?nèi)祟惿畹闹匾ぞ摺_@批創(chuàng)業(yè)公司的信心首先來源于重要技術(shù)的突破,比如人工智能。
四足和雙足機器人的技術(shù)類似,它們相比于其他單功能機器人(比如掃地機器人、工業(yè)機器人)最大的不同—也是最大的技術(shù)難點—就是自主行走的能力。
這涉及到非常復雜的運動控制和智能識別系統(tǒng)。此前,在這一領(lǐng)域領(lǐng)先的本田和波士頓動力,解決該問題靠的都是模型控制的思路。簡單來說,就是工程師預設(shè)好各種情況的正確反應,機器人識別到這種情況時就會做出應對。
亞馬遜首款家用機器人Astro。
Sony發(fā)布的機器狗Aibo。
而基于深度學習的技術(shù)思路,是通過一定的規(guī)則和獎勵機制,讓機器人自主學習如何面臨各種情況,就像AlphoGo自己學會下圍棋一樣。這意味著機器人的進化速度大大提升,也更有可能發(fā)展出不同的功能。
這背后,還有一個同樣重要的技術(shù)進步,就是算力提升。深度學習被發(fā)明時,ASIMO還沒有問世。當時機器人沒有采用這一技術(shù),正是因為芯片的算力遠不足以支撐實際應用。而現(xiàn)在,一個過去需要研發(fā)數(shù)年的平地行走動作,機器人可能幾個月就自己“ 琢磨”出來了。
除了軟件,硬件的進步也是四足和雙足機器人得以重新火熱的前提。最基礎(chǔ)的例子是電池。過去,電池的續(xù)航時間不足以支撐一個與人差不多大小的四足或雙足機器人長時間運行。這也是為什么本田ASIMO的早期版本都背著一個“書包”,里面裝的就是電池。而現(xiàn)在,鋰電池的能量密度隨著電動車的發(fā)展迅速提升,機器人能夠達到續(xù)航一個白天的最基本要求。
此外,電機的發(fā)展也使得復雜精密的機器人更容易實現(xiàn)。機器人有一個重要的指標是“自由度”(DOF,Degree ofFreedom),指機器人可以獨立運動的關(guān)節(jié)數(shù)目。比如人的手腕就有3個自由度,上下、左右和旋轉(zhuǎn)。一般來說,自由度越多,機器人越靈活,能做的事情越多。理論上,每增加一個自由度,就需要一個電機。
想象一下,人的手有那么多關(guān)節(jié),若要復刻其自由度,需要多少個電機?手的尺寸得多大?
過去,電機沒法做得足夠小,轉(zhuǎn)速和扭矩經(jīng)常達不到要求,和控制系統(tǒng)的結(jié)合也不夠緊密,這使得機器人很難實現(xiàn)豐富的自由度。但現(xiàn)在,電機的性能已經(jīng)接近理想水平。
同時,視覺識別、自然語言等人工智能技術(shù)的進展,也使得機器人和人類的互動變得更有可能性?;蛘叻催^來說,一個具象的、物理性質(zhì)的Siri,變得可能。
在樂觀的創(chuàng)業(yè)者眼里,人工智能、電池、電機等核心技術(shù)的進步,意味著機器人就像十多年前的電動車一樣,基礎(chǔ)技術(shù)已經(jīng)具備,只等一個特斯拉那樣的公司把它們整合起來,造出能夠定義一個時代的產(chǎn)品。
特斯拉最早的超跑車型Roadster也被認為是一個僅限富人群體的“大玩具”,但是它證明了電動車的性能完全可以超過燃油車。之后的逐步升級,便是基于已有的技術(shù)路徑。
理想狀態(tài)下,目前的機器人或許只能做到四足行走,但下一代機型就能直立行走;經(jīng)過一次在線更新,它就可以拿起一個規(guī)則球體、提起一個水壺,再到擰開門把手;到了某個時間點,用戶就會發(fā)現(xiàn),它不再是一個單純的玩具或?qū)櫸铮巧墳橐粋€幫手;繼續(xù)進化下去,“大白”就不再是想象。
當然,不論是機器人、機器狗還是機器馬,即使作為玩具,它們還有個非常重要的優(yōu)勢,就是能夠更自然地互動。
不止一位機器人創(chuàng)業(yè)者向《第一財經(jīng)》雜志提到,機器人除了功能價值,還有情感價值。他們相信,人在經(jīng)常與這種像動物一樣的物體互動后,會產(chǎn)生很強的親近感,當他們再玩回過去的那種玩具時,就會很不習慣。
何小鵬在公司內(nèi)部把機器人視為未來互聯(lián)網(wǎng)的新一代交互端口—一種具有主動性的交互端口。“不論是智能手機還是汽車,它們?nèi)耘f是被動地接受你的指令,而機器人可以做到主動與你交互。”江黎解釋說。
不難發(fā)現(xiàn),持樂觀看法的人很多來自電動車行業(yè)。這不僅是因為該行業(yè)剛剛經(jīng)歷過這樣的時刻,更因為上述核心技術(shù)本就與電動車和自動駕駛緊密相關(guān)。這也是特斯拉、小鵬等電動汽車公司的先天優(yōu)勢。以小鵬為例,它的一部分自動駕駛研發(fā)團隊,就在與鵬行智能共同研發(fā)機器人的視覺識別系統(tǒng)。
不過,這不意味著把自動駕駛照搬到機器人上就行了。事實上,四足和雙足機器人對識別能力的要求,比自動駕駛汽車高得多。
首先,需要識別的種類更多了。自動駕駛只需要識別路牌、劃線、車、行人等道路上的物體;而機器人要知道什么是路,什么是窗,什么是門把手……需要識別的物體種類比汽車多一個甚至兩個數(shù)量級;
第二,機器人的行動路徑是3D而非2D的。汽車在一個平面上移動,最多有些上下坡,而機器人可能要走樓梯,可能要從一張桌子下穿過,可能要取下墻上掛著的毛巾;
第三,同樣一個物體,機器人需要對它有更精確的認識。比如一個人,自動駕駛汽車只要知道它是行人就行了,在視頻里它會被簡化為一個框;而機器人要分清楚這個人的頭、眼睛和手臂,當這個人伸出手指向別處時,它要理解這是個“指向”的動作。
機器人市場日漸熱鬧
資料來源:根據(jù)公開資料整理
當然,機器人產(chǎn)品的研發(fā)不能完全依靠人工智能。目前國內(nèi)大多數(shù)公司采用的還是模型控制和深度學習相結(jié)合的方式。僅就機器人的運動控制部分而言,研發(fā)人員需要把一個機器人的控制過程拆分成足夠細的步驟,其中關(guān)乎安全的部分,仍然采用模型控制的方式,而不牽涉安全的動作—比如推開門—就可以采用深度學習的方式去進化。
不過,盡管產(chǎn)品終局明確,技術(shù)路線逐漸清晰,大公司也參與了進來,機器人創(chuàng)業(yè)目前仍未走出艱難時期。
首先是人才和管理。機器人的創(chuàng)業(yè)新熱潮,使得與之相關(guān)的專業(yè)人才變得搶手。比如最典型的運動控制專業(yè),原本并不在技術(shù)巨頭招聘的主流視野中。“現(xiàn)在,學運動控制的朋友都說,感覺像前幾年自動駕駛專業(yè)的人一樣,乘上東風了?!苯韪嬖V《第一財經(jīng)》雜志。
和許多前沿技術(shù)一樣,四足和雙足機器人的專家是一個很小的圈子。說白了,他們也許都參與過美國國防部高級研究計劃局(DARPA)機器人挑戰(zhàn)賽,互為隊友、對手、前輩、師生。在中國也是如此,許多人才都來自幾所頂尖大學的實驗室。
從科研到創(chuàng)業(yè),工作方式的轉(zhuǎn)變與磨合是最先遇到的挑戰(zhàn)。科研工作的大致概念,是去申請一筆基金,在不那么嚴苛的期限內(nèi),完成一篇有價值的論文。而在創(chuàng)業(yè)公司,實現(xiàn)某個具體的性能指標成為第一任務(wù),論文是副產(chǎn)品。機器人專業(yè)的研究者往往需要適應更快節(jié)奏的工作流程。更何況現(xiàn)在汽車公司的工程師也加入了機器人創(chuàng)業(yè)團隊,他們帶來的是工業(yè)界最細致、時間意識最強的項目管理流程。
除了創(chuàng)業(yè)公司內(nèi)部,磨合還發(fā)生在創(chuàng)業(yè)公司和產(chǎn)業(yè)鏈之間。它們必須要拉攏盡可能多的優(yōu)秀供應商,一起研發(fā)全新的零部件。對于供應商來說,這意味著前所未見的性能要求、高昂的前期研發(fā)投入,以及模糊的商業(yè)前景。
這有點像是蘋果最早拿著iPhone的設(shè)計要求去尋找供應商的情況,但蘋果至少還是家有名的大公司,手機也是一個已經(jīng)存在的產(chǎn)品。機器人行業(yè)的不確定性比這個高得多。上述三條中的任何一條,都可能導致潛在供應商拒絕機器人創(chuàng)業(yè)公司的合作請求。
江黎告訴《第一財經(jīng)》雜志,很多情況下,他們只能選擇自己研發(fā)一些核心部件,而同意合作的伙伴,往往是本身就想嘗試進入機器人行業(yè)因此愿意交學費的公司。
產(chǎn)業(yè)鏈的支持對機器人創(chuàng)業(yè)十分重要。以iPhone為例,任何一個偉大的技術(shù)產(chǎn)品,它的第一代往往充滿缺陷,需要迭代數(shù)次,才能與競爭對手拉開差距。這個過程中,公司與供應鏈的互相促進就是關(guān)鍵。歸根結(jié)底,從現(xiàn)在的四足機器人,到真正的“大白”還有很長的距離,要縮短這個距離,靠的是大量供應商在每個細節(jié)上的技術(shù)突破。
這注定是一個漫長的過程。對于很多公司來說,這個過程不能只靠燒錢度過。獲得騰訊投資的優(yōu)必選,是國內(nèi)最早創(chuàng)立、布局最完善的機器人創(chuàng)業(yè)公司,但它對雙足機器人的商業(yè)化一直很謹慎。一方面,它在不斷研發(fā)類似ASIMO的人形機器人Walker,最新一代型號還成為迪拜世博會中國館的展品。但同時,它也大量研發(fā)其他單功能機器人,比如人工智能教育機器人、公共機構(gòu)大廳里的服務(wù)機器人,或是物流機器人。因為它必須證明自己在現(xiàn)階段就能賺錢,這是它進入二級市場獲得更多融資的前提之一。優(yōu)必選CEO周劍在接受采訪時說:“人工智能的通用型普及還需再等等?!?/p>
一些大公司選擇以更務(wù)實的路徑進入這個行業(yè)。比如亞馬遜,它最近推出了一個名叫Astro的產(chǎn)品。亞馬遜稱之為機器人,但實際上,它就是一塊屏幕加兩個輪子,再加上亞馬遜的語音識別技術(shù)。換句話說,它是一個可以移動的智能音箱+攝像頭。顯然,在亞馬遜看來,比起研發(fā)復雜的四足行走技術(shù),先滿足消費者一部分基礎(chǔ)需求就足夠了。
不過,某種意義上,上述這些挑戰(zhàn)都是在已經(jīng)明確方向再往前推進的過程中遇到的困難,并不是機器人創(chuàng)業(yè)最難的部分。
真正難的,是從頭定義一個沒有先例的產(chǎn)品,也就是說,常規(guī)的產(chǎn)品定義和市場調(diào)研都派不上用場。產(chǎn)品經(jīng)理們需要從零開始思考:第一款產(chǎn)品如何讓目標消費者記住,有限的研發(fā)資源應該集中突破哪個方向,市面上已有的相關(guān)經(jīng)驗,哪些可以參考,哪些應該忽略?
這種思考必須結(jié)合兩種洞察:人類最底層的需求,以及技術(shù)發(fā)展帶來的潛在影響。
所以,沒錯,機器人工程師們某種程度上是在做科幻小說家的工作,區(qū)別在于,小說家只需要描述理想的狀態(tài),也就是所謂的“終局”,而創(chuàng)業(yè)公司需要摸索出通往那里的道路。