某個(gè)清晨,我敲響了加州紅木城一棟漂亮的雙層住宅的大門。幾秒后,一個(gè)沒(méi)有面孔、身著米色緊身衣的機(jī)器人打開(kāi)了門,它腰身纖細(xì),雙腿修長(zhǎng)。
這個(gè)苗條的人形機(jī)器人向我打了聲招呼,說(shuō)話似乎略帶斯堪的納維亞口音。我主動(dòng)想要握手。它一邊與我握手一邊說(shuō):“我的握力很強(qiáng)。”當(dāng)屋主,挪威工程師伯恩特·伯尼奇(Bernt B?rnich)讓它拿些瓶裝水時(shí),機(jī)器人轉(zhuǎn)身走進(jìn)廚房,單手打開(kāi)了冰箱。
人工智能已經(jīng)能夠駕駛汽車、撰寫文章和編寫代碼。如今,人形機(jī)器人這類具有人類外形并由人工智能驅(qū)動(dòng)的機(jī)器,正準(zhǔn)備走入我們的家,幫助我們承擔(dān)日常家務(wù)。伯尼奇是初創(chuàng)公司1X的首席執(zhí)行官兼創(chuàng)始人,他希望在今年年底前,將機(jī)器人Neo賣給硅谷及其他地區(qū)的上百個(gè)家庭。
該公司只是計(jì)劃向家庭和企業(yè)出售人形機(jī)器人的眾多公司之一。據(jù)技術(shù)行業(yè)數(shù)據(jù)研究公司PitchBook統(tǒng)計(jì),自2015年以來(lái),投資者已向50多家初創(chuàng)公司注資共計(jì)72億美元。去年,針對(duì)人形機(jī)器人領(lǐng)域的投資額達(dá)到了16億美元的新高。這還不包括伊隆·馬斯克(ElonMusk)及其電動(dòng)汽車公司特斯拉(Tesla)自2021年以來(lái)為研發(fā)人形機(jī)器人Optimus(擎天柱)投入的數(shù)十億美元。
伯尼奇和馬斯克等企業(yè)家認(rèn)為,人形機(jī)器人未來(lái)將承擔(dān)大量當(dāng)前由人類完成的體力勞動(dòng),包括擦拭臺(tái)面、清空洗碗機(jī)等家庭瑣事,分揀包裹等倉(cāng)儲(chǔ)類工作,以及在裝配線上組裝汽車等工廠類工作。
一些更簡(jiǎn)單的機(jī)器人,例如小型機(jī)械臂和自動(dòng)運(yùn)輸車,早已在倉(cāng)庫(kù)和工廠中分擔(dān)了不少工作。如今,各公司斷言,通過(guò)模仿人類的行走、彎腰、轉(zhuǎn)動(dòng)、伸手、抓握等動(dòng)作以及完成各類任務(wù)的方式,這些機(jī)器能夠勝任更多任務(wù)。這些公司認(rèn)為,由于房屋、辦公室和倉(cāng)庫(kù)本身就是為人類設(shè)計(jì)的,人形機(jī)器人相比其他類型的機(jī)器人在適應(yīng)環(huán)境方面具有天然優(yōu)勢(shì)。
多年來(lái),人們一直在研發(fā)人形機(jī)器人。得益于機(jī)器人硬件和人工智能技術(shù)的雙重進(jìn)步,機(jī)器人能快速學(xué)習(xí)新技能。但人形機(jī)器人的落地尚是幻景。網(wǎng)上早已有大量展示這些機(jī)器驚人靈活性的視頻,但他們往往是由人類遠(yuǎn)程操控的。像把碗碟放進(jìn)洗碗機(jī)這樣看似簡(jiǎn)單的任務(wù),對(duì)它們來(lái)說(shuō)其實(shí)并不簡(jiǎn)單。
加州大學(xué)伯克利分校的工程學(xué)教授肯·戈德堡(Ken Goldberg)指出,“網(wǎng)上的很多視頻給了人們一些錯(cuò)誤印象。人形機(jī)器人的外形像人,但行為方式往往并不像人?!?/p>
Neo之所以用斯堪的納維亞口音說(shuō)“你好”,是因?yàn)樗鼘?shí)際上是由一名挪威技術(shù)人員在伯尼奇家的地下室遠(yuǎn)程操控的。(該公司未來(lái)計(jì)劃設(shè)立呼叫中心,讓數(shù)十名技術(shù)人員遠(yuǎn)程協(xié)助機(jī)器人。)它還能自主穿過(guò)餐廳和廚房,但說(shuō)話和手部動(dòng)作還是由技術(shù)人員通過(guò)VR頭戴設(shè)備和兩個(gè)無(wú)線操縱桿來(lái)遠(yuǎn)程控制。機(jī)器人仍在學(xué)習(xí)如何自主適應(yīng)這個(gè)世界,至少目前,它們?nèi)孕枰罅繋椭?/p>
大約一年前,我首次造訪了1X的硅谷辦公室。當(dāng)一個(gè)名叫Eve的機(jī)器人開(kāi)門走進(jìn)房間并關(guān)上門時(shí),我一度懷疑這位大眼睛的機(jī)器人其實(shí)是個(gè)穿著戲服的真人。Eve靠輪子移動(dòng),而不是靠腿。但它仍然給“人類”以人的感覺(jué)。我不禁想起了1973年伍迪·艾倫的科幻喜劇《傻瓜大鬧科學(xué)城》中也有一眾機(jī)器人管家。
當(dāng)時(shí),該公司的工程師已經(jīng)造出了Neo,但它還不會(huì)走路。公司實(shí)驗(yàn)室的墻上掛著它的早期版本。2 022年,伯尼奇與一位名叫埃里克·姜(Eric Jang)的人工智能研究員通過(guò)Zoom開(kāi)了一次視頻會(huì)議。姜當(dāng)時(shí)在Google硅谷總部的機(jī)器人實(shí)驗(yàn)室工作,伯尼奇則在挪威經(jīng)營(yíng)著一家名為Halodi Robotics的初創(chuàng)公司。
一位潛在投資者讓姜收集一些Ha lo d iRobotios的信息,確定這家公司是否值得投資。于是伯尼奇展示了Eve,靈感源自于科幻小說(shuō)(他個(gè)人最喜歡的是1982年上映的電影《銀翼殺手》)。姜被Eve的動(dòng)作迷住了。他將這次Zoom會(huì)議類比為美劇《西部世界》中的一幕:一名男子參加雞尾酒派對(duì),震驚地發(fā)現(xiàn)房間里所有人都是機(jī)器人。
“ 我看到了一種超乎我想象的硬件水平。”姜說(shuō)。那位投資者最終沒(méi)有投資Halodi。但姜很快說(shuō)服了伯尼奇與自己合作。姜當(dāng)時(shí)是Google團(tuán)隊(duì)的一員,在使用神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)系統(tǒng)教授機(jī)器人新技能,這種系統(tǒng)可以讓機(jī)器人根據(jù)現(xiàn)實(shí)世界的任務(wù)數(shù)據(jù)學(xué)習(xí)。在見(jiàn)到Eve后,姜告訴伯尼奇,他們可以將這種技術(shù)應(yīng)用到人形機(jī)器人上。于是,兩人聯(lián)手成立了一家跨大西洋的公司,并將其更名為1X。如今,這家初創(chuàng)公司已擁有約200名員工,獲得了包括Tiger Global和OpenAI在內(nèi)的投資者超過(guò)1.25億美元的資金支持。
在見(jiàn)到Eve約6個(gè)月后,當(dāng)我再次造訪公司實(shí)驗(yàn)室時(shí),Neo已經(jīng)能夠行走。他們?cè)谔摂M世界中完全教會(huì)了它如何走路。通過(guò)在類似電子游戲的模擬環(huán)境中復(fù)刻現(xiàn)實(shí)世界的物理規(guī)律,他們訓(xùn)練了一個(gè)虛擬版的Neo學(xué)會(huì)站立、保持平衡,并最終邁出腳步。在訓(xùn)練虛擬版Neo的幾個(gè)月后,他們將它學(xué)到的所有技能轉(zhuǎn)移到了真實(shí)的人形機(jī)器人身上。
如果我在Neo行進(jìn)時(shí)攔住它,它會(huì)停下來(lái)繞過(guò)我。如果我推它的胸口,它也能站穩(wěn)。有時(shí),它也會(huì)絆倒或不太清楚接下來(lái)要怎么辦。但它的確能夠像人類一樣在房間中四處走動(dòng)。Neo踩著咔噠作響的步伐行走時(shí),姜說(shuō):“這些行為都是習(xí)得的。無(wú)論我們將它投入什么環(huán)境,它都應(yīng)該能夠行走?!?/p>
訓(xùn)練機(jī)器人做家務(wù)則完全是另一回事。把碗碟放進(jìn)洗碗機(jī)或疊衣服的物理原理極其復(fù)雜,1X無(wú)法在虛擬世界中教會(huì)機(jī)器人完成這些任務(wù)。他們必須在真實(shí)的家庭環(huán)境中收集數(shù)據(jù)。大約一個(gè)月后,我再次拜訪伯尼奇時(shí),Neo在打開(kāi)冰箱的不銹鋼門時(shí)遇到了麻煩,它的Wi-Fi連接中斷了。但隱藏的后臺(tái)技術(shù)人員重啟Wi-Fi后流暢地遠(yuǎn)程引導(dǎo)Neo完成了任務(wù)。Neo遞給了我一瓶水。
我還看到Neo往洗衣機(jī)里放衣服。它小心翼翼蹲下身,從洗衣籃里拿起衣服。當(dāng)我和伯尼奇在廚房外聊天時(shí),它開(kāi)始擦拭廚房臺(tái)面。這些動(dòng)作都是通過(guò)遠(yuǎn)程控制完成的。即便是由人類控制,Neo有時(shí)也會(huì)失手,比如掉落杯子,或者在把空瓶扔進(jìn)水槽下的垃圾桶時(shí)找不到準(zhǔn)確角度。人形機(jī)器人在過(guò)去10年間進(jìn)步巨大,但它們依然不如人類靈活。比如Neo就無(wú)法將手臂舉過(guò)頭頂。
Neo還可能給人一種怪異感,就像所有半人半物的存在一樣。與它對(duì)話時(shí),這種怪異感尤為明顯,因?yàn)槟闫鋵?shí)是在和一位遠(yuǎn)程技術(shù)人員交流—就像是在和一個(gè)腹語(yǔ)娃娃說(shuō) 話。
通過(guò)指導(dǎo)Neo完成家務(wù),伯尼奇及其團(tuán)隊(duì)可以利用安裝在機(jī)器人上的攝像頭與傳感器收集數(shù)據(jù),記錄這些任務(wù)的完成方式。然后1X的工程師便可以利用這些數(shù)據(jù),擴(kuò)展并改進(jìn)Neo的技能。
就像ChatGPT能通過(guò)分析互聯(lián)網(wǎng)上的文本學(xué)習(xí)如何撰寫論文一樣,機(jī)器人也可以通過(guò)分析數(shù)小時(shí)的視頻識(shí)別模式,進(jìn)而學(xué)會(huì)擦窗戶。
大多數(shù)人形機(jī)器人項(xiàng)目,包括馬斯克的Optimus、Apptronik和Figure AI等公司的類似項(xiàng)目,都是面向倉(cāng)庫(kù)和工廠設(shè)計(jì)的,因?yàn)檫@些環(huán)境受到嚴(yán)格控制,機(jī)器人更容易適應(yīng)。但1X希望將機(jī)器人銷售給個(gè)人用戶,讓它們?cè)诩彝キh(huán)境中收集海量數(shù)據(jù),從而學(xué)會(huì)應(yīng)對(duì)現(xiàn)實(shí)日常生活的復(fù)雜場(chǎng)景。
但公司首先要找到愿意在家中接納這種早期版本的新型技術(shù),并愿意為此付費(fèi)的人。1X公司尚未為其在挪威自有工廠生產(chǎn)的這些機(jī)器人定價(jià)。制造一臺(tái)像Neo這樣的人形機(jī)器人的成本大致相當(dāng)于造一輛小型汽車,即數(shù)萬(wàn)美元。
要發(fā)揮其潛力,Neo必須拍攝家庭內(nèi)部場(chǎng)景。在某些情況下,技術(shù)人員會(huì)實(shí)時(shí)查看拍攝內(nèi)容。本質(zhì)上說(shuō),這是一臺(tái)邊工作邊學(xué)習(xí)的機(jī)器人。伯尼奇說(shuō):“我們出售的,其實(shí)更像是一段旅程,而不是一個(gè)終點(diǎn)。這條路會(huì)非??部溃玁eo會(huì)逐步變得真正有用?!?/p>
當(dāng)我問(wèn)伯尼奇,當(dāng)這些人形機(jī)器人進(jìn)入用戶家中,公司將如何處理隱私問(wèn)題時(shí),他解釋說(shuō),只有在用戶通過(guò)手機(jī)應(yīng)用授權(quán)后,遠(yuǎn)程呼叫中心的技術(shù)人員才能控制機(jī)器人。他還表示,收集到的數(shù)據(jù)至少在24小時(shí)后才會(huì)被用于訓(xùn)練新系統(tǒng)。這段時(shí)間內(nèi),用戶可以刪除他們不希望公司使用的視頻。“我們希望你們能按照自己的想法提供給我們一些數(shù)據(jù)。”伯尼奇說(shuō)。他希望借助這些數(shù)據(jù)制造出能處理幾乎所有家務(wù)的人形機(jī)器人。這也意味著,Neo可能會(huì)在未來(lái)取代部分家政人員。
但這至少還需要幾年時(shí)間才能實(shí)現(xiàn)。與此同時(shí),由于家政人員和照護(hù)老人與兒童的勞動(dòng)者數(shù)量短缺,一些代表這些工種的組織也歡迎能承擔(dān)部分家務(wù)的新技術(shù)的興起,前提是這些機(jī)器人能與人類密切配合。
接著,Neo開(kāi)始擦拭房子一側(cè)的高大落地窗。就在我轉(zhuǎn)身繼續(xù)與伯尼奇交談時(shí),廚房里傳來(lái)一聲巨響。因?yàn)殡娏ο到y(tǒng)故障,Neo仰面摔倒在了地板上,仿佛暈倒了一般。伯尼奇像抱小孩一樣把機(jī)器人抱起來(lái),走進(jìn)客廳,把它放在了一把椅子上。即便昏迷不醒,Neo看起來(lái)也很像人類。有一些人形機(jī)器人讓人看了就害怕。Neo身高不足五英尺半(約1.65米),重66磅(約30公斤),不會(huì)帶來(lái)那種壓迫感。但我還是在想,如果它再像剛才那樣摔倒,會(huì)不會(huì)傷到家中的寵物或小孩?
人們真的會(huì)讓這樣的機(jī)器進(jìn)入家中嗎?它的技能提升速度會(huì)有多快?它真的能讓人類從日常瑣事中解脫出來(lái)嗎?這些問(wèn)題目前還沒(méi)有答案。但伯尼奇正在堅(jiān)定地推動(dòng)這個(gè)進(jìn) 程。