人類(lèi)制造機(jī)器人有十分古老的歷史。
早在2500多年前的克里特島上,希臘工匠們就開(kāi)始為保衛(wèi)城邦制造機(jī)器人。如果不考慮機(jī)器的自動(dòng)化屬性,甚至可以說(shuō)石器時(shí)代的原始人坐在山洞里用泥土捏出的人類(lèi)形象也是一種機(jī)器人。
人類(lèi)制造過(guò)的機(jī)器人五花八門(mén),不過(guò)這臺(tái)機(jī)器是否會(huì)思考是另外一回事。2023年之前,沒(méi)有機(jī)器人公司敢宣稱(chēng)它們的機(jī)器人可以思考,它們最多強(qiáng)調(diào)機(jī)器人會(huì)像人類(lèi)一樣說(shuō)話,或者跑跳能力比人類(lèi)更強(qiáng)—說(shuō)話、走路,甚至摔倒了爬起來(lái),都不需要思考,有(人造)小腦就夠了。
但2023年之后,情況開(kāi)始有所不同。在美國(guó),PhysicalIntelligence、Figure AI和OpenAI都組建了機(jī)器人團(tuán)隊(duì);在中國(guó),智元、銀河通用、靈初智能等一大批初創(chuàng)公司跳出來(lái),都說(shuō)要“為機(jī)器人構(gòu)建大腦”。甚至連動(dòng)作一向遲緩的蘋(píng)果設(shè)計(jì)師也開(kāi)始認(rèn)真思考“機(jī)器人究竟應(yīng)該設(shè)計(jì)成什么形態(tài)?”“跟人相處時(shí)它究竟應(yīng)該主動(dòng)點(diǎn)好,還是被動(dòng)點(diǎn)好?”。
保守的觀點(diǎn)認(rèn)為,機(jī)器人—尤其人形的—沒(méi)什么價(jià)值,因?yàn)檎l(shuí)也不知道花數(shù)十萬(wàn)元買(mǎi)一臺(tái)回家能干什么,它很可能在10次拿起雞蛋的過(guò)程中有5次把雞蛋掉在地上。
技術(shù)樂(lè)觀主義者們卻不這么看,他們相信AI的力量。從技術(shù)上說(shuō),這輪機(jī)器人浪潮毫無(wú)疑問(wèn)也是ChatGPT直接驅(qū)動(dòng)的。2022年年底發(fā)布的ChatGPT完全改變了二維的互聯(lián)網(wǎng)世界,把改進(jìn)后的多模態(tài)推理模型(能把圖像數(shù)據(jù)“翻譯”成語(yǔ)言,反之亦然)加載到機(jī)器人的大腦中,機(jī)器人就能看圖說(shuō)話,并根據(jù)話語(yǔ)理解人類(lèi)的意圖,然后對(duì)眼前世界展開(kāi)操作。
任何一項(xiàng)新技術(shù),都會(huì)經(jīng)歷創(chuàng)新觸發(fā)期、預(yù)期過(guò)高的市場(chǎng)狂熱期、隨之而來(lái)的幻滅低谷,然后才會(huì)等來(lái)啟蒙斜坡。自動(dòng)駕駛?cè)绱?,機(jī)器人同樣如此。眼下這個(gè)時(shí)刻,我們已進(jìn)入第二階段。