在剛剛落幕的2025年度世界人工智能大會(下稱“WAIC”)上,具身智能機(jī)器人展廳人氣最火爆,滿地跑的機(jī)器狗、形態(tài)各異的機(jī)器人引來觀眾駐足。
據(jù)介紹,本屆WAIC上共有超150臺人形機(jī)器人同臺競技,是國內(nèi)人形機(jī)器人有史以來最大規(guī)模的一次集體展出。且不同于去年機(jī)器人多偏向于靜態(tài)陳列,今年展出的機(jī)器人都主打展示在真實(shí)場景里干活的能力。
智元機(jī)器人展臺面積達(dá)300平方米,也是本次參會具身智能企業(yè)中的最大展臺。該公司在展臺設(shè)立了工業(yè)物流、商業(yè)服務(wù)、家居、科研教育、文娛表演等五大商業(yè)場景,“指派”不同的機(jī)器人秀實(shí)力:作為主打交互服務(wù)的通用人形機(jī)器人遠(yuǎn)征A2負(fù)責(zé)展臺講解,全程自主導(dǎo)覽無人工參與;精靈G1則化身展臺“全能助手”為觀眾遞物品、蓋紀(jì)念章;另一款機(jī)器人遠(yuǎn)征A2-W在勤奮地進(jìn)行拆垛搬運(yùn)作業(yè),精準(zhǔn)抓取不同規(guī)格的周轉(zhuǎn)箱。
銀河通用搭建了1∶1還原的真實(shí)商超場景,由銀河通用機(jī)器人Galbot進(jìn)行全天候值守。
星動紀(jì)元模擬物流倉儲場景,展示機(jī)器人進(jìn)行智能分揀、掃碼、服務(wù)等“真干活”的能力。
高盛研究預(yù)測,到2035年,全球人形機(jī)器人市場規(guī)模有望達(dá)到1540億美元。摩根士丹利在研報(bào)中稱,中國作為全球最大的機(jī)器人市場和制造中心,2024年機(jī)器人市場規(guī)模已達(dá)470億美元,占全球總量的40%,預(yù)計(jì)到2028年將增至1080億美元,年復(fù)合增長率達(dá)23%。
中信智庫7月27日在WAIC上發(fā)布《AI新紀(jì)元:砥礪開疆·智火燎原》AI+產(chǎn)業(yè)發(fā)展深度研究報(bào)告。報(bào)告指出,目前機(jī)器人大模型訓(xùn)練方式已經(jīng)開始向端到端大模型+世界模型(物理規(guī)則建模)發(fā)展,同時(shí)模態(tài)能力也越來越豐富,但受制于機(jī)器人“大腦”泛化能力有限、數(shù)據(jù)集獲取難度高、結(jié)構(gòu)設(shè)計(jì)待優(yōu)化、供應(yīng)鏈成本居高不下等痛點(diǎn),人形機(jī)器人短期內(nèi)仍難以實(shí)現(xiàn)大規(guī)模商用。
人形機(jī)器人被普遍認(rèn)為是AI最有前景的落地方向之一,未來在工業(yè)、商業(yè)、家庭、外太空探索等領(lǐng)域具有廣闊應(yīng)用場景,將人類從低級和高危行業(yè)中解放出來,提升人類生產(chǎn)力水平和工作效率。
需要指出的是,人形機(jī)器人只是具身智能的一種典型載體,但具身智能的范疇遠(yuǎn)不止于人形機(jī)器人。具身智能核心在于“通過身體與環(huán)境的動態(tài)交互產(chǎn)生智能”,而“身體”的形態(tài)可以是多樣的,只要具備感知、行動能力并能與環(huán)境互動,都可成為具身智能的載體。
中信智庫在報(bào)告中指出,采用人形設(shè)計(jì)出于多種因素考量。
其一,更能適應(yīng)環(huán)境。現(xiàn)實(shí)中許多場景,如樓梯、工具等均是根據(jù)人體工學(xué)設(shè)計(jì)的,機(jī)器人如果是人形就能夠在這些場景中直接應(yīng)用。
其二,更好的任務(wù)通用性。人體具備較高靈活度,模仿人類的關(guān)節(jié)、感官系統(tǒng)可讓人形機(jī)器人更加靈活,可執(zhí)行多樣化任務(wù)。
其三,類人外觀降低人機(jī)交互的心理隔閡,與其他類型相比,未來人形機(jī)器人在情感溝通上面臨的壁壘更低。
其四,數(shù)據(jù)可得性更高。深度仿生意味著可以從人身動作中獲取大量的運(yùn)動數(shù)據(jù),能夠明顯降低深度強(qiáng)化學(xué)習(xí)等訓(xùn)練方法的難度和所需的訓(xùn)練時(shí)間。
特斯拉人形機(jī)器人Optimus堅(jiān)持仿人結(jié)構(gòu)。Optimus機(jī)器人身高1.73米,在執(zhí)行器連接中使用模仿肌腱的彈簧設(shè)計(jì),手部形態(tài)上模仿人類手掌,從而實(shí)現(xiàn)高靈敏度以抓取重物和輕薄物體。
根據(jù)特斯拉在今年1月公布的規(guī)劃,Optimus計(jì)劃在2025年量產(chǎn)數(shù)千臺,并在特斯拉工廠進(jìn)行初步測試;2026年量產(chǎn)5萬-10萬臺,2027年再增加10倍。
今年初開始,車廠紛紛入局人形機(jī)器人成為一大趨勢?!敦?cái)經(jīng)》根據(jù)官方公告不完全統(tǒng)計(jì)得出,當(dāng)前國內(nèi)已有廣汽、上汽、比亞迪、小鵬、奇瑞、小米等15家車企,以及華為、地平線、禾賽科技等供應(yīng)鏈企業(yè),相繼投入人形機(jī)器人賽道。在海外,特斯拉、寶馬、奔馳、本田、豐田、現(xiàn)代等6家車企也提出了自己的人形機(jī)器人思路。全球主流車企基本已入局人形機(jī)器人賽道。
在國內(nèi),人形機(jī)器人也成為今年資本市場熱度最高的領(lǐng)域之一。7月18日,中國證監(jiān)會官網(wǎng)信息顯示,宇樹科技開啟上市輔導(dǎo),估值超120億元。宇樹科技成立于2016年,研究機(jī)器狗起家,2023年開始發(fā)布人形機(jī)器人產(chǎn)品,是國內(nèi)最受關(guān)注的人形機(jī)器人創(chuàng)業(yè)公司之一。人形機(jī)器人公司它石智航已經(jīng)開啟第三輪融資。今年3月,機(jī)器人公司維他動力宣布完成2億元融資,這家公司成立100天,已經(jīng)完成兩輪融資。
按照估值,目前中國人形機(jī)器人創(chuàng)業(yè)公司已經(jīng)形成了鮮明的梯隊(duì),第一梯隊(duì)的公司有三家:宇樹科技、智元機(jī)器人和銀河通用,估值均超過70億元。第二梯隊(duì)的公司則包括它石智航、自變量機(jī)器人、逐際動力、千尋智能等十多家,估值在20億元-50億元之間。
盡管人形機(jī)器人行業(yè)熱度高漲,但仍然面臨著短期內(nèi)難以大規(guī)模商用的行業(yè)難題,中信智庫在報(bào)告中指出,阻力主要來自以下四個(gè)方面。
首先,機(jī)器人“大腦”,即具身智能機(jī)器人大模型泛化能力有限,導(dǎo)致當(dāng)前應(yīng)用場景受限。
具身智能大模型指通過海量多模態(tài)數(shù)據(jù)(視覺、語言、動作)預(yù)訓(xùn)練,具備環(huán)境感知→任務(wù)理解→動作生成能力的通用智能體模型,逐步實(shí)現(xiàn)從“單一指令執(zhí)行”到“自主決策演進(jìn)”的躍遷,其核心是讓機(jī)器人像人類一樣“看懂世界,聽懂指令,做出行動”,在工業(yè)、醫(yī)療、家庭服務(wù)等場景推動智能化升級。
中信智庫認(rèn)為,機(jī)器人大模型大致可以參照自動駕駛的技術(shù)發(fā)展,也劃分為L1-L5階段。目前處于L4階段,該階段特點(diǎn)是實(shí)現(xiàn)真實(shí)交互反饋,代表模型為谷歌DeepMind于今年3月推出的Gemini Robotics,實(shí)現(xiàn)了視覺-語言-動作(VLA)三模態(tài)深度融合,具備極強(qiáng)的空間推理。
目前具身智能大模型快速迭代,但仍面臨數(shù)據(jù)集不夠、思考跟不上運(yùn)動、缺乏生態(tài)等主要痛點(diǎn),從效果上看,人形機(jī)器人在單一任務(wù)的泛化能力方面取得較好進(jìn)展,但是多任務(wù)、跨任務(wù)的泛化能力仍然相對較弱,影響人形機(jī)器人落地應(yīng)用場景表現(xiàn)。
數(shù)據(jù)是具身智能的“認(rèn)知基石”,目前通用機(jī)器人大模型所需數(shù)據(jù)量極為龐大、且數(shù)據(jù)獲取難度高,導(dǎo)致短期內(nèi)通用機(jī)器人難以采集足夠數(shù)量的真機(jī)數(shù)據(jù)用于大模型訓(xùn)練。
與語言大模型可以直接學(xué)習(xí)大量互聯(lián)網(wǎng)、書籍知識不同,僅靠觀看互聯(lián)網(wǎng)視頻或者人類動作視頻是很難快速提高機(jī)器人的運(yùn)動和規(guī)劃能力。
物理AI仿真系統(tǒng)開發(fā)商松應(yīng)科技首席執(zhí)行官聶凱旋告訴《財(cái)經(jīng)》,人形機(jī)器人則需要在真實(shí)物理環(huán)境中進(jìn)行大量交互操作的數(shù)據(jù)來訓(xùn)練其決策和行動能力,物理世界操作數(shù)據(jù)的短缺限制了人形機(jī)器人的發(fā)展。
機(jī)器人結(jié)構(gòu)設(shè)計(jì)仍需優(yōu)化,零部件可靠性、電池續(xù)航等問題亟待解決。
2025年4月,北京舉辦人機(jī)共跑半程馬拉松。半馬挑戰(zhàn)機(jī)器人綜合性能,是對其關(guān)節(jié)結(jié)構(gòu)設(shè)計(jì)、熱管理、電池續(xù)航、控制算法、通信干擾、軟硬件耦合等方面的綜合性考驗(yàn)。
比賽途中多數(shù)機(jī)器人選手出現(xiàn)運(yùn)動失衡、摔倒等現(xiàn)象,穩(wěn)定性較差;同時(shí),不少機(jī)器人暴露出散熱問題,需不斷噴灑冷卻液進(jìn)行降溫。這是因?yàn)?,機(jī)器人的高功率電機(jī)、密集的電子元件在持續(xù)工作時(shí)會產(chǎn)生大量熱量,尤其是在高速持續(xù)運(yùn)動或重載工況下,熱量積累速度很快。而由于人形機(jī)器人設(shè)計(jì)為仿人結(jié)構(gòu),其內(nèi)部空間緊湊,熱量難以快速散發(fā)。
人形機(jī)器人目前續(xù)航能力有限,大多數(shù)人形機(jī)器人續(xù)航能力集中在2小時(shí)-5小時(shí),難以滿足家庭服務(wù)、工業(yè)協(xié)作等場景的持續(xù)作業(yè)需求,仍有待進(jìn)一步提升。
目前,人形機(jī)器人的供應(yīng)鏈成本較高,硬件價(jià)格仍需進(jìn)一步下降。由于人形機(jī)器人量產(chǎn)產(chǎn)業(yè)規(guī)模有限,相關(guān)的零部件需求暫未完全釋放,而部分零部件如精密傳感器、行星滾柱絲杠等由于應(yīng)用場景有限價(jià)格較為昂貴,未來產(chǎn)業(yè)規(guī)模進(jìn)一步擴(kuò)大也有賴于供應(yīng)鏈環(huán)節(jié)的進(jìn)一步降本。
(本刊記者劉以秦、研究員黃思韻、特約撰稿人顧翎羽對此文亦有貢獻(xiàn))