在具身智能的本體設(shè)計與研發(fā)領(lǐng)域,北京的創(chuàng)新主體已取得了顯著的技術(shù)突破與產(chǎn)業(yè)化進(jìn)展,形成從本體設(shè)計、運動控制到仿生交互的完整具身智能技術(shù)鏈條,為人工智能技術(shù)賦能物理世界提供了關(guān)鍵支撐。
具身智能將人工智能與人形機器人、四足機器人等物理實體深度融合,使其不僅具備數(shù)據(jù)處理和決策能力,還能通過感知、運動與真實環(huán)境交互,實現(xiàn)自主學(xué)習(xí)和適應(yīng)性行為。與傳統(tǒng)的人工智能軟件不同,具身智能強調(diào)“身體”與“智能”的結(jié)合,通過“感知一決策一行動一反饋”的閉環(huán)適應(yīng)復(fù)雜現(xiàn)實場景。2025年政府工作報告提出“培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)。大力發(fā)展智能網(wǎng)聯(lián)新能源汽車、人工智能手機和電腦、智能機器人等新一代智能終端以及智能制造裝備”。這標(biāo)志著發(fā)展具身智能產(chǎn)業(yè)正式上升為國家戰(zhàn)略。北京作為全國科技創(chuàng)新中心,在具身智能領(lǐng)域儲備了良好的發(fā)展基礎(chǔ),正在引領(lǐng)全國具身智能高質(zhì)量發(fā)展,著力打造全球具身智能產(chǎn)業(yè)高地。
具身智能技術(shù)實現(xiàn)新突破
近年來,的具身智能產(chǎn)業(yè)加速產(chǎn)學(xué)研聯(lián)動,匯聚創(chuàng)新合力,集聚了、具身智能機器人創(chuàng)新中心(以下簡稱創(chuàng)新中心)等一批新型研發(fā)機構(gòu),人工智能創(chuàng)新指數(shù)排名全國第一、全球第二。
北京擁有全國最多的國家級人工智能科研平臺及頂尖科研人才。北京大學(xué)、清華大學(xué)、北京理工大學(xué)、中國科學(xué)院等高校、科研院所積極投身具身智能基礎(chǔ)研究與關(guān)鍵技術(shù)攻關(guān),為產(chǎn)業(yè)發(fā)展源源不斷地輸送創(chuàng)新理論與前沿技術(shù)。相關(guān)研發(fā)機構(gòu)在情感智能、工業(yè)機器人、電子皮膚、電子芯片等前沿領(lǐng)域持續(xù)創(chuàng)新。
北京人形機器人創(chuàng)新中心有限公司、北京優(yōu)必選科技有限公司、北京理工華匯智能科技有限公司、北京銀河通用機器人有限公司等人形機器人企業(yè),積極與高校、科研院所開展合作,通過共建研發(fā)平臺、聯(lián)合承擔(dān)科研項目、人才聯(lián)合培養(yǎng)等多元模式,加速科技成果轉(zhuǎn)化,推動具身智能技術(shù)從實驗室走向市場,實現(xiàn)產(chǎn)業(yè)化應(yīng)用。目前,數(shù)百家具身智能企業(yè)已在北京的多個園區(qū)顯現(xiàn)出集群效應(yīng),在具身智能產(chǎn)業(yè)的人形化、人性化、應(yīng)用化等方面取得重要突破,形成了以“大腦、小腦、本體”為核心的具身智能全產(chǎn)業(yè)鏈條。
在聚焦具身智能“認(rèn)知一執(zhí)行”雙模態(tài)架構(gòu)協(xié)同創(chuàng)新方面,具身“大腦”與“小腦”的深度耦合突破了技術(shù)瓶頸。具身“大腦”負(fù)責(zé)由AI大模型驅(qū)動的任務(wù)規(guī)劃,能自然交互、感知空間、理解意圖、分層規(guī)劃和反思錯誤,具備多本體兼容、多場景適應(yīng)和強大泛化能力。具身“小腦”負(fù)責(zé)協(xié)調(diào)數(shù)據(jù)驅(qū)動的端到端技能執(zhí)行,操作子平臺執(zhí)行元技能庫、泛化抓取等功能,運控子平臺負(fù)責(zé)全身控制、雙臂協(xié)作等任務(wù)?!按竽X”規(guī)劃任務(wù),調(diào)用“小腦”技能庫執(zhí)行,控制肢體運動,再反饋形成閉環(huán)。
2025年3月12日,創(chuàng)新中心發(fā)布全球首個“一腦多能”“一腦多機”的通用具身智能平臺“慧思開物”,填補行業(yè)空白,為具身智能產(chǎn)業(yè)發(fā)展注入強大動力。該平臺由AI大模型驅(qū)動的具身“大腦”與數(shù)據(jù)驅(qū)動的端到端技能執(zhí)行具身“小腦”協(xié)同構(gòu)成。配備“慧思開物”平臺的人形機器人,能夠精準(zhǔn)解析自然語言指令,通過多模態(tài)信息融合與上下文理解,將復(fù)雜任務(wù)細(xì)化為可執(zhí)行的子任務(wù)序列,并在執(zhí)行過程中實時監(jiān)測狀態(tài),借助自適應(yīng)糾錯與動態(tài)路徑規(guī)劃,確保任務(wù)高效、準(zhǔn)確完成。
在具身智能的本體設(shè)計與研發(fā)領(lǐng)域,北京的創(chuàng)新主體已取得了顯著的技術(shù)突破與產(chǎn)業(yè)化進(jìn)展,形成從本體設(shè)計、運動控制到仿生交互的完整具身智能技術(shù)鏈條,為人工智能技術(shù)賦能物理世界提供了關(guān)鍵支撐。2024年8月,北京星動紀(jì)元科技有限公司正式發(fā)布其首款面向商業(yè)化應(yīng)用的人形機器人產(chǎn)品星動STAR1,該機器人身高171厘米、體重63千克,采用高集成度電驅(qū)系統(tǒng),可實現(xiàn)55個自由度的全域運動控制,其室外奔跑速度達(dá)3.6米/秒,刷新了電驅(qū)人形機器人運動性能的國際紀(jì)錄。該機器人配備12個主動自由度全驅(qū)動的靈巧手,具備單手4指20千克負(fù)載能力,通過強化學(xué)習(xí)算法實現(xiàn)復(fù)雜操作泛化,可完成筷子夾取水餃、指尖操控骰子等高精度任務(wù),并依托高密度觸覺傳感陣列,實現(xiàn)毫米級力控精度,支持超百種工具化操作場景,為工業(yè)制造、醫(yī)療護(hù)理、家庭服務(wù)等垂直領(lǐng)域提供技術(shù)驗證平臺。在運動控制基礎(chǔ)之上,北京清飛科技有限公司突破仿生交互技術(shù)瓶頸,基于機器人本體開發(fā)出覆蓋全身的彈性體表皮系統(tǒng),通過多模態(tài)神經(jīng)網(wǎng)絡(luò)驅(qū)動面部42組仿生肌肉與表皮協(xié)同運動,實現(xiàn)六大類基礎(chǔ)情緒的200余種動態(tài)表情生成,其唇形與語音的同步精度達(dá) 9 8 % ,支持中、英、韓等多語種跨模態(tài)表達(dá),為教育陪伴、服務(wù)咨詢等場景構(gòu)建了更具情感交互能力的具身智能終端。
具身智能生態(tài)日趨完善
政策構(gòu)筑北京具身智能的創(chuàng)新基石。2025年2月28日,市科委、中關(guān)村管委會、市發(fā)展改革委、市經(jīng)濟和信息化局聯(lián)合發(fā)布《北京具身智能科技創(chuàng)新與產(chǎn)業(yè)培育行動計劃(2025-2027年)》(以下簡稱《行動計劃》),為北京具身智能的未來發(fā)展錨定清晰航向。《行動計劃》劍指關(guān)鍵技術(shù)攻堅,計劃通過“揭榜掛帥”等創(chuàng)新機制,全力突破具身大腦模型、小腦技能庫、智能芯片等“卡脖子”技術(shù),全面提升具身機器人應(yīng)對復(fù)雜任務(wù)的能力,旨在打造具有國際影響力的具身智能產(chǎn)業(yè)生態(tài),推動具身大腦與小腦模型、智能芯片、全身運動控制等上下游產(chǎn)業(yè)鏈基本實現(xiàn)國產(chǎn)化。
創(chuàng)新中心還將聯(lián)合高校、科研院所、集成商等具備人形機器人二次開發(fā)能力的機構(gòu),共同打造具身智能開源開放社區(qū),重點推進(jìn)數(shù)據(jù)、模型、場景驗證等研究,為具身智能機器人大模型訓(xùn)練提供數(shù)據(jù)支持,加速通用本體的關(guān)鍵共性技術(shù)突破,推動具身智能機器人加速落地應(yīng)用。
通過技術(shù)開源、數(shù)據(jù)共享、標(biāo)準(zhǔn)制定及產(chǎn)業(yè)協(xié)同,北京正在推進(jìn)構(gòu)建全球領(lǐng)先的具身智能開放生態(tài)。2024年11月11日,創(chuàng)新中心發(fā)布“天工開源計劃”,開放通用機器人母平臺“天工”的軟件開發(fā)文檔、結(jié)構(gòu)設(shè)計文檔,并計劃逐步開源結(jié)構(gòu)圖紙、電氣系統(tǒng)、運動控制框架等核心資源。在數(shù)據(jù)集開源方面,創(chuàng)新中心發(fā)布的首個標(biāo)準(zhǔn)化通用具身智能數(shù)據(jù)集(RoboMIND),適用于多平臺、多場景、多技能,經(jīng)多個模型驗證有效,首批開放高質(zhì)量具身智能數(shù)據(jù)10萬條。在數(shù)據(jù)生態(tài)方面,創(chuàng)新中心數(shù)據(jù)采集涵蓋6類機器人本體7個典型場景,支持模型訓(xùn)練與泛化能力提升。同時,創(chuàng)新中心牽頭編制了《腿式機器人性能及試驗方法標(biāo)準(zhǔn)》《人工智能具身智能數(shù)據(jù)采集規(guī)范》,推動了數(shù)據(jù)格式統(tǒng)一與行業(yè)規(guī)范化。
在2025中關(guān)村論壇年會“未來人工智能先鋒論壇”上,發(fā)布了全球首個跨本體具身大小腦協(xié)作框架RoboOS及開源具身大腦模型RoboBrain。該技術(shù)通過“大腦一小腦”分層架構(gòu)與共享記憶系統(tǒng),推動單機智能邁向群體智能,為構(gòu)建具身智能開源統(tǒng)一生態(tài)、加速場景應(yīng)用提供了底層技術(shù)支持,可應(yīng)用于服務(wù)機器人、工業(yè)自動化、智慧物流、智能制造等領(lǐng)域,支撐復(fù)雜任務(wù)的多機協(xié)作需求。
目前,具身智能正以蓬勃之勢向多領(lǐng)域持續(xù)拓展應(yīng)用,為各行業(yè)轉(zhuǎn)型升級與社會生活品質(zhì)提升注入強勁動力。在工業(yè)制造領(lǐng)域,具身智能推進(jìn)提質(zhì)增效。在汽車制造領(lǐng)域,具身智能機器人已深度嵌入生產(chǎn)流程。具備精準(zhǔn)視覺識別與靈活機械臂操作能力的具身智能機器人,可承擔(dān)零部件裝配等任務(wù)。在醫(yī)療健康領(lǐng)域,北京已有多家三甲醫(yī)院引入手術(shù)輔助機器人,依據(jù)術(shù)前影像數(shù)據(jù),精準(zhǔn)規(guī)劃手術(shù)路徑,術(shù)中通過機械臂實現(xiàn)毫米級精準(zhǔn)操作,輔助醫(yī)生完成高難度手術(shù),降低手術(shù)創(chuàng)傷,提高手術(shù)成功率與患者康復(fù)速度。在教育科研領(lǐng)域,教學(xué)輔助機器人通過生動有趣的互動形式,激發(fā)學(xué)生學(xué)習(xí)興趣。在科學(xué)實驗課程中,機器人能模擬復(fù)雜實驗操作,展示實驗現(xiàn)象,幫助學(xué)生理解抽象科學(xué)知識。此外,在家庭服務(wù)領(lǐng)域,陪伴型機器人能陪老年人聊天解悶、提醒按時服藥,為獨居老人提供情感關(guān)懷與生活照料。
具身智能產(chǎn)業(yè)發(fā)展的挑戰(zhàn)與趨勢
在具身智能產(chǎn)業(yè)快速發(fā)展的同時,也面臨著數(shù)據(jù)獲取難題、模型能力仍待提升、標(biāo)準(zhǔn)與合規(guī)存在問題等挑戰(zhàn)。
在數(shù)據(jù)獲取方面,目前高質(zhì)量機器人數(shù)據(jù)集缺失,收集真實世界的機器人數(shù)據(jù)耗時且昂貴,3D數(shù)據(jù)集建設(shè)也仍舊緩慢。行業(yè)中已經(jīng)出現(xiàn)不少開源的機器人數(shù)據(jù)集,但數(shù)據(jù)質(zhì)量參差不齊,無法實現(xiàn)跨場景、跨任務(wù)應(yīng)用的通用機器人訓(xùn)練。
在模型能力方面,當(dāng)前的多模態(tài)大模型仍然處于快速發(fā)展中,語言、視覺、觸覺等多模態(tài)融合感知能力尚淺,無法支撐機器人在開放場景中運行,在復(fù)雜環(huán)境與長周期的任務(wù)執(zhí)行能力不足。現(xiàn)有的智能體與計算能力無法實現(xiàn)知識的有效轉(zhuǎn)移與泛化,任務(wù)規(guī)劃器無法實現(xiàn)通用場景的適應(yīng)性。
在標(biāo)準(zhǔn)與合規(guī)層面,具身智能技術(shù)、評測、安全倫理等標(biāo)準(zhǔn)缺失。因涉及跨人工智能、機械自動化等交叉學(xué)科技術(shù),安全和倫理問題突出,標(biāo)準(zhǔn)化工作面臨著系列挑戰(zhàn)和難度。具身智能機器人的出現(xiàn),不僅要考慮生命安全風(fēng)險,還面臨著信息安全、個人隱私等一系列倫理和社會學(xué)問題。當(dāng)機器人與人類倫理發(fā)生沖突時,如何規(guī)范、合理地開發(fā)技術(shù)、使用智能產(chǎn)品,以及如何應(yīng)對人機交互過程中可能出現(xiàn)的社會問題,成為亟待解決的問題,需要相關(guān)的監(jiān)管標(biāo)準(zhǔn)和規(guī)范,明確機器人在各個場景中的應(yīng)用邊界和限制。
隨著技術(shù)瓶頸的突破與生態(tài)的完善,具身智能將深入人們生活,重塑社會生產(chǎn)與生活方式,未來發(fā)展呈現(xiàn)出以下趨勢。
技術(shù)創(chuàng)新發(fā)展。具身智能繼續(xù)加深對智能本質(zhì)的理解,將具備跨模態(tài)感知認(rèn)知能力,形成“感知一決策一行動一反饋”閉環(huán),理解復(fù)雜場景,世界模型是實現(xiàn)通用具身智能的關(guān)鍵。具身智能借助強化學(xué)習(xí)等技術(shù)將實現(xiàn)具身智能形態(tài)和行為的自適應(yīng)優(yōu)化,減少人類干預(yù),提升自主決策和行為執(zhí)行精確性。同時,構(gòu)建智能體協(xié)作框架實現(xiàn)集體優(yōu)化,未來或發(fā)展出高級群體智能算法和多智能體系統(tǒng),完成復(fù)雜任務(wù)。
加速產(chǎn)業(yè)跨界整合。具身智能將深入工業(yè)制造領(lǐng)域,提升生產(chǎn)自動化與智能化水平,為醫(yī)療、教育、服務(wù)等行業(yè)帶來全新變革。未來的機器人應(yīng)用將更加多樣化、個性化、智能化,跨界融合成為機器人應(yīng)用的新趨勢,促使不同產(chǎn)業(yè)相互學(xué)習(xí)、協(xié)同創(chuàng)新,創(chuàng)造出更多新的產(chǎn)品、服務(wù)與商業(yè)模式,全面推動產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級。加速社會體系重構(gòu)。具身智能代表著人工智能發(fā)展的新里程碑,預(yù)示著人類即將進(jìn)入一個“知行合一”的新時代。智能將不再局限于冰冷的算法和數(shù)據(jù),而是與現(xiàn)實世界緊密交織、共生共進(jìn)。在勞動就業(yè)層面,傳統(tǒng)的工作崗位將被自動化技術(shù)所取代,這要求社會對就業(yè)結(jié)構(gòu)進(jìn)行調(diào)整,并提供再培訓(xùn)和轉(zhuǎn)崗的機會。在人機關(guān)系層面,具身智能可完成日常輔助工作與高級決策支持,讓人類與機器的關(guān)系更加緊密。在社會關(guān)系層面,社會需提高公眾對具身智能技術(shù)的認(rèn)識和理解。此外,還要解決好具身智能的自主性和決策能力帶來的倫理和法律問題。
(作者:賽智產(chǎn)業(yè)研究院院長/賽智產(chǎn)業(yè)研究院高級咨詢顧問)