第八屆虹橋國際經濟論壇期間,兩場聚焦人工智能與機器人產業的高端對話在國家會展中心(上海)同步展開。在“人形機器人創新發展合作”分論壇上,憑借春晚扭秧歌表演引發關注的宇樹科技創始人王興興,與在“人工智能產業高質量發展”分論壇亮相的智元機器人團隊,通過不同會場的觀點碰撞完成了行業層面的深度交流。
王興興在發言中坦言,盡管預測今年國內智能機器人企業平均增速將達50%-100%,但行業核心技術突破仍面臨瓶頸。他特別指出,具身智能大模型的發展速度略低于預期,“雖然全身運動控制的深度強化學習取得顯著進步,但大模型的技術迭代仍需加速”。這位技術領軍者以ChatGPT為類比,認為當前行業正處于技術爆發前夜,“當機器人能在80%的陌生場景中,通過語音指令完成80%的任務時,才算真正迎來具身智能的臨界點”。
針對技術突破路徑,王興興提出具體場景設想:若明年此時,未經預訓練的機器人能在完全陌生的環境中,根據自然語言指令完成遞送物品等任務,且成功率達到80%,則標志著技術實現質的飛躍。他同時強調,單純擴大模型規模或數據采集量并非最優解,“模型架構創新與數據質量提升需要同步推進,這已成為全球性技術難題”。
在另一場分論壇中,智元機器人合伙人姚卯青揭示了企業的全棧技術布局。這家成立僅兩年的初創企業,已構建起“本體-數據-模型-場景”四維驅動的創新體系。姚卯青特別指出,機器人產業的數據需求與互聯網存在本質差異,“動作類、長程規劃類數據的稀缺性,使得行業面臨‘數據荒漠’的挑戰”。
為破解數據困局,智元采取雙軌策略:一方面于2024年底開源百萬級真機數據集AgiBot World,通過多輪審核確保數據質量;另一方面創新采集方式,引入“對抗式采集”提升數據密度,開發“自主進化式采集”解決長尾場景問題。這些創新使智元在具身智能算法領域實現多項突破,其GO-1基座模型已在生活、零售、工業場景中通過驗證。
在模型研發層面,智元的世界模型GenieEnvisioner展現出獨特優勢。該模型遵循“生成理解一體化”理念,能夠模擬物理環境變化并預判行為后果。演示視頻顯示,搭載該模型的機器人可連續完成制作三明治、倒茶、裝箱等復雜任務。基于這項技術,智元最新發布的工業機器人精靈G2已斬獲數億元訂單,將在柔性制造和物流分揀領域開啟商用。
值得關注的是,兩家企業雖技術路徑各異,卻都指向具身智能的終極目標。宇樹科技側重模型架構創新,強調在陌生場景中的泛化能力;智元機器人則通過數據閉環和世界模型構建,推動機器人向類人智能演進。這種技術路線的差異化探索,正推動中國機器人產業形成協同創新的良好生態。










