國內具身智能領域近日取得里程碑式進展——北京人形機器人創新中心正式開源國內首個通過具身智能國家標準測試的視覺-語言-動作(VLA)大模型XR-1。這一突破性成果標志著我國人形機器人技術從實驗室驗證階段邁向真實場景應用的關鍵轉折點,為機器人產業規模化落地提供了核心支撐。
作為具身智能系統的"小腦"模塊,XR-1大模型展現出強大的跨平臺適配能力。基于超百萬量級的自研多本體數據訓練,該模型可在天工2.0、UR、Franka等不同構型機器人平臺上無縫遷移通用操作知識。在七大泛化維度測試中,XR-1對物體顏色、空間位置、背景干擾等復雜場景表現出優異適應性,能夠精準完成取放、推拉、旋轉等雙臂協同操作任務,動作精度達到行業領先水平。
與XR-1同步開源的還有兩大核心基礎設施:新一代數據底座RoboMIND2.0和高保真數字資產庫ArtVIP最新版。這套組合方案構建起完整的"數據采集-模型訓練-場景驗證"閉環體系,其中RoboMIND2.0支持多模態數據實時處理,ArtVIP則提供超過50萬幀的精細化場景數據,涵蓋工業制造、物流搬運、家庭服務等20余個典型應用場景。
在系統架構層面,創新中心已形成"大腦+小腦+本體"的完整生態布局。物理本體層依托"具身天工"平臺,已迭代出天工2.0、天軼2.0等系列化機器人產品;具身大腦層通過"慧思開物"平臺先后開源WoW世界模型和Pelican-VL大模型,承擔環境感知、任務規劃等高層認知功能;此次發布的XR-1小腦模型則專注于運動控制,實現從決策到執行的精準轉化。










