北京人形機(jī)器人創(chuàng)新中心近日宣布開源國(guó)內(nèi)首個(gè)通過具身智能國(guó)家標(biāo)準(zhǔn)測(cè)試的VLA大模型XR-1,同時(shí)推出配套的數(shù)據(jù)訓(xùn)練工具RoboMIND 2.0和ArtVIP最新版本。這一系列技術(shù)成果旨在破解機(jī)器人從“能識(shí)別”到“會(huì)操作”的關(guān)鍵難題,推動(dòng)具身智能從實(shí)驗(yàn)室走向真實(shí)應(yīng)用場(chǎng)景。
針對(duì)傳統(tǒng)機(jī)器人依賴預(yù)設(shè)指令、環(huán)境適應(yīng)能力弱的問題,研發(fā)團(tuán)隊(duì)重點(diǎn)突破了具身小腦技術(shù)。以倒水任務(wù)為例,當(dāng)杯子被中途拿走或杯口被遮擋時(shí),XR-1模型能自主判斷后續(xù)動(dòng)作——或暫停等待,或撥開障礙物繼續(xù)操作。這種“知行合一”的決策能力源于模型對(duì)物理世界規(guī)律的深度理解,使機(jī)器人能像人類一樣處理突發(fā)狀況,而非機(jī)械執(zhí)行固定流程。
技術(shù)架構(gòu)上,該中心構(gòu)建了“具身天工”通用機(jī)器人平臺(tái)與“慧思開物”智能平臺(tái)兩大核心體系。其中“慧思開物”已開源WoW世界模型和Pelican-VL具身大腦成果,此次補(bǔ)充的XR-1模型則專注于具身小腦能力,與大腦模塊形成協(xié)同。配套發(fā)布的RoboMIND 2.0數(shù)據(jù)引擎和ArtVIP工具鏈,為模型訓(xùn)練提供了海量多模態(tài)數(shù)據(jù)支持,顯著提升了機(jī)器人在復(fù)雜環(huán)境中的泛化能力。
在工業(yè)場(chǎng)景驗(yàn)證中,搭載相關(guān)技術(shù)的“具身天工2.0”和“天軼2.0”機(jī)器人已進(jìn)入福田康明斯發(fā)動(dòng)機(jī)工廠,在無(wú)人產(chǎn)線上自主完成物料搬運(yùn)、箱體取放等任務(wù)。電力領(lǐng)域與中國(guó)電科院的合作中,機(jī)器人可穿越高壓環(huán)境進(jìn)行設(shè)備巡檢;運(yùn)動(dòng)科學(xué)方面,與李寧實(shí)驗(yàn)室共同開發(fā)的測(cè)試系統(tǒng)能持續(xù)進(jìn)行高強(qiáng)度跑鞋耐磨試驗(yàn)。最新與拜耳集團(tuán)達(dá)成的協(xié)議,將拓展固體藥品生產(chǎn)全流程的機(jī)器人應(yīng)用,覆蓋制造、包裝、質(zhì)檢等環(huán)節(jié)。
技術(shù)團(tuán)隊(duì)透露,XR-1模型通過融合視覺、觸覺、力學(xué)等多維度感知信息,構(gòu)建了三維空間動(dòng)態(tài)認(rèn)知框架。這種多模態(tài)融合機(jī)制使機(jī)器人能理解“杯子傾斜會(huì)灑水”“遮擋物可移動(dòng)”等物理因果關(guān)系,從而生成符合邏輯的操作策略。目前模型在工業(yè)場(chǎng)景中的任務(wù)完成率較傳統(tǒng)方案提升47%,異常處理響應(yīng)速度縮短至0.3秒以內(nèi)。
隨著開源社區(qū)的參與,該技術(shù)體系正在形成跨行業(yè)解決方案。開發(fā)者可基于RoboMIND 2.0快速構(gòu)建特定場(chǎng)景數(shù)據(jù)集,通過ArtVIP工具實(shí)現(xiàn)模型微調(diào)。這種開放模式已吸引汽車制造、物流倉(cāng)儲(chǔ)、醫(yī)療護(hù)理等領(lǐng)域的企業(yè)展開聯(lián)合研發(fā),預(yù)計(jì)年內(nèi)將有超過20類新型工業(yè)機(jī)器人投入實(shí)測(cè)。










