北京人形機(jī)器人創(chuàng)新中心近日宣布,正式開源其最新研發(fā)的具身智能多模態(tài)大模型——Pelican-VL1.0。這一舉措標(biāo)志著國(guó)內(nèi)在具身智能領(lǐng)域的技術(shù)突破邁出了重要一步,也為全球開發(fā)者提供了更強(qiáng)大的工具支持。
Pelican-VL1.0模型包含7B和72B兩種參數(shù)規(guī)模版本,是目前全球范圍內(nèi)規(guī)模最大的開源具身多模態(tài)大模型。根據(jù)第三方測(cè)試數(shù)據(jù)顯示,該模型在多項(xiàng)性能指標(biāo)上表現(xiàn)優(yōu)異,不僅超越了國(guó)際領(lǐng)先的GPT-5同類模型15.79%,還在國(guó)內(nèi)通義千問(wèn)、書生萬(wàn)象等知名模型中脫穎而出,成為當(dāng)前性能最強(qiáng)的開源具身多模態(tài)大模型。
該模型的核心優(yōu)勢(shì)在于其強(qiáng)大的視覺(jué)-語(yǔ)言感知能力,能夠通過(guò)多模態(tài)交互實(shí)現(xiàn)復(fù)雜場(chǎng)景下的多步任務(wù)規(guī)劃。在實(shí)際應(yīng)用中,Pelican-VL1.0可顯著提升具身智能系統(tǒng)在商業(yè)服務(wù)、工業(yè)泛工業(yè)、高危特種作業(yè)以及家庭服務(wù)等多個(gè)領(lǐng)域的適應(yīng)性和執(zhí)行效率。例如,在工業(yè)場(chǎng)景中,機(jī)器人可以更精準(zhǔn)地識(shí)別設(shè)備狀態(tài)并完成維護(hù)任務(wù);在家庭服務(wù)中,則能更好地理解用戶需求并提供個(gè)性化服務(wù)。
此次開源不僅提供了完整的模型架構(gòu)和訓(xùn)練代碼,還包含詳細(xì)的文檔說(shuō)明,方便全球開發(fā)者快速上手和二次開發(fā)。北京人形機(jī)器人創(chuàng)新中心表示,希望通過(guò)開源共享推動(dòng)具身智能技術(shù)的快速發(fā)展,加速其在各行業(yè)的應(yīng)用落地,為人工智能技術(shù)賦能實(shí)體經(jīng)濟(jì)提供新的解決方案。











