在近期落幕的一場全球人工智能與機器人領域的重要會議上,具身智能成為行業關注的焦點。這一連接虛擬模型與物理世界的關鍵賽道,正吸引著眾多企業和科研力量投身其中。深圳極數迭代科技創始人佟顯喬博士在會上圍繞具身智能數據領域進行了深度分享,為行業發展提供了新的思路。
當前,語言大模型憑借海量數據實現了爆發式增長,而具身智能與機器人領域卻面臨著數據供給的巨大缺口。現有的數據集規模僅在數千至十幾萬小時,與語言模型的海量數據儲備差距明顯。數據作為具身智能發展的核心基石,其稀缺性、高成本與碎片化問題,嚴重制約了機器人泛化能力的提升。佟顯喬博士認為,盡管目前具身數據量較少,但無論未來具身模型如何發展、本體怎樣迭代,數據始終是基石,未來幾年數據體量將大幅增長,具身數據服務有望成為機器人領域確定性的數據服務機會。
具身智能的數據瓶頸主要體現在三個方面。從泛化能力來看,類比 Scaling Law,目前機器人的泛化能力遠不足,模仿學習需適配不同本體、數據和場景,但現有的數據采集和空間泛化能力嚴重不足。研究表明,泛化能力與數據數量呈冪律關系,現有數據量難以讓機器人達到較好的任務成功率,且在機器人領域 Scaling Law 依然存在,更多數據大概率能帶來更好效果,所以解決數據需求瓶頸迫在眉睫。從技術路線角度,無論是“小腦加大腦”的分層路線,還是端到端的數據路線,對具身數據的需求都十分龐大。“大腦”負責理解物理世界常識和人類指令、拆分復雜任務;“小腦”或技能層面涉及抓取、按壓等動作,需要人類示教數據和機器人感知數據,且要覆蓋不同場景,很多數據還需人類標注;端到端訓練是大腦與小腦的整合,不同流派方法不同,但都需要不同數據、人的參與以及不同場景和任務的泛化。從定性分析,滿足需求需大腦和小腦數據乘以不同機器人類別,而跨本體數據復用難,放大人類標注演示或做更多泛化任務場景,成本都很高。因此,成本飛漲、模型跨本體能力弱導致數據孤島且標準難統一、難以評估數據實際能力,成為具身智能數據面臨的主要瓶頸。
具身智能數據本身是一項工程化工作,涵蓋從底層采集設計、數據標準確立,到真實環境和仿真環境下的采集部署等一系列環節。目前數據集種類多樣,包括操作類、移動類、邏輯語義類、導航類等,但各做各的,尚未出現能將所有數據聯系起來的通用模型。在數據采集方面,真機采集方式眾多,如遙操、示教、用末端執行器動捕人類視覺數據學習、遙操同構的遙操視學光冠操作等,不同方式在不同維度各有優劣,不同團隊和公司都在探索。仿真數據在軌跡合成、姿態合成、預測生成、決策生成等方面也有不同探索,部分團隊認為仿真數據可能比真機數據效果更好。
針對這些問題,目前沒有通用解法。需針對不同場景做系統設計,在高效性和可靠性間找到平衡,確立數據標準,降低真機、真實世界和仿真數據成本,提升效率,優化不同機器人和場景的部署。對于數據孤島問題,由于不同數據在有效性和通用性上存在差異,如遙操固定真機數據質量高但通用性差,人類視頻數據量大但訓練模型效果差,目前的解決方案是應收盡收。
深圳極數迭代科技有限公司與深圳市人工智能與機器人研究院合作,推出了具身智能數據平臺 AIRSPEED。該平臺致力于兼容不同機器人本體和遙操設備,通過不同的機器人接口、遙操接口、仿真接口,實現真機、仿真以及不同機器人之間的良好兼容性,憑借高軟硬件和技術兼容性實現生產柔性化,高效生產數據。平臺架構盡量減少用戶編程需求,用戶配置好接口后,通過一個接口就能實現全流程順暢的數據生產,旨在成為第三方平臺,減少客戶適配不同機器人和數據的復雜工作。
該平臺不僅是一個技術解決方案,更是一個管理解決方案平臺。當數據達到一定規模后,需要管理大規模采集員、標注員,進行任務調度、數據處理和標注等系統工程,這些都能通過平臺高效管理。平臺針對真機數據提出“萬物皆可達”,適配不同采集方案,從遙操到示教類,分三個階段兼容,提供統一接口;針對仿真數據提出“萬物皆可生”,從軌跡合成、資產合成、決策生成和預測生成四個維度,統一管理不同仿真平臺和資產。平臺引入 AI Agent 概念,減輕任務管理員等工作負擔,加入大模型用于自動標注、自動資源管理和訓練模型評測,旨在打造具身智能數據工具鏈,助力高效訓練模型和快速部署。
目前,該平臺在真機和仿真方面都具備了快速迭代模型的能力,在真實世界數據集構建上實現了 30 多倍加速,在仿真方面有 3.5 倍加速,期望以飛輪效應不斷提升模型迭代效率。其數據管理平臺以數據集交付為中心,分開管理任務、設備、標注、用戶,不同客戶可直接在平臺上進行任務管理和生成,支持多種遙操作、動捕和 UMI 等設備接入,實現統一數據管理。目前,平臺已與遙操設備合作伙伴、數據采集盒子供應商以及不同機器人廠商開展合作。公司專注于機器人數據、具身數據探索,以 AIRSPEED 平臺為核心產品提高數據效率,還著有相關書籍《具身智能數據工程》。用戶使用平臺時,可以數據集為中心建立不同數據集,選擇本體和遙操設備,批量建立任務后發給采集員采集數據,采集完上傳平臺由標注員標注,審核員審核后導出標準數據集用于訓練模型,平臺支持多種機器人和遙操設備,也支持在仿真環境進行遙操和數據采集。











