具身智能領(lǐng)域迎來(lái)重大突破,全球首個(gè)完全基于真實(shí)工廠場(chǎng)景的人類(lèi)中心數(shù)據(jù)集Egocentric-10K正式開(kāi)源。該數(shù)據(jù)集包含10億幀視頻畫(huà)面,由2153名工人在真實(shí)生產(chǎn)環(huán)境中累計(jì)工作一萬(wàn)小時(shí)采集而成,總視頻片段達(dá)19.2萬(wàn)個(gè),數(shù)據(jù)規(guī)模達(dá)16.4TB,是現(xiàn)有同類(lèi)數(shù)據(jù)集EPIC-KITCHENS的100倍。
與傳統(tǒng)家庭場(chǎng)景數(shù)據(jù)集不同,Egocentric-10K首次將數(shù)據(jù)采集場(chǎng)景擴(kuò)展至工業(yè)制造領(lǐng)域。工人們佩戴頭戴式攝像設(shè)備,在抓取、組裝等操作過(guò)程中自然錄制視頻,設(shè)備可捕捉128°×67°視野范圍、1080p分辨率、30幀/秒的高清畫(huà)面。這種采集方式使數(shù)據(jù)集在手部可見(jiàn)性和操作密度指標(biāo)上達(dá)到行業(yè)領(lǐng)先水平,為機(jī)器人學(xué)習(xí)精細(xì)操作提供了更接近真實(shí)工業(yè)環(huán)境的訓(xùn)練素材。
開(kāi)源僅三天,該數(shù)據(jù)集在Hugging Face平臺(tái)的下載量便突破1.3萬(wàn)次,迅速登頂趨勢(shì)榜單。盡管當(dāng)前版本僅包含RGB視頻信息,暫未集成深度、音頻、觸覺(jué)等多模態(tài)數(shù)據(jù),但項(xiàng)目團(tuán)隊(duì)透露正在研發(fā)專(zhuān)用記錄設(shè)備。根據(jù)Build AI官網(wǎng)披露的計(jì)劃,2026年將在深圳制造工廠量產(chǎn)數(shù)百萬(wàn)副智能眼鏡,實(shí)現(xiàn)全球數(shù)據(jù)采集網(wǎng)絡(luò)覆蓋,屆時(shí)可能補(bǔ)充更多模態(tài)信息。
針對(duì)數(shù)據(jù)實(shí)用性爭(zhēng)議,項(xiàng)目團(tuán)隊(duì)回應(yīng)稱(chēng),雖然工業(yè)場(chǎng)景存在操作重復(fù)性較高的問(wèn)題,但通過(guò)覆蓋電子裝配、精密加工等20余個(gè)細(xì)分領(lǐng)域,已確保數(shù)據(jù)具備足夠多樣性。關(guān)于人類(lèi)操作經(jīng)驗(yàn)向機(jī)器人遷移的難題,團(tuán)隊(duì)指出其核心優(yōu)勢(shì)在于數(shù)據(jù)采集成本低、擴(kuò)展速度快,相比真機(jī)數(shù)據(jù)采集效率提升數(shù)十倍,這種規(guī)模化優(yōu)勢(shì)可能成為突破機(jī)器人學(xué)習(xí)瓶頸的關(guān)鍵。
這個(gè)引發(fā)行業(yè)關(guān)注的項(xiàng)目背后,站著一位年僅18歲的創(chuàng)業(yè)者Eddy Xu。這位哥倫比亞大學(xué)輟學(xué)生半年前放棄超2500萬(wàn)美元股權(quán)投資,創(chuàng)立Build AI公司專(zhuān)注構(gòu)建可擴(kuò)展的人類(lèi)中心數(shù)據(jù)集。他的創(chuàng)業(yè)履歷頗為亮眼:13歲在車(chē)庫(kù)創(chuàng)辦首家公司,曾開(kāi)發(fā)國(guó)際象棋智能眼鏡(雖因爭(zhēng)議下架但獲得技術(shù)關(guān)注),更推出AI流量預(yù)測(cè)工具CrowdTest——該產(chǎn)品通過(guò)模擬用戶(hù)反應(yīng)進(jìn)行推文效果預(yù)測(cè),上線5小時(shí)收入破萬(wàn),24小時(shí)內(nèi)總收入達(dá)3萬(wàn)美元,即使定價(jià)高達(dá)每月1000美元仍供不應(yīng)求。
在商業(yè)競(jìng)賽領(lǐng)域,這位少年同樣戰(zhàn)績(jī)斐然:曾斬獲十項(xiàng)全能商業(yè)世界錦標(biāo)賽冠軍,在20萬(wàn)參賽者中脫穎而出;教育科技領(lǐng)域的創(chuàng)業(yè)項(xiàng)目更在三個(gè)月內(nèi)積累17.8萬(wàn)用戶(hù)后成功退出。其最新力作Egocentric-10K選擇與特斯拉、它石智航等企業(yè)相同的技術(shù)路線,試圖通過(guò)大規(guī)模第一視角人類(lèi)操作數(shù)據(jù),破解機(jī)器人靈巧操作難題。這場(chǎng)由少年發(fā)起的智能革命,正在重新定義機(jī)器人學(xué)習(xí)的數(shù)據(jù)邊界。











