近日,阿里巴巴內(nèi)部傳出消息,其通義千問(wèn)項(xiàng)目技術(shù)負(fù)責(zé)人林俊旸在社交平臺(tái)透露,公司已悄然組建專(zhuān)注于機(jī)器人研發(fā)與具身智能技術(shù)的小型創(chuàng)新團(tuán)隊(duì)。這一動(dòng)作被視為阿里從純AI軟件服務(wù)向硬件實(shí)體應(yīng)用領(lǐng)域拓展的關(guān)鍵一步,恰逢全球科技企業(yè)競(jìng)相布局機(jī)器人產(chǎn)業(yè)的熱潮。
據(jù)知情人士介紹,該團(tuán)隊(duì)的核心目標(biāo)在于探索多模態(tài)基礎(chǔ)模型與物理世界的交互可能。林俊旸指出,當(dāng)前AI技術(shù)正從單一模態(tài)向具備工具調(diào)用能力的智能體(agents)演進(jìn),這類(lèi)系統(tǒng)可通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)跨時(shí)間維度的復(fù)雜推理。"虛擬世界的智能必須突破次元壁",他在公開(kāi)分享中強(qiáng)調(diào),"真正的價(jià)值在于讓AI理解并操作物理環(huán)境"。
這位年僅32歲的技術(shù)領(lǐng)軍者,目前可能是阿里巴巴集團(tuán)最年輕的P10級(jí)專(zhuān)家。公開(kāi)資料顯示,林俊旸2015年畢業(yè)于北京大學(xué)計(jì)算機(jī)系,同年加入阿里達(dá)摩院后,先后主導(dǎo)了M6、OFA、CogView等跨模態(tài)預(yù)訓(xùn)練框架的研發(fā)。2022年起,他帶領(lǐng)團(tuán)隊(duì)打造的Qwen3-Max和QwQ-32B模型,使通義千問(wèn)在視覺(jué)理解、空間推理等維度達(dá)到行業(yè)領(lǐng)先水平。
業(yè)內(nèi)人士分析,阿里此次組建硬件團(tuán)隊(duì)具有戰(zhàn)略轉(zhuǎn)型意義。過(guò)去三年間,該公司通過(guò)通義千問(wèn)積累了多模態(tài)大模型的核心能力,而機(jī)器人與具身智能的研發(fā)將推動(dòng)這些技術(shù)從數(shù)據(jù)空間走向現(xiàn)實(shí)場(chǎng)景。值得注意的是,林俊旸團(tuán)隊(duì)此前在CogView項(xiàng)目中展示的圖像生成與理解一體化方案,已為AI與物理設(shè)備交互奠定了技術(shù)基礎(chǔ)。
據(jù)技術(shù)文檔披露,新團(tuán)隊(duì)正在攻關(guān)的課題包括:如何讓智能體通過(guò)攝像頭、傳感器等設(shè)備感知三維空間,以及如何建立虛擬訓(xùn)練環(huán)境與真實(shí)操作之間的映射關(guān)系。這些突破或?qū)⒅匦露x電商物流、智能客服等場(chǎng)景的服務(wù)形態(tài)。










