埃隆?馬斯克旗下的xAI公司正全力推進“世界模型”的研發(fā)工作,試圖在下一代人工智能系統(tǒng)的競爭中與meta、谷歌等科技巨頭一較高下。這類新型AI系統(tǒng)具備自主理解和模擬物理環(huán)境的能力,被視為推動AI技術突破的關鍵方向。
根據(jù)英偉達的公開資料,世界模型屬于生成式AI范疇,能夠捕捉現(xiàn)實世界的動態(tài)特性,包括物理規(guī)律和空間關系。通過整合文字、圖像、視頻及動作數(shù)據(jù),這類模型可生成具有真實感的動態(tài)場景。與傳統(tǒng)大語言模型不同,世界模型通過分析視頻和機器人傳感器數(shù)據(jù),構建對三維空間的認知能力。
xAI公司近期從英偉達引入兩位核心研究人員——澤尚?帕特爾和何宜暉,二人均在世界模型領域擁有深厚經(jīng)驗。英偉達憑借其Omniverse平臺在該技術領域保持領先,該平臺可創(chuàng)建并運行高度逼真的虛擬環(huán)境。此次人才引進顯示xAI正加速構建技術壁壘,試圖在模型研發(fā)競賽中占據(jù)先機。
知情人士透露,xAI的世界模型項目包含兩大應用方向:其一為游戲產業(yè)開發(fā)可交互的3D環(huán)境生成系統(tǒng),其二則瞄準機器人AI領域。馬斯克在社交平臺公開表示,公司計劃在2025年底前推出“AI生成的優(yōu)質游戲”,重申了去年設定的技術目標。本周xAI還發(fā)布了經(jīng)過重大升級的圖像視頻生成模型,并宣布向用戶免費開放。
與傳統(tǒng)視頻生成工具相比,世界模型展現(xiàn)出顯著技術優(yōu)勢。當前OpenAI的Sora等模型通過預測訓練數(shù)據(jù)中的模式逐幀生成內容,而世界模型能實時解析物理世界的因果關系,精準模擬物體在不同環(huán)境中的互動機制。這種能力突破使AI系統(tǒng)從單純的模式識別邁向對現(xiàn)實世界的深度理解。
盡管前景廣闊,世界模型的研發(fā)仍面臨重大挑戰(zhàn)。構建足夠規(guī)模的現(xiàn)實世界模擬數(shù)據(jù)集既困難又昂貴,谷歌、meta等科技公司雖已投入資源,但尚未取得決定性突破。游戲行業(yè)對AI技術的應用持謹慎態(tài)度,《博德之門3》開發(fā)商拉瑞安工作室的發(fā)行主管邁克爾?道斯公開指出,當前游戲產業(yè)更需要創(chuàng)新的敘事呈現(xiàn)方式,而非算法生成的玩法循環(huán)。
英偉達此前向媒體表示,世界模型的市場潛力可能接近全球經(jīng)濟總量規(guī)模。隨著xAI、谷歌等公司持續(xù)加大投入,這場關乎AI未來形態(tài)的技術競賽正進入關鍵階段。截至發(fā)稿,xAI及相關研究人員尚未對項目進展作出正式回應。











