科技圈又迎來(lái)一則重磅消息:馬斯克旗下的xAI正式進(jìn)軍世界模型領(lǐng)域。這一動(dòng)作瞬間引發(fā)行業(yè)關(guān)注,meta、Google DeepMind等科技巨頭或許都在思考,xAI此舉是否會(huì)對(duì)自己形成直接挑戰(zhàn)。
據(jù)《金融時(shí)報(bào)》報(bào)道,為在世界模型這場(chǎng)激烈競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì),今年夏季,xAI成功從英偉達(dá)挖來(lái)多名資深研究員。這一舉措無(wú)疑為xAI注入強(qiáng)大技術(shù)動(dòng)力,也顯示出其布局世界模型的決心。
就在xAI悄然布局世界模型后不久,馬斯克在社交平臺(tái)上再次提及去年定下的目標(biāo):到2026年底,xAI將推出一款極具影響力的AI生成游戲。這一目標(biāo)引發(fā)外界廣泛猜測(cè),xAI的世界模型戰(zhàn)略究竟與這款游戲有何關(guān)聯(lián)。
世界模型近兩年成為全球AI巨頭和實(shí)驗(yàn)室競(jìng)相角逐的新領(lǐng)域。Google DeepMind、meta、NVIDIA以及李飛飛團(tuán)隊(duì)等都在積極投入研發(fā)。如今,xAI的加入讓這場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈。
xAI入局后的第一步,便是從英偉達(dá)“挖角”。今年夏天,xAI至少引入兩位來(lái)自英偉達(dá)的研究人員:Zeeshan Patel和Ethan He。Zeeshan Patel今年5月剛從UC伯克利碩士畢業(yè),研究領(lǐng)域集中在深度學(xué)習(xí)、生成模型和物理人工智能。加入xAI前,他曾在蘋(píng)果AI/ML部門(mén)從事基礎(chǔ)模型研究,之后進(jìn)入英偉達(dá)研究院專(zhuān)注生成式世界模型研究,期間主要研發(fā)大規(guī)模多模態(tài)模型與訓(xùn)練框架。
Ethan He本科畢業(yè)于西安交通大學(xué),隨后前往CMU攻讀計(jì)算機(jī)視覺(jué)碩士學(xué)位,并以?xún)?yōu)異成績(jī)畢業(yè)。其Google Scholar被引數(shù)達(dá)8495。2019年至2021年,他在Facebook AI擔(dān)任研究工程師,負(fù)責(zé)大規(guī)模視頻自監(jiān)督學(xué)習(xí)、視頻基礎(chǔ)模型等工作。2023年加入英偉達(dá)后,他的研究聚焦于MoE模型、多模態(tài)模型和世界模型,并于今年7月正式加入xAI。
這兩位研究員有一個(gè)共同點(diǎn):都曾參與英偉達(dá)Omniverse平臺(tái)的核心開(kāi)發(fā)工作。Omniverse是全球最成熟的仿真平臺(tái)之一,被稱(chēng)為“通往物理世界的數(shù)字平行宇宙”。它作為英偉達(dá)打造的物理一致性仿真系統(tǒng),廣泛應(yīng)用于機(jī)器人訓(xùn)練、3D建模、數(shù)字孿生、自動(dòng)駕駛等領(lǐng)域,能夠在虛擬世界中精準(zhǔn)模擬現(xiàn)實(shí)物理規(guī)律,讓AI在不接觸現(xiàn)實(shí)的情況下學(xué)會(huì)與世界互動(dòng)。這種能力正是世界模型研發(fā)所急需的。
有xAI內(nèi)部人士透露,馬斯克計(jì)劃將英偉達(dá)在圖形與物理模擬領(lǐng)域的技術(shù)積累,應(yīng)用到xAI的世界模型體系中。這一計(jì)劃若能實(shí)現(xiàn),將為xAI的世界模型發(fā)展提供有力支持。
“世界模型”概念最早源于強(qiáng)化學(xué)習(xí),旨在讓AI在腦海中構(gòu)建一個(gè)虛擬世界,用于規(guī)劃行動(dòng)和預(yù)測(cè)結(jié)果。如今,它被不少業(yè)內(nèi)人士視為實(shí)現(xiàn)通用人工智能(AGI)的核心基礎(chǔ)。AI教母李飛飛認(rèn)為,世界模型應(yīng)源自人類(lèi)對(duì)世界的自然認(rèn)知,是一種能讓AI真正理解和推理物理3D世界的模型,而不僅限于文本處理。它能讓AI理解3D結(jié)構(gòu)、形狀和組合性,從而推動(dòng)機(jī)器人技術(shù)、創(chuàng)意產(chǎn)業(yè)和計(jì)算的未來(lái)發(fā)展,還能生成和重建持久存在、可導(dǎo)航的3D環(huán)境,支持多種應(yīng)用,構(gòu)建更大規(guī)模的虛擬世界和多元宇宙。
過(guò)去一年,這一方向成為AI巨頭和實(shí)驗(yàn)室的競(jìng)爭(zhēng)焦點(diǎn)。DeepMind推出Genie 3,能從圖片或文字生成可交互的2D游戲世界;meta發(fā)布V-JEPA-2,讓模型在視頻中預(yù)測(cè)未來(lái)幀、理解物理因果;英偉達(dá)也在強(qiáng)化自身世界模型,用于機(jī)器人訓(xùn)練與數(shù)字孿生。
那么,xAI入局世界模型究竟有何意圖?據(jù)知情人士透露,xAI的首批應(yīng)用可能聚焦于電子游戲領(lǐng)域。目前,團(tuán)隊(duì)正嘗試讓AI自動(dòng)生成自適應(yīng)、逼真的3D場(chǎng)景,這些場(chǎng)景能根據(jù)玩家行為實(shí)時(shí)變化。這與馬斯克設(shè)定的2026年底推出AI生成游戲的目標(biāo)高度契合。
有用戶(hù)在社交平臺(tái)留言稱(chēng):“AI在游戲開(kāi)發(fā)中效率極高,能激發(fā)無(wú)限創(chuàng)造力,這一方向很有前景。”與此同時(shí),xAI內(nèi)部正在組建一支全模態(tài)團(tuán)隊(duì),專(zhuān)門(mén)研究圖像、視頻、音頻的綜合理解與生成。近期公開(kāi)的招聘信息顯示,該團(tuán)隊(duì)涵蓋多個(gè)方向:音頻理解、生成與評(píng)測(cè)的技術(shù)人員,年薪區(qū)間18萬(wàn)-44萬(wàn)美元,側(cè)重多模態(tài)建模與數(shù)據(jù)系統(tǒng)的人員。還有一個(gè)職位引發(fā)行業(yè)熱議——電子游戲?qū)煟瑫r(shí)薪45-100美元,負(fù)責(zé)向模型講解電子游戲機(jī)制、敘事邏輯和任務(wù)設(shè)計(jì)。這表明,馬斯克希望借助人類(lèi)專(zhuān)家的經(jīng)驗(yàn),讓模型學(xué)會(huì)玩游戲、設(shè)計(jì)任務(wù)和構(gòu)建可交互世界。
馬斯克曾多次公開(kāi)表示,xAI的使命是“讓AI理解宇宙的本質(zhì)”。世界模型正是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵路徑。擁有世界模型后,AI不僅能生成內(nèi)容,還能在內(nèi)部模擬出一個(gè)真實(shí)世界的副本。這意味著它既能驅(qū)動(dòng)AI游戲,也能應(yīng)用于智能體、自動(dòng)駕駛乃至具身智能機(jī)器人。
從這一角度看,xAI、特斯拉、Neuralink之間的關(guān)系變得愈發(fā)緊密。xAI負(fù)責(zé)研發(fā)模型,特斯拉擁有機(jī)器人和自動(dòng)駕駛數(shù)據(jù),Neuralink提供腦機(jī)接口作為社交與實(shí)時(shí)反饋平臺(tái)。若這些板塊能通過(guò)世界模型實(shí)現(xiàn)互通,馬斯克的AI帝國(guó)將形成一個(gè)完整的閉環(huán)。











