埃隆·馬斯克近日在社交媒體上透露,其旗下人工智能企業(yè)xAI正在開發(fā)的Grok 5大型語言模型,有10%的可能性達成通用人工智能(AGI)目標,且這一概率正穩(wěn)步提升。作為特斯拉與SpaceX的掌舵人,馬斯克此次的預測引發(fā)了科技界對AGI實現(xiàn)路徑的廣泛討論。
xAI的技術路線與馬斯克對AI效率的追求一脈相承。以Grok系列模型為例,2023年11月問世的Grok-1憑借330億參數,在性能上逼近參數規(guī)模翻倍的LLaMA 2(70B),且訓練資源消耗僅為后者的一半。2024年4月推出的多模態(tài)版本Grok-1.5V更進一步,不僅能通過視覺信息生成Python代碼,還在RealWorldQA基準測試中超越同類模型,展現(xiàn)了跨模態(tài)理解與代碼生成能力的結合。
Grok 5被視為xAI技術突破的關鍵里程碑。據內部消息,該模型采用全新架構設計,可能擺脫對海量數據的依賴,通過更高效的自我學習系統(tǒng)降低訓練成本。這一方向與當前主流模型依賴大規(guī)模數據標注和算力堆砌的模式形成鮮明對比,若能實現(xiàn),將大幅縮短AGI的研發(fā)周期。
在回應網友質疑時,馬斯克以幽默方式提及,Grok 5在AI工程領域的表現(xiàn)已超越加拿大深度學習專家安德烈·卡帕斯。卡帕斯曾主導meta AI實驗室研究,并提出“模型規(guī)模即性能”的范式。而xAI通過自主研發(fā)的訓練堆棧(基于Kubernetes、Rust和JAX的定制框架),在資源利用率上取得突破,為模型效率優(yōu)化提供了新思路。
















