螞蟻集團旗下螞蟻百靈研發團隊近日宣布,正式開源全球首個萬億參數級別的自然語言推理大模型——Ring-1T-preview。該模型作為萬億參數推理大模型Ring-1T的預覽版本,在自然語言處理領域展現出突破性能力,標志著開源社區迎來首個具備萬億級參數的推理專用大模型。
在權威評測中,Ring-1T-preview的表現引發行業關注。該模型在AIME 25數學推理測試中取得92.6分,不僅超越所有已知開源模型,更超過閉源模型Gemini 2.5 Pro,與GPT-5(無工具輔助)94.6分的成績僅差2分。在編程能力評估平臺CodeForces測試中,其94.69分的成績直接超越GPT-5,顯示出強大的代碼生成與邏輯推演能力。在LiveCodeBench編程基準測試和ARC-AGI-v1通用人工智能評估中,該模型均位居開源模型榜首。
研發團隊透露,Ring-1T-preview的推理能力已通過國際奧林匹克數學競賽(IMO)的實戰檢驗。在模擬測試中,模型成功一次性完整解答第三題,并在第一、二、四、五題中部分推導出正確答案,展現出對復雜數學問題的分層解析能力。這一成果得益于團隊對Ling2.0家族1T語言基座模型的持續優化,通過后訓練技術充分釋放了萬億參數模型的推理潛能。
目前,螞蟻百靈團隊正全力推進Ring-1T正式版的訓練工作。該版本將在預覽版基礎上進一步優化模型架構,預計將帶來更強的邏輯推演、多步推理和跨領域知識遷移能力。隨著正式版訓練的推進,開源社區有望獲得一個更完善的萬億參數推理大模型,為自然語言處理、數學推理、代碼生成等領域的研究提供全新工具。