螞蟻集團旗下螞蟻百靈研發團隊宣布,正式開源全球首個萬億參數自然語言推理大模型Ring-1T-preview。這款基于自研Ling2.0語言基座構建的模型,在多項權威測試中展現出超越主流開源模型及部分商業模型的性能,標志著國產大模型在復雜推理領域取得重要突破。
在數學與邏輯推理能力驗證中,Ring-1T-preview交出亮眼成績單。國際奧林匹克數學競賽(IMO25)測試顯示,該模型可一次性完整解答第三題,同時在其他四道題目中部分推導出正確答案。在AIME 25基準測試中,模型以92.6分超越所有已知開源模型及Gemini 2.5 Pro,與GPT-5(無工具輔助)94.6分的差距縮小至2分。更引人注目的是,在代碼生成能力測試CodeForces中,該模型以94.69分反超GPT-5,創下開源模型在該領域的最高紀錄。
權威榜單數據進一步印證其技術實力。LiveCodeBench編程能力測試與ARC-AGI-v1通用人工智能測試中,Ring-1T-preview均位列開源模型榜首。研發團隊透露,這些突破得益于對1T規模語言基座的后訓練優化,通過持續算法調優與數據增強,充分釋放了萬億參數模型的推理潛能。
據研發團隊介紹,當前開源的Ring-1T-preview為預覽版本,完整版Ring-1T正在緊鑼密鼓訓練中。該模型作為Ling2.0家族的重要成員,其技術演進路徑體現了螞蟻集團在基礎模型領域的長期投入。團隊表示,后續將持續優化模型在多模態理解、復雜任務拆解等方向的能力,為金融、醫療等專業領域提供更強大的AI基礎設施。