中國科技企業阿里巴巴集團近日宣布,其人工智能團隊研發的Qwen3-Max-Thinking推理模型在國際數學競賽領域取得突破性進展。該模型在兩項全球頂尖數學賽事——美國數學邀請賽(AIME)和哈佛-麻省理工數學錦標賽(HMMT)中均獲得滿分,成為首個在這兩項賽事中實現100%準確率的中國AI系統。
據技術團隊介紹,Qwen3-Max-Thinking屬于阿里巴巴AI與云計算部門推出的Qwen3-Max系列最新版本,模型參數規模超過1萬億。該系列的首個版本Qwen3于今年4月發布,升級版Qwen3-Max則在9月底正式推出。在性能對比測試中,阿里云表示這款模型的表現顯著優于Anthropic的Claude Opus4、DeepSeek的V3.1、xAI的Grok4以及OpenAI的GPT-5Pro等國際主流AI系統。
數學推理能力是評估AI系統核心認知水平的重要指標。位于硅谷的AI軟件公司Intuition Labs分析指出,AIME和HMMT作為全球最具挑戰性的數學競賽,其題目涵蓋算術、代數、數論和概率等多個領域,對參賽者的邏輯推導和問題解決能力要求極高。阿里巴巴模型在這兩項賽事中的完美表現,標志著中國AI在復雜推理任務處理方面達到國際領先水平。
除了學術領域的突破,該模型在真實商業場景中也展現出強大實力。在近期進行的一項加密貨幣交易模擬實驗中,Qwen3-Max與五個中美頂尖AI系統展開為期兩周的對決。最終結果顯示,Qwen3-Max實現22.3%的投資回報率,而同期參與測試的OpenAI GPT-5Pro模型則出現62.7%的虧損,其他系統表現也明顯落后。這項實驗驗證了模型在動態市場環境中的決策能力和風險控制水平。
目前,Qwen3-Max-Thinking已通過Qwen聊天機器人網頁端和阿里云API平臺向個人開發者開放。項目核心研究員林俊揚在社交平臺透露,團隊正在持續優化模型架構,重點提升多模態理解和長程推理能力。他特別強調,當前版本仍存在改進空間,技術團隊將繼續完善系統在復雜場景下的適應性。
行業觀察人士指出,阿里巴巴此次突破不僅體現在競賽成績上,更在于其模型展現出跨領域的通用智能潛力。從數學推理到金融決策,這種多維度能力驗證為AI技術的商業化應用開辟了新路徑。隨著參數規模和訓練數據的持續增長,中國AI企業正在全球技術競賽中占據更有利的位置。










