滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

阿里Qwen3-Max-Thinking思考模型亮相，數學滿分卻成token消耗大戶

時間：2025-11-04 16:30:05 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

阿里最新推出的推理模型Qwen3-Max-Thinking早期預覽版引發行業關注。這款尚未正式發布的模型在AIME 2025數學競賽和哈佛-MIT數學錦標賽等權威測試中取得滿分成績，展現出強大的邏輯推理能力。測試數據顯示，該模型在解決復雜數學問題時展現出多維度驗證能力，甚至會主動調用代碼解釋器進行交叉驗證。

該模型的核心突破在于實現了思考模式與非思考模式的深度融合。在智能體編程任務中，模型能夠準確理解用戶需求并生成完整解決方案。以開發開源項目分享網站為例，模型不僅完成了1417行代碼的HTML原型設計，還確保了網頁布局的合理性。雖然代碼量較同類模型多出近一倍，但生成結果在功能完整性上具有明顯優勢。

在常識推理測試中，模型展現出優秀的邏輯規避能力。面對包含邏輯陷阱的提問，模型能夠快速識別關鍵信息并給出精準回答。值得注意的是，這種推理能力在基礎版Qwen-3-Max上同樣表現優異，僅需幾十個字符即可完成解答，顯示出阿里在模型基礎架構上的深厚積累。

技術實現方面，模型引入了創新的思考預算控制機制。用戶可在1024至81920個token范圍內自由調節推理深度，這種設計既保證了復雜任務的處理能力，又為成本控制提供了靈活空間。實際測試表明，解決AIME壓軸題約消耗1.2萬至1.5萬個token，處理時間約4-5分鐘。

目前該模型僅支持文本生成模態，通過Qwen Chat和阿里云API提供限時免費服務。雖然尚未在Hugging Face等開源平臺發布，但已在開發者社區引發熱烈討論。不少技術人員通過個人渠道獲取體驗資格，并在社交媒體分享使用心得，形成自發傳播效應。

作為Qwen3系列的重要成員，Qwen3-Max-Thinking的參數量超過1萬億規模。今年9月發布的Qwen3-Max預覽版已展現強大實力，此次推理專項模型的推出進一步豐富了產品線。業內人士分析，這種"基礎大模型+專項強化模型"的組合策略，可能成為未來AI模型發展的重要方向。

更多>同類資訊

AI投資大賽落幕：中國兩大模型盈利領跑，美國四大模型折戟GPT-5墊底

11-04

微信支付AI新功能來襲：智能收款、文案潤色、開發指導一應俱全

11-04

OpenAI與亞馬遜云科技強強聯手，7年380億美元助力AI算力大飛躍

AWS CEO 馬特?加爾曼表示，「AWS 的頂級基礎設施將成為 OpenAI 實現 AI雄心的支柱，我們優化計算資源的廣度與即時可用性，充分體現了 AWS 為何能獨特地支持 OpenAI 龐大的 AI …

11-04

谷歌CEO確認：Gemini 3將于2025年發布，聚焦多模態任務能力提升

據THE DECODER報道，谷歌正準備推出其下一代人工智能模型 Gemini 3，谷歌 CEO桑達爾·皮查伊在最近一次財報電話會議上確認其將于 2025 年發布。皮查伊表示，“我們試圖改進的每一個舊模…

11-04

6G爭奪戰一觸即發！英偉達攜手諾基亞，欲與華為等中國企業一較高下

再怎么投資Open AI，英偉達賣的也還是GPU，但投資諾基亞，意味著英偉達要掌握“通信”主導權——通信不是硬件，而是硬件與人類世界的交互和連接，再往大了說，這是人工智能時代“萬物互聯”的權力。2014年，諾…

11-04

溫氏股份攜手華為，聚焦四大領域共繪養殖行業數智化新藍圖

此次戰略合作聚焦深度推動IT+BT的融合、共建共維“溫氏云”架構、打造網絡基礎設施建設行業標桿等幾大領域，雙方將攜手打造智慧養殖的數字化底座，積極推動行業的技術創新與轉型升級，共同探索養殖行業的數字化轉型之路…

11-04

OpenAI牽手亞馬遜達成380億美元合作共筑AI算力與生態新未來

【太平洋科技】11 月 4 日消息，據媒體報道，亞馬遜網絡服務（AWS）與 OpenAI 宣布達成一項為期七年、價值高達 380億美元的戰略合作。根據協議，AWS 將為 OpenAI 提供云基礎設施，用…

11-04

谷歌2025年將推Gemini 3模型，注重多模態任務，月活超6.5億但仍落后ChatGPT

據THE DECODER報道，谷歌正準備推出其下一代人工智能模型 Gemini 3，谷歌 CEO桑達爾·皮查伊在最近一次財報電話會議上確認其將于 2025 年發布。皮查伊表示，“我們試圖改進的每一個舊模…

11-04

首屆中國（國際）機器人辯論大賽“人機對辯” 共探AI思辨新高度

復賽各隊交叉進行的人機辯論，不以辯論勝負為標尺，而是從機器人的邏輯性、語言表現力、多模態交互、技能展示和臨場應變5個維度進行打分，這是對機器人的大模型訓練和硬件設備調試的綜合性的考驗。此次通過舉辦機器人辯論…

11-04

浙江烏鎮迎來機器人“交警”，1.8米高個兒聯動信號燈智能指揮交通

11月3日，機器人“交警”輔助指揮交通。當日，機器人“交警”在浙江桐鄉烏鎮上崗，該交通指揮機器人高1.8米，不僅可復刻各類指揮動作，更能與信號燈系統聯動，實現動態分流與智能勸導。據悉，烏鎮作為世界互聯網大會…

11-04

進博會技術裝備展區：約翰迪爾“大塊頭”靈活，高通與國產手機“秀合作”

11-04

溫氏股份攜手華為深化合作，共筑智慧養殖新未來，探索數智化轉型新路徑

11-04

宏潤建設攜手矩陣超智，人形機器人“星際1號”亮相開啟行業新篇

據介紹，矩陣超智于今年7月的上海世界人工智能大會發布了自主研發的Matrix-1人形機器人，已經有產品落地。矩陣超智創始人張海星還通過自然語言指揮，展示了一次“看到—思考—行動”的行為，并表示能看、會聽、能…

11-04

亞馬遜AWS與OpenAI簽署380億美元合作協議共推AI基礎設施規模化發展

11-04

亞馬遜與OpenAI簽380億美元大單，共啟AI算力新篇與生態新局

11-04

點擊查看更多 +

全站最新

雷軍揭秘小米汽車測試：全周期覆蓋，YU7高原測試展硬核實力

小米汽車測試體系全解析：量產前后嚴苛驗證，三高測試護航品質

新能源汽車空調濾芯別小看！結合環境選更換周期，守護車內清新空氣

新能源汽車底盤剮蹭別大意！護板、懸掛、管線都要查

紅旗HS6 PHEV盲訂啟幕，大五座插混SUV以全能實力開啟出行新體驗

馬自達開啟專屬電動車研發新篇，投入百億美金延續駕駛基因

熱門內容

本欄最新

?12.68萬起預售！埃安i60攜三大核心技術開啟15萬內增程SUV新篇章?

煥新極氪7X上市：137項豪華配置全系標配，重新定義家庭豪華SUV新標桿

2025年合資新能源“起勢”：以中國定制破局，能否重塑市場新格局？

從接娃到自駕游：騰勢N8L用全維科技，讓全家出行每個痛點都有解

比亞迪騰勢N8L大六座SUV來襲，安全豪華科技兼備，全家出行新選擇

極氪7X煥新登場，全系標配豪華科技，重塑家庭豪華SUV新標桿

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

阿里Qwen3-Max-Thinking思考模型亮相，數學滿分卻成token消耗大戶