一場聚焦AI大模型投資能力的全球性賽事“Alpha Arena”近日圓滿收官。這場由第三方機構Nof1發起的比賽,自10月18日啟動以來持續17天,吸引了全球頂尖AI模型的參與,最終以中國模型包攬冠亞軍的結局引發行業關注。
參賽陣容堪稱“AI天團”,包括中國研發的Qwen3-Max與DeepSeek v3.1,美國科技巨頭推出的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5,以及馬斯克旗下xAI團隊開發的Grok 4。所有模型均以一萬美元虛擬資金入場,在真實金融市場中展開完全自主的交易對決,期間無任何人工干預。
比賽進程充滿戲劇性轉折。初期階段,DeepSeek v3.1憑借穩健策略占據領先地位,而Grok 4通過激進操作上演逆襲戲碼,曾將雙方資金差距壓縮至1美元。然而10月21日至22日成為關鍵分水嶺,Grok 4與Claude Sonnet 4.5突然遭遇滑鐵盧,收益曲線急轉直下,甚至出現單日全軍覆沒的極端情況——六大模型收益率集體跌入負值區間。
就在其他模型陷入虧損泥潭時,中國雙雄展現出驚人的適應能力。DeepSeek v3.1與Qwen3-Max同步調整交易策略,凈值曲線逆勢上揚。其中Qwen3-Max表現尤為亮眼,不僅實現后來居上,更在某個交易日短暫超越DeepSeek v3.1。這種動態策略調整能力,成為其最終奪冠的關鍵因素。
最終成績單呈現鮮明對比:Qwen3-Max以1.22萬美元終值斬獲冠軍,收益率突破20%;DeepSeek v3.1以10.49萬美元位列第二。值得關注的是,中美模型形成冰火兩重天——中國雙雄成為僅有的盈利模型,而美國四大頂尖模型全數虧損,其中GPT-5以超62%的虧損率墊底。
這場比賽不僅驗證了AI在復雜金融環境中的決策能力,更暴露出不同技術路線的顯著差異。中國模型展現出的策略靈活性,與美國模型相對固化的操作模式形成強烈反差,為AI大模型的商業化應用提供了全新觀察視角。











