專注于金融科技領域的人工智能研究機構nof1近日宣布,其研發的大型模型交易實戰項目Alpha Arena正式啟動。該項目旨在通過真實市場環境檢驗主流AI大模型的交易決策能力和風險控制水平,測試平臺選定去中心化交易平臺Hyperliquid,為參與模型提供高度仿真的交易場景。
在嚴格控制的實驗條件下,六款具備金融應用潛力的AI模型展開同臺競技。測試采用統一數據源和標準化提示詞,確保所有模型在相同信息環境下運行。每款模型均獲得1萬美元真實資金進行獨立操作,實驗周期內完全自主執行交易策略,不受人工干預影響。
參與測試的模型陣容包括GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1和Qwen3Max等前沿產品。經過完整交易周期后,實驗數據揭示出顯著差異:DeepSeek V3.1與Grok-4表現尤為亮眼,雙雙取得超過14%的收益率并列榜首;而Gemini2.5Pro則出現極端虧損情況,資金縮水達4257%,成為本次測試中最具戲劇性的結果。
項目負責人指出,Alpha Arena的核心價值不在于簡單的模型排名,而是通過系統性壓力測試,觀察不同技術架構在極端市場波動中的策略適應性。實驗重點關注模型的風險識別速度、倉位調整機制以及黑天鵝事件應對能力,這些指標對構建自主量化交易系統具有關鍵參考價值。
此次實戰測試標志著AI技術應用邊界的進一步拓展。從傳統的文本處理與邏輯推理,到直接參與高風險金融決策,技術演進路徑清晰可見。nof1團隊強調,實驗數據將為開發更穩健的AI交易系統提供重要依據,推動智能投顧技術向實戰化、專業化方向邁進。















