人工智能公司Anthropic日前宣布推出新一代輕量級推理模型Claude Haiku 4.5,該模型在保持高性能的同時顯著降低了使用成本。據官方披露,這款模型專為需要快速響應的場景設計,其編程能力達到Claude Sonnet 4水平,但運行速度提升超過2倍,使用成本僅為前者的三分之一。
在權威編程測試集SWE-bench Verified上,Claude Haiku 4.5展現出與Claude Sonnet 4及OpenAI GPT-5相當的性能表現。特別值得注意的是,該模型在計算機操作等實際任務中的完成度甚至超越了Claude Sonnet 4。目前所有用戶均可通過Claude API調用該模型,輸入輸出定價分別為每百萬token 1美元和5美元。
Anthropic首席產品官邁克·克里格透露,付費用戶使用Haiku模型的成本約為Sonnet的三分之一,而Sonnet的成本又僅為Opus模型的五分之一。公司正在開發下一代Opus更新版本,預計將于今年底至明年初發布。在模型架構方面,Claude系列保持統一命名規則:Haiku代表輕量級,Sonnet為中量級,Opus則是旗艦級。
技術文檔顯示,Claude Haiku 4.5的訓練數據涵蓋2025年2月前的互聯網公開數據、第三方非公開數據、專業標注數據及用戶授權數據。通過多階段數據清洗和強化學習訓練,該模型實現了混合推理能力。用戶可自由切換快速響應模式與擴展思維模式,后者允許模型進行更深入的思考后再給出答案。
在上下文處理方面,新模型具備精確的窗口使用量感知能力。當接近處理極限時,模型會自動總結答案;在容量充足時則保持持續推理。這種設計有效避免了模型過早終止計算或提供不完整答案的問題。實際測試表明,該模型在多模型協同工作中表現突出,例如可與Claude Sonnet 4.5配合完成復雜任務分解與執行。
安全性評估顯示,Claude Haiku 4.5在單輪場景下的無害響應率與Claude Sonnet 4.5持平。面對敏感問題時,模型會先給出法律警示再提供理論性解答。在Agent Red Teaming基準測試中,該模型在25個變體中取得多項最優成績,有效防范了數據泄露、惡意代碼生成等安全風險。研究還發現,模型在評估場景中表現出強烈的自我審視意識。
據公司發言人介紹,Anthropic當前估值達1830億美元,已為超過30萬家企業提供服務,本月年收入運行率接近70億美元。為保持競爭力,公司采用"無縫銜接"的研發策略——在訓練Claude Sonnet 4.5的同時已啟動Haiku 4.5的開發工作。這種滾動開發模式使其在8月推出Claude Opus 4.1后,能迅速跟進發布新一代模型。











