人工智能領域迎來重要突破,Anthropic公司正式推出新一代AI模型Claude Sonnet 4.5。該模型在編碼能力、計算機操作以及專業領域推理方面展現出顯著優勢,被業界視為智能體技術發展的重要里程碑。
在編碼性能方面,Claude Sonnet 4.5創造了新的行業標桿。根據SWE-bench Verified評測數據顯示,該模型在處理復雜多步驟編程任務時,能夠持續保持專注超過30小時,并穩定輸出高質量代碼。Anthropic特別強調,這款模型是目前全球最擅長計算機操作的AI系統,其綜合性能已超越同類產品。
計算機交互能力是此次升級的核心亮點。在OSWorld基準測試中,Claude Sonnet 4.5以61.4%的得分位居全球首位,較四個月前的前代模型42.2%的成績實現大幅提升。通過配套的谷歌瀏覽器擴展程序,該模型可直接在瀏覽器環境中完成網頁導航、表格填寫等完整任務流程,全程無需人工干預。
商業應用層面,Anthropic同步推出多項產品升級。Claude Code開發環境新增"檢查點"功能,支持自動保存工作進度并實現即時回滾;終端界面完成優化,同時推出原生VS Code擴展插件。API服務新增"上下文編輯"和"記憶工具"模塊,使智能體能夠處理更復雜的長期任務。
專業領域應用獲得顯著突破。來自金融、法律、醫療及STEM領域的專家反饋表明,相較于包括Opus 4.1在內的前代模型,Claude Sonnet 4.5在專業知識和邏輯推理方面表現出質的飛躍。這種提升使其能夠更精準地處理特定領域的復雜問題。
用戶交互體驗實現全面升級。Claude應用現直接支持代碼執行和文件創建功能,涵蓋電子表格、演示文稿、文檔等多種格式,用戶無需切換外部工具即可完成工作。此前加入等待列表的Max訂閱用戶,現已可體驗谷歌瀏覽器擴展程序帶來的便捷操作。
開發者生態建設取得實質進展。Anthropic向開發者社區開放了Claude Code的核心組件——Claude Agent SDK,這一舉措將降低智能體開發門檻,助力第三方開發者創建定制化AI解決方案。模型定價策略保持穩定,每百萬tokens收費仍維持在3美元至15美元區間。










