滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

Claude Sonnet 4.5強勢登場：編程能力再升級，連續30小時自主寫代碼超厲害

時間：2025-09-30 14:39:35 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

編程模型領域迎來新一輪技術突破——Anthropic推出的Claude Sonnet 4.5模型在多項關鍵指標上超越前代，成為當前性能最強的編程專用模型。這款新模型不僅在代碼生成效率上實現質的飛躍，更在安全性與專業領域應用方面展現出顯著優勢。

在編程能力驗證方面，Claude Sonnet 4.5在SWE-bench測試中取得1.8個百分點的提升，達到行業領先水平。更引人注目的是其持續工作能力——第三方測試顯示，該模型可自主完成長達30小時的編程任務，期間生成超過1.1萬行代碼，成功構建出具備完整功能的類Slack聊天應用。這一表現較前代Opus 4模型的7小時持續工作時長提升超4倍。

計算機系統操作測試（OSWorld）中，新模型以60.2分的成績刷新紀錄，較前代提升近50%。在終端編程（Terminal-Bench）和工具使用（τ2-bench）等專項測試中，同樣展現出顯著進步。數學能力驗證方面，該模型在AIME 2025試題中達到100%準確率（借助Python工具），純推理模式準確率也高達87%。

專業領域應用成為另一大亮點。在金融、醫療、法律及STEM四大領域，新模型相較前代對基準模型的勝率大幅提升，16K上下文環境下開啟深度思考模式時，準確率均突破60%閾值。某金融機構AI負責人評價稱，該模型已能提供投資級專業分析，顯著提升決策效率。

安全性方面，通過專項訓練，模型諂媚、欺騙等不良行為發生率大幅降低。在防御即時注入攻擊測試中，新模型展現出更強的魯棒性，正常請求誤拒率從0.15%降至0.02%。GitHub首席產品官Mario Rodriguez特別指出，該模型顯著提升了Copilot處理跨代碼庫復雜任務的能力。

技術生態同步升級，Anthropic發布的Claude Agent SDK將智能體開發框架從專用代碼工具擴展為通用開發平臺。新框架系統化構建"上下文收集-行動執行-結果驗證"開發循環，重點解決長任務內存管理、權限控制系統、多智能體協作三大技術難題。配套推出的Imagine with Claude功能支持實時需求轉化，用戶輸入構思即可自動生成可運行原型。

在商業策略上，新模型延續"提質不提價"原則，輸入/輸出token價格分別維持3美元和15美元每百萬單位。Cognition公司CEO Scott Wu透露，基于該模型開發的Devin工具在規劃能力和端到端評估中取得突破性進展。目前開發者已可通過官方渠道體驗新模型及開發工具。

更多>同類資訊

上海文貫狄閣老AI訓練指南：讓電銷機器人持續進化，智能匹配業務需求

電銷機器人的智能程度并非一成不變，通過持續 AI 訓練，可實現話術優化、識別精準度提升等進化。 AI訓練是電銷機器人保持競爭力的核心，上海文貫狄閣老通過 “話術自助訓練、意圖標注訓練、知識快速導入、模型自…

09-30

東華測試與南通振康攜手，以技術互補共促人形關節模組發展新篇

據機器人大講堂了解，東華測試與南通振康此次合作并非單一技術或產品的對接，而是圍繞傳感技術、采集技術、控制技術三大核心領域展開深度整合，針對性解決當前關節模組研發中的多個技術痛點，最終實現技術迭代升級，為行業…

09-30

?六足蛛形機器人“夏洛特”：24小時3D打印房屋，未來或助力月球基地建設?

這款機器人名為"夏洛特"，由澳大利亞克萊斯特機器人公司和地球建筑技術公司共同研發，其目的是在地球上提供低成本、低耗能的住房。這一領域的領軍企業之一—— 美國建筑技術公司ICON正與NASA合作"奧林匹斯計劃…

09-30

河海大學師生森林激光雷達研究獲突破，為森林調查提供高效方案

近日，我校地理與遙感學院王紅教授課題組在森林激光雷達數據處理方法方面取得重要進展，相關研究成果以“StemReg: A Marker-FreeAutomated Method for Registering…

09-30

火星甲烷謎團二十年未解：是生命呼吸還是地質“惡作劇”？

09-30

火星隕石“懸案”未解：神秘晶體是生命痕跡，還是自然造物的巧合？

09-30

詹姆斯?韋伯望遠鏡立功！天王星“冰火山鏈”現身，冰巨星竟暗藏活力

09-30

第100次圓滿發射！長征二號丁火箭：測試高效、衛星穩“坐”、整流罩升級

09-30

金星硫酸云現神秘紫外線吸收峰，新型探測或揭未知氣體之謎

09-30

124光年外K2-18b現神秘氣體信號，生命之謎待解何時迎突破？

09-30

來自太陽系邊緣的C/2025 A6萊蒙彗星將至或成今秋最亮“夜空精靈”

09-30

2025中秋將至：十六圓“超級月亮”來襲，共賞傳承千年的浪漫與溫情

09-30

宇宙微波背景中的神秘冷斑：平行宇宙碰撞假說引發的科學探索

09-30

從0.096%到0.0000081%：人類如何用科技“馴服”2024 YR4小行星？

09-30

海王星風暴“捉迷藏”：30年一循環的黑斑謎題，望遠鏡也難鎖其蹤

09-30

點擊查看更多 +

全站最新

雷軍2025演講啟示：于至暗中堅守，以努力為筆繪就人生新可能

“智駕神器”非神器！杭州醉酒男獲刑引警示，輔助駕駛≠無人駕駛

上汽大眾Pro家族2026款：以智駕智艙革新，重塑燃油車智能體驗新高度

安全混動雙突破，智能體驗再升級，沃爾沃XC70定義豪華新能源新高度

易烊千璽維權獲賠8.2萬

陳麗君告兩黑粉侵權

熱門內容

本欄最新

?迪拜男子錯過試乘“未來”車：揮金表換蘿卜快跑無人車體驗?

PearlError-包含視頻過濾

雷軍兌現承諾！2025年百次健身打卡目標提前三月圓滿達成

雷軍年度演講談玄戒O1項目：小米造芯決心堅定，至少十年投入500億

雷軍第99次健身打卡收官在即，年度演講與小米17系列發布同日將啟

天回航天“巧龍一號”發動機完成超低工況熱試車，展現深度推力調節潛力

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

Claude Sonnet 4.5強勢登場：編程能力再升級，連續30小時自主寫代碼超厲害