亞馬遜在 re:Invent2025推出第二代自研大模型家族 Nova2,含四款新品:輕量級多模態模型 Lite、復雜推理代理 Pro、語音對話 Sonic 與75萬字上下文 Omni;公司同時宣布與谷歌云達成互聯協議,方便客戶跨平臺調用 Gemini 等競對模型。
Nova2系列主打“行業領先性價比”,官方定價顯示,Lite 每百萬 token 輸入0.045美元、輸出0.09美元,約為同類模型50% 水平。AWS 首席執行官 Matt Garman 表示,新增多模態、代碼生成與代理任務優化,目標在“成本而非參數”上取勝。
真正引發開發者關注的是同步發布的“Nova Forge”服務:年費10萬美元,客戶即可介入預訓練、中期訓練或后期訓練階段,注入私有數據構建專屬前沿模型。Garman 解釋,過早微調易削弱模型推理能力,“Forge 讓客戶像學語言一樣‘從小’開始定制”。
AWS 披露,內部電商與 Alexa 團隊已用 Forge 構建業務大模型;外部客戶 Reddit 則通過該服務訓練內容審核模型,官方稱其在內部評測中優于市面可商用大模型。若需亞馬遜工程師全程協助,需額外支付咨詢費用。
亞馬遜通用人工智能首席科學家 Rohit Prasad 稱,Forge 可將企業自建模型成本從“數億至數十億美元”降至百萬美元量級,“相當于用1% 預算獲得90% 性能”。該服務預計2026年一季度在北美、歐洲部分區域開放預覽。








