在近日舉辦的一場全球科技盛會上,亞馬遜宣布推出其第二代自研大模型家族Nova2,包含四款全新產品:面向輕量級應用的多模態模型Lite、專注復雜推理的代理模型Pro、語音交互模型Sonic,以及支持75萬字上下文處理的Omni。這一系列模型以“行業領先性價比”為核心賣點,其中Lite模型的定價尤為引人注目——每百萬token輸入僅需0.045美元,輸出0.09美元,成本約為同類競品的50%。AWS首席執行官Matt Garman強調,Nova2的優化重點在于“成本效率而非參數規模”,通過多模態能力、代碼生成和代理任務優化,為用戶提供更具競爭力的解決方案。
與模型發布同步推出的“Nova Forge”服務成為開發者關注的焦點。這項年費10萬美元的服務允許客戶深度參與模型訓練過程,從預訓練、中期優化到后期微調的任一階段注入私有數據,構建專屬定制化模型。Garman比喻稱,這一模式類似于“從零開始學習語言”,而非直接對成品模型進行表面調整,從而避免因過早微調導致的推理能力衰減。據披露,亞馬遜內部電商團隊和Alexa語音助手已率先應用Forge構建業務模型,外部客戶Reddit則利用該服務訓練內容審核系統,官方稱其性能在內部評測中超越市面主流商用模型。若需亞馬遜工程師全程技術支持,客戶需額外支付咨詢費用。
技術層面,Nova2系列展現了亞馬遜在模型架構上的創新。例如,Omni模型通過擴展上下文窗口至75萬字,顯著提升了長文本處理能力;Sonic模型則強化了語音交互的自然度與實時響應速度。Matt Garman透露,AWS團隊在訓練過程中采用了動態數據分配技術,根據任務復雜度自動調整計算資源,進一步壓縮了成本。亞馬遜通用人工智能首席科學家Rohit Prasad表示,Forge服務的推出將企業自建模型的成本從“數億至數十億美元”級壓縮至百萬美元量級,“以1%的預算實現90%的性能”,這一模式有望重塑行業生態。
商業合作方面,亞馬遜宣布與谷歌云達成互聯協議,允許客戶跨平臺調用Gemini等競爭對手的模型。這一舉措被解讀為亞馬遜構建開放生態的重要一步,用戶可根據需求靈活組合不同廠商的模型服務。據AWS披露,Forge服務預計于2026年一季度在北美和歐洲部分地區開啟預覽,首批開放領域將聚焦金融、醫療和電商等數據敏感型行業。業內分析認為,亞馬遜通過“低價模型+定制化服務”的組合策略,正試圖在生成式AI市場占據更有利的位置,尤其是針對企業級客戶的長尾需求。













