在科技行業的激烈競爭中,亞馬遜云科技始終處于聚光燈下。近期,面對外界對其在生成式AI浪潮中創新步伐的質疑,亞馬遜云科技在2025年re:Invent全球大會上以一系列重磅發布,有力回應了這些聲音,再次彰顯其在云計算領域的領導地位。
從業務規模與穩定性來看,亞馬遜云科技交出了一份令人矚目的成績單。其年度經常性收入(ARR)高達1320億美元,占據全球37.5%的市場份額,成為全球數字經濟當之無愧的“公共底座”。每天處理超過2億次請求,存儲對象量突破500萬億個,這些數據背后,是其在云計算基礎設施領域的深厚積累。對于尋求將關鍵業務AI化的企業而言,亞馬遜云科技提供的基礎設施具備“基礎設施級”的可靠與安全。在Agent時代,AI應用將從實驗走向7x24小時不間斷的核心生產流程,歷經超大規模考驗的穩定性,成為企業業務的關鍵支撐。全球超過10萬家企業選擇亞馬遜云科技的AI平臺Amazon Bedrock,這一數據正是傳統云時代信任向AI時代自然延伸的有力證明。
亞馬遜云科技對客戶復雜需求的深刻理解與尊重,體現在其開放的生態構建上。在Amazon Bedrock平臺上,集成了來自17家廠商的數十款模型,涵蓋了從亞馬遜Nova、谷歌Gemini、OpenAI GPT到中國DeepSeek、阿里千問、Kimi等。這一舉措打破了客戶在自研模型與外界明星模型間的單選題困境,賦予客戶自由組合、靈活演進的權利。平臺的核心價值在于確保客戶成功,而非推銷特定產品,這種領導者胸襟為企業在AI時代的多元化發展提供了廣闊空間。
在核心戰略方向上,亞馬遜云科技將目光聚焦于All for Agentic AI。首席執行官Matt Garman在演講中反復強調“Agent”,明確將其定位為下一代應用的基本單元。他指出,AI Agent正引領AI發展走向關鍵拐點,未來每家公司、每個領域都將運行數十億個Agent。為應對這一趨勢,亞馬遜云科技將企業落地AI的挑戰系統解構為四大支柱:AI基礎設施、模型生態、數據基座與開發者工具,構建起支撐Agent發展的完整價值實現框架。
在Agentic AI戰場,亞馬遜云科技憑借先見之明,率先構筑起系統競爭力。早在Agent概念尚未普及之時,便開始布局支撐其落地的四大支柱。其定義的Agent,并非簡單的聊天機器人式輔助,而是具備自主規劃、調用工具、跨會話記憶能力的下一代應用基本單元。這意味著云計算的經典三層架構將被“Agent + Token”取代,所有底層資源最終服務于Agent的7×24小時運轉。
為支撐Agent的運行,亞馬遜云科技構建了一套層級分明的能力棧。在底層,打造了承載Agent運行的AI基礎設施和模型生態;在中間層,全新升級的Amazon Bedrock AgentCore成為關鍵“構建工具”。這個被下載超過200萬次的SDK,致力于解決企業構建可信Agent的核心痛點,通過自然語言策略(AgentCore Policy)設置安全護欄,利用13個維度的自動化評估(AgentCore evaluations)持續監控表現,還創新性地賦予Agent“情景記憶”(Episodic Memory),使其能跨會話記憶上下文,像人類一樣持續學習,有效消除了企業“不敢讓AI自主行動”的顧慮,將Agent從實驗室玩具轉變為可托付關鍵任務的生產力。
面向垂直場景,亞馬遜云科技推出的Frontier Agents更是亮點十足。這些經過內部大規模驗證的數字員工,能夠直接重塑軟件生命周期。例如,Kiro autonomous agent能夠理解宏觀目標,自主規劃、編碼、測試。在一個原需30人18個月完成的重構項目中,Kiro輔助下僅需6人76天即可完成,其標志性的“小幽靈”Logo,寓意著產品從冰冷資源立方體向有溫度、懂協作伙伴的演進。Amazon Security Agent將安全前置到設計與開發階段,自動審查代碼漏洞,把昂貴的滲透測試變為按需服務,多媒體巨頭Adobe利用它確保全球營銷活動符合版權與品牌規范。Amazon DevOps Agent作為虛擬運維專家,能關聯復雜系統日志與數據,快速定位根因,推動系統自愈,實現運維的“系統自治”。這些Agent的發布,深刻體現了亞馬遜云科技對Agent價值的理解:釋放生產力在于讓AI接管完整、跨工具、跨流程的復雜工作流。
算力是驅動Agent帝國的核心引擎。當數以十億計的Agent7x24小時不間斷推理、規劃、執行,Token消耗將呈天文數字,成本成為Agent規模化落地的首要障礙。為此,亞馬遜云科技推出自研芯片Trainium3,開啟“成本革命”。Trainium3基于3nm先進制程,每兆瓦電力產生的Token數量是上一代的5倍,訓練成本可降低最多50%。這意味著運行同樣Agent工作負載,企業算力賬單可能減半甚至更低,對Agent大規模部署至關重要。
Trainium3的價值不僅體現在單顆芯片性能上,更在于系統級工程。它集成到Amazon Trainium3 UltraServer服務器中,單臺服務器最多集成144顆芯片,總算力高達362 PFlops。通過定制的NeuronSwitch高速互聯技術,芯片間延遲壓至10微秒以下,構建出堪比“超級計算機”的緊密算力單元,專門優化Agent應用所需的長上下文、多模態推理及復雜工作流調度。這場成本革命對亞馬遜云科技具有雙重戰略意義:對內鞏固全棧AI競爭壁壘,自研芯片與自研模型深度協同,實現從硅到模型的端到端效率優化;對外提供極致性價比,讓客戶享受更低成本算力,同時與英偉達GPU共存策略兼顧尖端客戶需求與成本底線。
生成式AI的發展對云基礎設施提出了全新挑戰,集中在成本與效率、彈性邊界、延遲敏感度、安全與隱私四個層面。訓練大模型需巨額數據中心投資,運行推理成本驚人,迫使云提供商在架構設計各環節創新。推理工作負載呈現與傳統計算不同的行為模式,AI應用對延遲要求更高,實時交互、視頻生成等場景需毫秒級響應,同時模型規模擴大和復雜度提升使保持低延遲處理海量請求成為難題。當AI處理企業核心數據和個人隱私信息時,安全需貫穿數據生命周期每個環節,在共享云環境中確保模型權重和客戶數據絕對安全成為新技術門檻。
亞馬遜云科技圍繞底層硬件創新給出應對方案。自研芯片從Amazon Nitro System消除虛擬化性能抖動,演進至為核心工作負載量身定制的Graviton處理器。新發布的Amazon Graviton5處理器將L2緩存翻倍,性能提升30%,基于其的M9G實例使Airbnb性能提升25%、SAP事務處理速度提升60%,蘋果等企業實測Swift應用遷移后性能升40%、成本降30%。面對AI推理負載,設計Mantle推理引擎,承認請求異質性,通過Bedrock服務層允許客戶按不同緊迫性分配請求,實現資源智能調度。通過Journal持久化事務日志,使長時間推理任務故障或中斷后能從精確斷點恢復,結合動態調度策略讓模型微調等后臺任務與實時流量波谷錯峰運行,提升集群整體利用率與經濟效益。為釋放硬件潛力,同步升級Neuron開發者套件,NIKKI語言讓開發者進行底層內核優化,Neuron Explorer提供可視化性能分析與自動化調優建議。
在re:Invent 2025大會上,亞馬遜云科技完成了一場從回應質疑到定義未來的精彩展示。它將目光投向由數十億Agent驅動的未來,一系列AI云基礎設施新技術發布,證明持續全棧創新的云不僅是承載計算的基石,更是催化AI時代創新無限可能的引擎,手中的“權杖”在科技舞臺上閃耀著獨特光芒。











