在拉斯維加斯舉辦的 AWS re:Invent 2025 年度技術大會上,云計算領域迎來重要進展——亞馬遜云科技(AWS)正式發布其自主研發的第三代 AI 訓練芯片 Trainium3,并同步推出基于該芯片打造的 Trainium3 UltraServer 系統。與此同時,AWS 還首次披露了下一代芯片 Trainium4 的研發計劃,引發行業廣泛關注。
據 AWS 介紹,Trainium3 采用尖端的 3 納米制程工藝,在 AI 模型訓練和推理性能方面實現顯著突破。相較于第二代產品,新系統在訓練和高負載推理場景下的速度提升超過 4 倍,內存容量也增至 4 倍。每臺 UltraServer 最多可容納 144 顆 Trainium3 芯片,數千臺設備可相互連接,構建出搭載最多 100 萬顆芯片的超大規模集群,規模達到上一代系統的 10 倍。這一架構設計為大規模 AI 計算任務提供了強大的硬件支持。
在能效方面,AWS 強調新一代芯片和系統較前代提升了 40%。在全球數據中心耗電量持續攀升的背景下,這一改進不僅符合 AWS 降低運營成本的商業需求,也為使用其 AI 云服務的客戶節省了開支。亞馬遜表示,包括 Anthropic(亞馬遜為其投資者)、日本大語言模型公司 Karakuri、SplashMusic 以及 Decart 在內的多家客戶已率先采用第三代 Trainium 芯片及系統,并顯著降低了推理成本。
關于下一代產品 Trainium4,AWS 透露其正在研發中,并承諾將帶來又一次性能飛躍。值得關注的是,Trainium4 將支持英偉達的 NVLink Fusion 高速芯片互連技術,這意味著基于該芯片的系統不僅能與英偉達 GPU 協同運行、擴展整體性能,還能繼續利用亞馬遜自研的低成本服務器機架技術。這一技術兼容性設計為 AI 應用的遷移和擴展提供了更多可能性。
當前,英偉達的 CUDA 架構已成為主流 AI 應用的事實標準平臺。通過支持 NVLink Fusion,Trainium4 有望降低遷移門檻,吸引更多原本為英偉達 GPU 優化的大型 AI 應用轉向亞馬遜云平臺。這一戰略布局不僅展現了 AWS 在硬件領域的創新能力,也體現了其在 AI 云服務市場競爭中的差異化策略。












