在開放計算項目峰會上,英偉達宣布其專為人工智能設計的網絡平臺Spectrum-X獲得兩大科技巨頭的青睞——meta平臺公司與甲骨文公司正式采用該方案,將其作為構建新一代AI基礎設施的核心組件。這一動向標志著數據中心正從傳統計算架構向"AI工廠"模式加速轉型,網絡性能成為決定AI系統效率的關鍵因素。
Spectrum-X的獨特性在于其從底層架構開始就針對AI工作負載進行優化。與傳統以太網方案不同,該平臺通過整合Spectrum4交換機(51.2Tbps吞吐量)、BlueField-3超級網卡及DPU處理單元,構建出能同時處理數百萬GPU通信的專用網絡堆棧。英偉達宣稱,這種設計使AI通信性能較傳統方案提升1.6倍,直接轉化為GPU利用率提高和訓練成本降低。
meta的部署策略凸顯了開放網絡與AI加速的融合創新。該公司將Spectrum-X集成至Facebook開放交換系統(FBOSS)和Minipack3N交換機中,形成覆蓋萬億參數模型訓練的加速骨干網。meta網絡工程副總裁Gaya Nagarajan指出:"新一代AI基礎設施需要前所未有的網絡規模與效率。"通過這種整合,meta在保持分解網絡模型靈活性的同時,實現了可預測的無擁塞性能。
甲骨文則展現出規模化部署的雄心。其云基礎設施部門采用Spectrum-X構建的AI工廠,將依托英偉達Vera Rubin架構實現跨地域的GPU集群互聯。執行副總裁Mahesh Thiagarajan強調:"該方案使我們能夠以突破性效率連接數百萬GPU。"更值得關注的是,Spectrum-X的跨規模擴展能力(SpectrumXGS)支持將多個數據中心甚至跨國集群整合為單一邏輯系統,為構建全球分布式AI工廠奠定基礎。
技術細節揭示了該平臺獲得行業認可的核心原因。其硬件堆棧通過DPU卸載網絡服務,使GPU專注計算;端到端遙測系統與自適應路由機制可動態規避"象流"瓶頸;400Gbps RDMA技術實現GPU間超高速通信;軟件層面與英偉達DOCA、Cumulus Linux等工具深度集成,形成覆蓋開發、部署、運維的全棧解決方案。這種設計使AI系統在提升性能的同時,降低了總擁有成本。
行業觀察家指出,網絡正演變為AI時代的"操作系統"。隨著模型參數突破萬億級別,數據移動效率已成為制約AI發展的關鍵因素。英偉達CEO黃仁勛的論斷引發共鳴:"數據中心正在轉變為千兆級AI工廠,而網絡就是其神經系統。"這種轉變要求網絡具備跨云、邊、端的資源編排能力,成為連接計算、存儲與數據的智能中樞。
meta與甲骨文的部署案例印證了架構演進的新趨勢。前者證明開放網絡體系可與AI加速技術無縫融合,后者則展示超大規模廠商如何通過網絡創新挑戰既有競爭格局。當推理需求推動AI部署向邊緣延伸時,自適應、可編程的網絡結構成為保障混合AI系統可靠運行的關鍵基礎設施。
市場分析認為,兩大科技巨頭的選擇標志著AI基礎設施進入工業化階段。英偉達通過重構以太網標準,創造出能感知GPU狀態、消除擁塞的智能數據結構,這種"AI以太網"正在重新定義大規模計算的邊界。對于超大規模運營商而言,網絡性能已成為決定AI競爭力的戰略要素,而英偉達顯然已占據新一代計算堆棧的核心位置。











