在近日舉辦的NVIDIA GTC 2025年10月大會(GTC DC)上,英偉達正式揭曉了其下一代數據中心處理器——NVIDIA BlueField-4 DPU的詳細信息。這款新品不僅在性能上實現重大突破,更通過集成先進技術重新定義了數據中心網絡處理的標準。
據官方披露,BlueField-4 DPU將搭載多達64個Arm架構核心的"Grace"CPU,這一設計延續了英偉達在Grace架構上的技術積累。此前該架構已應用于基于Arm Neoverse V2的處理器及GB10平臺,后者更創新性地整合了兩種不同規格的Arm Cortex核心。此次將64核配置引入DPU領域,標志著英偉達在異構計算架構上的進一步深化。
在核心性能參數方面,新款DPU集成了高達1260億個晶體管,配合NVIDIA ConnectX-9網絡技術,可全面支持800G網絡連接能力。這種高速網絡支持對于處理AI訓練中的海量數據傳輸至關重要,特別是在需要低延遲、高帶寬的分布式計算場景中表現尤為突出。雖然完整規格尚未公布,但業界普遍預期該芯片將采用PCIe Gen6接口標準,這與英偉達Rubin架構產品線的升級路徑保持一致。
英偉達CEO黃仁勛在發布會上特別強調了新一代網卡(NIC)在KV緩存處理方面的突破。他指出,隨著大語言模型(LLM)應用場景的擴展,系統需要高效處理歷史對話恢復等任務,這對KV緩存的實時訪問能力提出了更高要求。雖然Rubin CPX架構已針對預填充階段進行優化,但BlueField-4在緩存處理層面的提升將形成完整的技術閉環。
這款定于2026年初進入早期可用階段的產品,被視為NVIDIA Vera Rubin平臺的重要組成部分。盡管市場上已存在采用64核Arm架構的DPU解決方案,但英偉達憑借其完整的AI生態系統,特別是與GPU集群的深度協同優勢,正在重塑數據中心硬件的市場格局。當前全球大量資本支出持續流向基于英偉達GPU的AI基礎設施,這種生態整合效應預計將進一步鞏固其市場主導地位。
從技術演進路徑看,BlueField-4的推出反映了數據中心硬件發展的兩大趨勢:一是通過芯片級集成實現功能整合,二是針對特定AI工作負載進行專項優化。這種發展模式不僅提升了單個設備的處理效率,更通過軟硬件協同設計推動了整個AI計算架構的革新。
















