在2025 OCP全球峰會上,英特爾推出了一款創新的異構AI計算系統,該系統通過整合英特爾Gaudi3 AI加速器與英偉達B200 Tensor Core GPU,構建了混合計算架構。這一設計突破了傳統同構計算模式的局限,為AI模型推理提供了更高效的解決方案。
系統采用分工協作模式:英偉達B200 GPU負責AI模型的預填充階段,利用其強大的并行計算能力快速處理輸入數據;而英特爾Gaudi3加速器則專注解碼階段,通過優化張量運算降低延遲。在Llama開源模型測試中,這種異構組合相較于純B200方案,在總擁有成本(TCO)相同的情況下實現了最高70%的性能提升。
據技術分析機構SemiAnalysis披露,該系統的擴展能力得益于高端網絡組件的集成。英偉達ConnectX-7 400GbE網卡與BlueField-3 DPU構成智能網絡層,配合博通Tomahawk 5交換芯片提供的51.2Tb/s帶寬,使系統能夠支持更大規模的分布式計算集群。這種架構設計顯著提升了數據吞吐能力,為訓練超大規模AI模型提供了硬件基礎。
此次技術展示標志著異構計算在AI領域的應用邁入新階段。通過整合不同廠商的硬件優勢,系統在保持成本可控的同時,實現了性能的指數級增長。這種跨平臺協作模式或將成為未來數據中心架構的重要發展方向。





