在近期舉辦的2025 OCP全球峰會上,英特爾推出了一項突破性的技術方案——將自身研發(fā)的Gaudi3 AI加速器與英偉達B200 Tensor Core GPU整合到同一計算框架中,構建出一種跨廠商的異構AI系統。這一設計打破了傳統硬件方案中依賴單一供應商的局限,為AI計算領域提供了新的思路。
據技術方案披露,該系統通過分工協作優(yōu)化了計算效率:英偉達B200 GPU負責AI模型的預填充任務,而計算密集型的解碼環(huán)節(jié)則由英特爾Gaudi3加速器承擔。這種分工方式充分利用了不同硬件的核心優(yōu)勢,實現了計算資源的精準匹配。
在Llama開源大模型的性能測試中,該異構系統展現出顯著優(yōu)勢。與純英偉達B200組成的同構系統相比,在總體擁有成本(TCO)相同的情況下,新方案實現了最高70%的性能提升。這意味著用戶可以用相同的投入獲得近一倍的算力輸出,大幅提升了計算資源的利用率。
外媒SemiAnalysis進一步披露了該系統的硬件構成細節(jié)。除了核心的計算芯片外,系統還集成了英偉達的ConnectX-7 400GbE高速網卡、BlueField-3 DPU數據處理單元,以及博通研發(fā)的Tomahawk5 51.2Tb/s交換芯片。這些高端網絡組件的加入,為系統提供了強大的數據傳輸能力。
通過這些網絡組件的協同工作,系統構建了一個高擴展性的計算環(huán)境。在多芯片并行運算的場景下,數據傳輸效率得到顯著提升,確保了不同硬件之間的無縫協作。這種設計不僅優(yōu)化了系統性能,也為未來更大規(guī)模的AI計算需求預留了擴展空間。
更多關于AI技術的最新資訊,可訪問專業(yè)網站:http://www.aipress.com.cn/













