在近期舉辦的NVIDIA GTC 2025年秋季大會(huì)上,英偉達(dá)公司正式推出下一代數(shù)據(jù)中心處理器——BlueField-4 DPU。這款基于Rubin架構(gòu)的芯片計(jì)劃于2026年初進(jìn)入早期商用階段,作為Vera Rubin平臺(tái)的核心組件,其技術(shù)規(guī)格引發(fā)行業(yè)高度關(guān)注。據(jù)官方披露,該處理器將集成多達(dá)64個(gè)Arm架構(gòu)核心,并首次搭載"Grace"CPU設(shè)計(jì),這一架構(gòu)此前已應(yīng)用于基于Arm Neoverse V2的處理器及GB10平臺(tái)。
技術(shù)參數(shù)方面,BlueField-4 DPU采用1260億晶體管封裝工藝,支持800G高速網(wǎng)絡(luò)連接,并配備NVIDIA ConnectX-9網(wǎng)絡(luò)技術(shù)。雖然完整規(guī)格尚未公布,但業(yè)界普遍預(yù)測其將采用PCIe Gen6接口標(biāo)準(zhǔn),以滿足未來數(shù)據(jù)中心對(duì)帶寬的嚴(yán)苛需求。該處理器通過集成計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)功能,旨在構(gòu)建更高效的數(shù)據(jù)處理管道,特別針對(duì)AI訓(xùn)練場景中的KV緩存優(yōu)化設(shè)計(jì)。
英偉達(dá)首席執(zhí)行官黃仁勛在主題演講中強(qiáng)調(diào),新一代網(wǎng)絡(luò)加速卡的核心突破在于提升系統(tǒng)級(jí)KV緩存處理能力。相較于Rubin CPX側(cè)重預(yù)填充階段的性能優(yōu)化,BlueField-4更注重實(shí)時(shí)交互場景的響應(yīng)效率,例如大語言模型(LLM)對(duì)話恢復(fù)等需要快速檢索歷史數(shù)據(jù)的用例。這種設(shè)計(jì)差異體現(xiàn)了英偉達(dá)對(duì)AI工作負(fù)載細(xì)分的深度理解。
盡管市場上已存在采用64核Arm架構(gòu)的DPU產(chǎn)品,但英偉達(dá)的入局仍被視為重要行業(yè)變量。當(dāng)前全球AI基礎(chǔ)設(shè)施投資持續(xù)向GPU集群傾斜,BlueField-4通過與英偉達(dá)生態(tài)系統(tǒng)的深度整合,有望進(jìn)一步鞏固其在數(shù)據(jù)中心市場的技術(shù)主導(dǎo)權(quán)。該處理器通過硬件級(jí)優(yōu)化減少數(shù)據(jù)搬運(yùn)延遲,理論上可將AI推理效率提升30%以上,這對(duì)動(dòng)輒投入數(shù)十億美元的AI訓(xùn)練項(xiàng)目具有顯著經(jīng)濟(jì)價(jià)值。
從架構(gòu)演進(jìn)看,BlueField-4延續(xù)了英偉達(dá)"超級(jí)芯片"戰(zhàn)略,即通過單芯片集成更多功能模塊來降低系統(tǒng)復(fù)雜度。這種設(shè)計(jì)不僅減少了數(shù)據(jù)中心機(jī)架空間占用,還能降低功耗達(dá)40%。隨著2026年商用日期的臨近,供應(yīng)鏈消息顯示多家超大規(guī)模云服務(wù)商已啟動(dòng)測試驗(yàn)證,這預(yù)示著下一代AI基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)之爭將進(jìn)入白熱化階段。











