第22屆中國計算機大會(CNCC2025)在哈爾濱拉開帷幕,這場以“數智賦能,無限可能”為主題的科技盛會,吸引了全球計算機領域的目光。華為數據通信產品線研究部部長鄭曉龍在會上發表了題為《大模型推理加速與演進:網絡如何破局?》的演講,首次提出“網絡+”破局模型,為十萬卡智算集群的通信瓶頸問題提供了創新性解決方案。
鄭曉龍指出,隨著單卡算力提升速度逐漸放緩,通過跨層協同網絡、計算與存儲資源,成為突破集群效率瓶頸的關鍵路徑。他強調,唯有系統性優化才能推動智算集群邁向全新量級。為此,華為推出的“網絡+”破局模型,從架構設計、協議優化到調度策略,構建了下一代智算基礎設施的完整技術框架。
針對大模型架構向稀疏化大EP部署演進帶來的通信挑戰,華為研發了網絡級負載均衡技術。隨著DeepSeek等模型推動大EP部署成為主流,通信模式呈現高度動態化特征,隨機性與非對稱性顯著增強。該技術通過智能分配流量,將通信性能提升超20%,同時大幅降低P99延遲完成時間,有效應對了新型部署模式下的通信壓力。
隨著大模型應用從Chat LLM向Agentic AI轉型,系統對token生成速度的要求從50ms壓縮至10ms以內。當前部署實踐中,推理階段以小消息通信為主導致控制面時延占比過高,而單純卸載控制面又會消耗計算資源。華為推出的CloudMatrix384超節點及配套超節點網絡,通過“超節點”架構設計,為滿足極致的TPOT(每token處理時間)需求提供了技術支撐。
面對多模態LMM(大語言多模態模型)引發的流量混戰,華為創新性地提出網絡調度優化方案。鄭曉龍形象地比喻:“網絡+不是簡單的帶寬疊加,而是讓網絡成為AI集群的‘第七代算力’。”該方案通過精準調度,在復雜流量環境中實現推理性能顯著提升,展現了網絡優化在智算系統中的核心價值。
演講最后,鄭曉龍呼吁產業界共同參與標準建設。他表示,華為愿與合作伙伴、行業組織攜手,共同定義大模型時代下一代智算網絡接口標準,推動技術創新與生態協同發展。這一倡議得到了與會專家的廣泛響應,為構建開放共贏的智算生態奠定了基礎。











