在人工智能技術(shù)迅猛發(fā)展的當(dāng)下,大模型訓(xùn)練與推理對計算和內(nèi)存的需求呈現(xiàn)出爆發(fā)式增長。為滿足這一需求,AI集群紛紛借助高性能網(wǎng)絡(luò)進行擴展,MoE架構(gòu)、訓(xùn)推一體化以及xPU規(guī)模擴大等趨勢,也對網(wǎng)絡(luò)提出了全新的要求。在此背景下,阿里云網(wǎng)絡(luò)基礎(chǔ)設(shè)施團隊撰寫了一份白皮書,聚焦超高性能網(wǎng)絡(luò)(UPN512)技術(shù)架構(gòu),旨在為構(gòu)建大規(guī)模、高性能、高可靠、低成本且可擴展的xPU擴展系統(tǒng)提供切實可行的方案。
當(dāng)前,xPU擴展系統(tǒng)在網(wǎng)絡(luò)連接方面面臨著諸多挑戰(zhàn)。多數(shù)系統(tǒng)采用銅互連方式,雖然成本較低且穩(wěn)定性尚可,但傳輸距離有限,在高密度機架設(shè)計時,會帶來復(fù)雜度、可靠性和擴展性等方面的問題。而光互連雖被視為更大規(guī)模擴展網(wǎng)絡(luò)的必然選擇,卻面臨著成本高、可靠性存疑的困境,并且在高帶寬通信場景下,計算開銷較大。這些挑戰(zhàn)嚴(yán)重制約了xPU擴展系統(tǒng)的發(fā)展,成為亟待解決的難題。
阿里云推出的UPN512架構(gòu),繼承了高性能網(wǎng)絡(luò)(HPN)的擴展網(wǎng)絡(luò)設(shè)計原則,以“大規(guī)模、高性能、高可靠、低成本、可擴展”為設(shè)計目標(biāo)。該架構(gòu)采用了高基數(shù)以太網(wǎng)、LPO/NPO光互連以及單層交換設(shè)計等先進技術(shù)。與HPN相比,UPN512在GPU帶寬、互連協(xié)議和互連規(guī)模上存在顯著差異,并且能夠與HPN共同組成高性能系統(tǒng),為xPU擴展提供了更強大的網(wǎng)絡(luò)支持。
在系統(tǒng)設(shè)計方面,UPN512的單層光解耦系統(tǒng)是其一大亮點。與AI機架緊密耦合的銅互連方式相比,單層光解耦系統(tǒng)采用全光互連技術(shù),成功突破了距離限制,能夠支持1K規(guī)模域。同時,其解耦設(shè)計降低了系統(tǒng)復(fù)雜度,提升了可靠性與靈活性,有效解決了銅互連在高密度機架設(shè)計中的諸多問題。在光互連方案上,UPN51512對可插拔光模塊、高密度帶寬光互連方案進行了深入分析,對比了LPO與NPO的適用場景、成本及穩(wěn)定性,指出二者可互補選擇,為不同需求的用戶提供了多樣化的解決方案。
在通信語義方面,UPN512基于ETH + 協(xié)議定義了三種低延遲通信語義,分別適用于不同的數(shù)據(jù)傳輸需求,進一步提升了網(wǎng)絡(luò)通信的效率和靈活性。在網(wǎng)絡(luò)內(nèi)計算方面,UPN512通過在網(wǎng)絡(luò)設(shè)備內(nèi)執(zhí)行計算加速集體通信,優(yōu)化了對稱與非對稱集體通信流程,有效提升了數(shù)據(jù)傳輸效率,降低了計算資源消耗,為xPU擴展系統(tǒng)的高效運行提供了有力保障。
這份白皮書為AI基礎(chǔ)設(shè)施中xPU擴展系統(tǒng)的發(fā)展指明了清晰的技術(shù)架構(gòu)方向,提供了寶貴的實踐參考,對于推動高性能網(wǎng)絡(luò)技術(shù)在AI領(lǐng)域的廣泛應(yīng)用具有重要意義。隨著AI技術(shù)的不斷發(fā)展,相信UPN512架構(gòu)將在更多場景中發(fā)揮重要作用,助力AI產(chǎn)業(yè)邁向新的高度。











