華為近日發(fā)布了一款面向互聯(lián)網(wǎng)、運營商及金融行業(yè)大模型訓(xùn)練場景的AI智算產(chǎn)品——Atlas 800T A3超節(jié)點。該產(chǎn)品憑借高性能、高可靠性和易部署的特點,為數(shù)據(jù)中心基礎(chǔ)設(shè)施提供了強大的硬件支撐,尤其適用于通用風(fēng)冷機房環(huán)境。
Atlas 800T A3超節(jié)點由超節(jié)點服務(wù)器和靈衢總線設(shè)備兩大核心模塊組成。超節(jié)點服務(wù)器采用10U機框設(shè)計,支持標(biāo)準(zhǔn)19英寸機柜安裝,通過正交盲插架構(gòu)集成CPU抽屜、NPU抽屜、靈衢總線板和IO框等關(guān)鍵部件,不僅集成密度高,而且便于維護。在核心配置方面,該服務(wù)器搭載了4個鯤鵬920處理器和8個昇騰910 AI模組,整機峰值算力可達(dá)6.016PFLOPS@FP16或12.032POPS@INT8,超節(jié)點內(nèi)任意兩個NPU模組間的雙向互聯(lián)帶寬高達(dá)784GB/s,充分滿足大規(guī)模AI訓(xùn)練的算力需求。
為確保設(shè)備穩(wěn)定運行,Atlas 800T A3在供電與散熱系統(tǒng)上進(jìn)行了優(yōu)化。供電方面,支持220VAC或336HVDC/240HVDC雙輸入,最大輸入功耗為16.2kW,電源轉(zhuǎn)換效率最高可達(dá)96%,并具備5+1備份及多重保護功能。散熱系統(tǒng)則采用風(fēng)冷結(jié)合華為自研LAAC液冷模組的方案,每個抽屜配備5個風(fēng)扇模組,支持4+1熱插拔更換,確保設(shè)備在不同負(fù)載下的熱性能穩(wěn)定。
靈衢總線設(shè)備以LingQu 630 V1為核心,提供高性能、高帶寬、低延遲的網(wǎng)絡(luò)連接,支持多種供電模式及1+1電源備份,散熱風(fēng)道可靈活切換。通過靈衢網(wǎng)絡(luò)自研總線交換協(xié)議,該設(shè)備實現(xiàn)超節(jié)點內(nèi)部7個平面組網(wǎng),支持64、96、192、384等多種規(guī)模組網(wǎng)配置。其中,384超節(jié)點方案可通過56臺靈衢總線設(shè)備與48臺超節(jié)點服務(wù)器全互聯(lián)實現(xiàn)。
在硬件細(xì)節(jié)上,超節(jié)點服務(wù)器前后板配備了豐富的接口,包括靈衢總線接口、參數(shù)面接口、USB、VGA和管理網(wǎng)口等,滿足各類連接需求。IO框支持10個2.5英寸硬盤及最多5個PCIe 5.0擴展插槽,內(nèi)存最大支持4096GB,并具備多種內(nèi)存保護技術(shù)。系統(tǒng)管理方面,集成iBMC智能管理系統(tǒng),兼容IPMI2.0規(guī)范,支持遠(yuǎn)程控制、故障檢測和告警上報等功能,同時可通過Redfish接口被第三方網(wǎng)管集成。
Atlas 800T A3超節(jié)點的物理尺寸為442mm×447mm×920mm,滿配凈重229kg,工作溫度范圍為5℃~35℃,符合ASHRAE Class A2標(biāo)準(zhǔn),能夠適配各類數(shù)據(jù)中心環(huán)境,為大模型訓(xùn)練等AI密集型業(yè)務(wù)提供高效、可靠的硬件基礎(chǔ)。











