12月20日消息,摩爾線程華山GPU芯片正式發布,首發采用“花港”新架構。
定位AI訓推一體、超智融合,同時配套發布超十萬卡級AI工廠技術與新一代高性能張量計算系統。
華山以“花港”架構為基礎,聚焦AI訓練與推理場景的一體化能力,在系統級支撐技術方面,配備超十萬卡級AI工廠技術。
新一代Scale-up系統:搭載MTLink 4.0+多種類以太協議,片間互聯速度達134.5Gb/s,支持擴展至1024 GPUs規模,適配多種Scale-up,支持SHARP技術;
RAS 2.0:新增SRAM奇偶校驗及ECC能力,強化錯誤檢測、上報與隔離功能,同時全面提升debuggability能力;
ACE2.0新一代異步通信引擎:通過架構優化實現更高效的通信調度,支撐大規模集群的協同運算。
采用新一代高性能張量計算系統,全精度MMA:支持TF32/FP16等;實現端到端加速的混合低精度計算,適配大語言模型等AI場景需求。
性能指標方面,“華山”GPU在浮點算力、訪存帶寬、訪存容量、高速互聯帶寬等性能上大幅超過英偉達hopper,部分性能媲美甚至超越英偉達Blackwell架構產品,進一步強化了在AI大模型訓推場景的技術競爭力。









