鳳凰網科技訊 12月21日,摩爾線程于12月20日在北京首屆MUSA開發(fā)者大會(MDC2025)上公布了新一代全功能GPU架構“花港”,并展示了其萬卡規(guī)模AI訓練集群及多項技術進展。
此次發(fā)布的核心內容涵蓋架構升級、集群能力與推理性能等方面。新架構“花港”支持從FP4到FP64的全精度計算,算力密度提升50%,能效實現10倍提升。基于該架構,公司計劃推出專注于AI訓練與推理的“華山”芯片,以及面向圖形渲染的“廬山”芯片。
在訓練集群方面,摩爾線程推出“夸娥”萬卡智算集群,稱其具備全精度通用計算能力,訓練算力利用率在稠密模型上達到60%,在混合專家模型上達40%,訓練線性擴展效率為95%。在推理側,公司與硅基流動合作,在DeepSeek R1 671B模型上實現單卡Prefill吞吐量超過4000 tokens/s,Decode吞吐量超過1000 tokens/s。
軟件生態(tài)方面,MUSA 5.0版本對編程模型、計算庫和編譯器進行了優(yōu)化,核心計算庫muDNN的GEMM與FlashAttention效率超過98%,通信效率達97%。公司還計劃逐步開源部分核心組件,包括計算加速庫與系統管理框架。
在圖形領域,新架構集成硬件光線追蹤加速引擎,并支持自研的AI生成式渲染技術。摩爾線程還展示了在具身智能、AI for Science等前沿領域的布局,推出仿真訓練平臺MTLambda以及基于“長江”SoC的AI算力本MTT AIBOOK。
公司公布了面向下一代超大規(guī)模智算中心的MTTC256超節(jié)點架構設計,著眼于高密度硬件與能效優(yōu)化。
此次大會,摩爾線程系統展示了從芯片架構、集群基礎設施到端側設備的全棧技術布局,目標是為國內AI計算生態(tài)的發(fā)展提供硬件與軟件支持。 因此行業(yè)人士普遍認為,摩爾線程正全面對標英偉達,提前發(fā)布架構,以便提升軟件生態(tài)信心。










