摩爾線程在近日舉辦的MUSA開發者大會上,正式推出全新“花港”架構,同時宣布MUSA 5.0全棧軟件完成升級。此次發布會還帶來了兩款基于新架構的芯片——“華山”與“廬山”,分別聚焦AI推理訓練一體化與高性能圖形渲染領域。
作為“花港”架構的首款芯片,“華山”在AI計算領域實現多項突破。其搭載的新一代張量計算引擎支持TF32/FP16/INT8全精度MMA運算,FP6/FP4張量性能顯著提升。通過新增的TCE-PAIR模式,芯片內部數據重用效率得到增強,配合MTFP8/6/4混合低精度計算技術,可兼容MXFP與NVFP兩種計算格式。在硬件設計上,該芯片內置異步編程模型,具備高效線程同步與線程束特化能力,浮點算力、訪存帶寬及高速互聯帶寬均較前代產品實現躍升。
針對超大規模AI計算場景,“華山”芯片展現出強大擴展性。其搭載的新一代Scale-up系統兼容MTLink 4.0協議與多種以太網標準,可適配不同廠商的Scale-up交換機。通過支持SHARP網絡加速技術,芯片間互聯速率達到1314 GB/s,理論上可支撐超十萬卡規模的AI工廠集群部署。這一特性使其在訓練大模型等需要海量算力的場景中具備顯著優勢。
另一款新品“廬山”則專注于圖形渲染領域。基于“花港”架構的新一代指令集,該芯片算力密度提升50%,能效比達到前代產品的10倍。在渲染技術方面,其內置的第一代AI生成式渲染架構(AGR)與第二代光追硬件加速引擎形成協同效應,可完美支持DirectX 12 Ultimate標準。實測數據顯示,其光線追蹤性能較春曉架構提升50倍,支持硬件加速的全場景光線遍歷求交運算。
在渲染管線優化方面,“廬山”芯片創新性地整合了AI計算加速引擎。該引擎可與幾何著色器、像素著色器及光追材質著色器實現數據互通,配合UNITE渲染架構的智能任務分配機制,有效平衡各渲染單元的負載。這種設計使得芯片在處理復雜光影效果與高精度模型時,既能保持高幀率輸出,又能維持較低功耗水平。
據發布會透露,搭載這兩款芯片的硬件產品計劃于明年正式推出。摩爾線程表示將持續優化“花港”架構生態,在軟件棧層面完善開發工具鏈,為AI與圖形渲染領域提供更高效的解決方案。









