在科創(chuàng)板掛牌的國產(chǎn)GPU企業(yè)摩爾線程,近日舉辦了首屆MUSA開發(fā)者大會,正式發(fā)布新一代GPU架構(gòu)"花港"及三款全新芯片產(chǎn)品。此次技術(shù)迭代延續(xù)了該公司自2022年以來每年更新架構(gòu)的節(jié)奏,新架構(gòu)在算力密度、精度支持及集群擴(kuò)展能力方面實(shí)現(xiàn)突破性提升。
新架構(gòu)"花港"的算力密度較前代提升50%,支持從FP4到FP64的全精度計(jì)算范圍,特別在低精度計(jì)算領(lǐng)域取得進(jìn)展。該架構(gòu)可支持超過十萬張GPU卡的智算集群擴(kuò)展,并內(nèi)置AI生成式渲染模塊,為大規(guī)模AI訓(xùn)練提供硬件支撐。基于該架構(gòu)推出的三款芯片各具特色:華山芯片定位AI訓(xùn)推一體場景,廬山芯片專注圖形渲染性能,長江芯片則作為系統(tǒng)級芯片(SoC)整合多元功能。
在計(jì)算精度優(yōu)化方面,摩爾線程持續(xù)拓展技術(shù)邊界。其AI智算板卡從上一代S5000支持的FP8精度,進(jìn)一步延伸至新一代華山芯片的FP4精度支持。這種技術(shù)路徑與全球GPU龍頭英偉達(dá)不謀而合,后者最新主力芯片Blackwell同樣具備FP4計(jì)算能力。精度擴(kuò)展策略有效提升了計(jì)算效率,在混合精度計(jì)算成為行業(yè)趨勢的背景下,展現(xiàn)出顯著的技術(shù)前瞻性。
性能對比數(shù)據(jù)顯示,摩爾線程產(chǎn)品矩陣持續(xù)完善。2023年推出的S4000板卡在FP32精度下達(dá)到25 TFLOPS算力,TF32精度下為49 TFLOPS,F(xiàn)P16精度下翻倍至98 TFLOPS,INT8精度下更達(dá)196 TOPS,但最大功耗450W的指標(biāo)高于同期英偉達(dá)A100的300W。最新披露的測試數(shù)據(jù)顯示,在DeepSeek-R1模型推理場景中,S5000板卡在特定吞吐量指標(biāo)上達(dá)到H20等競品的2.5倍和1.3倍。新一代華山芯片的浮點(diǎn)計(jì)算能力介于英偉達(dá)Blackwell與Hopper架構(gòu)之間,訪存帶寬接近Blackwell水平,高速互聯(lián)帶寬則處于兩大架構(gòu)中間值。
集群規(guī)模擴(kuò)張成為另一技術(shù)突破點(diǎn)。摩爾線程宣布建成萬卡級智算集群,較2024年推出的千卡集群實(shí)現(xiàn)數(shù)量級躍升。公司規(guī)劃未來將擴(kuò)展至十萬卡、五十萬卡甚至百萬卡規(guī)模,但工程實(shí)現(xiàn)面臨多重挑戰(zhàn)。創(chuàng)始人張建中指出,超大集群需要解決供電散熱、網(wǎng)絡(luò)組網(wǎng)、有效算力、訓(xùn)練穩(wěn)定性及模型精度評估等復(fù)雜問題,特別是要實(shí)現(xiàn)高效并行訓(xùn)練、低精度計(jì)算優(yōu)化及高性能通信等關(guān)鍵技術(shù)突破。
在生態(tài)建設(shè)方面,摩爾線程同步推出具身智能仿真訓(xùn)練平臺和MTT AIBOOK算力筆記本,構(gòu)建從硬件到應(yīng)用的全棧解決方案。資本市場表現(xiàn)方面,該公司上市后股價(jià)經(jīng)歷劇烈波動,發(fā)行價(jià)114.28元/股的股價(jià)在12月11日突破900元關(guān)口,隨后回落至12月19日的664.1元。財(cái)務(wù)數(shù)據(jù)顯示,公司尚未實(shí)現(xiàn)盈利,截至6月底累計(jì)未彌補(bǔ)虧損達(dá)16億元,預(yù)計(jì)2027年有望達(dá)成合并報(bào)表盈利目標(biāo),但該預(yù)測存在不確定性因素。











