安謀科技Arm China近日宣布推出新一代NPU IP“周易”X3,標志著其“All in AI”產(chǎn)品戰(zhàn)略正式落地。這款專為大模型設(shè)計的AI芯片,基于全新DSP+DSA架構(gòu),在性能、能效和軟件生態(tài)方面實現(xiàn)突破,旨在為基礎(chǔ)設(shè)施、智能汽車、移動終端和智能物聯(lián)網(wǎng)等領(lǐng)域提供端側(cè)AI計算新標桿。
“周易”X3的硬件架構(gòu)經(jīng)過全面升級,單Cluster最高支持4個核心,算力范圍覆蓋8至80 FP8 TFLOPS,且可根據(jù)需求靈活配置。其單核帶寬高達256GB/s,相比前代產(chǎn)品“周易”X2,CNN模型性能提升30%至50%,多核算力線性度達到70%至80%。在同算力規(guī)格下,AIGC大模型能力較上一代增長10倍,這得益于FP16算力提升16倍、計算核心帶寬擴大4倍,以及Softmax和LayerNorm性能提升超10倍的綜合優(yōu)化。
實測數(shù)據(jù)顯示,在Llama2 7B大模型推理中,“周易”X3在Prefill階段算力利用率達72%,配合安謀科技自研的解壓硬件WDC,Decode階段有效帶寬利用率突破100%,遠超行業(yè)平均水平,充分滿足大模型解碼階段的高吞吐需求。產(chǎn)品研發(fā)副總裁劉浩表示,公司將持續(xù)加大投入,整合頂尖研發(fā)資源,為生態(tài)伙伴提供從硬件到服務的端到端解決方案,助力產(chǎn)品創(chuàng)新與商業(yè)化落地。
軟件層面,“周易”X3搭載全新升級的Compass AI平臺,支持TensorFlow、PyTorch、ONNX等主流框架,覆蓋超160種算子和270多種模型,包括LLM、VLM等主流架構(gòu)。平臺提供GPTQ量化、動態(tài)Shape支持等優(yōu)化工具,并將Parser、Optimizer等核心組件開源,支持自定義算子與編譯流程,幫助開發(fā)者實現(xiàn)白盒化部署。產(chǎn)品總監(jiān)鮑敏祺強調(diào),該平臺遵循“軟硬協(xié)同、全周期服務”準則,通過專業(yè)團隊與深度服務,助力客戶產(chǎn)品成功。
應用場景方面,“周易”X3覆蓋四大領(lǐng)域:在基礎(chǔ)設(shè)施領(lǐng)域支持加速卡高效推理;在智能汽車領(lǐng)域為ADAS自動泊車和IVI智能交互提供算力;在移動終端實現(xiàn)AI PC與手機的超分渲染和AI Agent流暢運行;在智能物聯(lián)網(wǎng)領(lǐng)域推動智能IPC、網(wǎng)關(guān)等設(shè)備的本地化低延遲推理。此次發(fā)布標志著安謀科技以“AI Arm CHINA”為方向,為千行百業(yè)智能化轉(zhuǎn)型注入核心動力。











