安謀科技近日正式推出新一代專為端側(cè)大模型設(shè)計(jì)的NPU IP——“周易”X3。這款產(chǎn)品通過(guò)與Arm架構(gòu)的CPU、GPU協(xié)同工作,構(gòu)建起基于Arm生態(tài)的異構(gòu)計(jì)算解決方案,為端側(cè)AI應(yīng)用提供更強(qiáng)大的算力支持。
據(jù)介紹,“周易”X3在多個(gè)關(guān)鍵領(lǐng)域?qū)崿F(xiàn)突破性升級(jí),包括模型兼容性、硬件架構(gòu)效率、軟件生態(tài)適配、算力帶寬優(yōu)化、能效表現(xiàn)以及系統(tǒng)擴(kuò)展性。安謀科技產(chǎn)品研發(fā)負(fù)責(zé)人表示,該團(tuán)隊(duì)自2018年成立以來(lái),已成功交付五代NPU產(chǎn)品,并實(shí)現(xiàn)終端領(lǐng)域的商業(yè)化應(yīng)用,所有研發(fā)工作均由中國(guó)本土團(tuán)隊(duì)獨(dú)立完成。
硬件架構(gòu)方面,“周易”X3采用DSP+DSA混合架構(gòu),支持從定點(diǎn)到浮點(diǎn)的計(jì)算轉(zhuǎn)換。其單集群算力范圍覆蓋8-80TFLOPS(FP8精度),單核帶寬最高可達(dá)256GB/s。通過(guò)配備AI專屬硬件引擎AIFF和專用調(diào)度器,該方案將CPU負(fù)載降低至0.5%,同時(shí)顯著減少調(diào)度延遲。在模型支持能力上,新平臺(tái)可處理超過(guò)160種算子類型,兼容270余種模型架構(gòu)。
軟件生態(tài)建設(shè)取得重要進(jìn)展,其Compass AI平臺(tái)已實(shí)現(xiàn)與TensorFlow、ONNX、PyTorch等主流框架的無(wú)縫對(duì)接,并支持大模型動(dòng)態(tài)Shape處理、GPTQ量化方案、Hugging Face模型庫(kù)以及LLM、VLM等多元模型類型。性能測(cè)試顯示,CNN模型處理效率較前代提升30-50%,AIGC大模型處理能力提升近10倍,多核算力線性度達(dá)到70-80%,大模型Prefill階段算力利用率提升至72%,Decode階段在啟用自研解壓引擎WDC后有效帶寬利用率突破100%。
發(fā)布會(huì)現(xiàn)場(chǎng)演示了多個(gè)應(yīng)用場(chǎng)景:基于“周易”X3的AI PC可本地運(yùn)行MinicpM v2.6模型,實(shí)現(xiàn)實(shí)時(shí)圖像識(shí)別功能;在文生圖領(lǐng)域,搭載Stable Diffusion v1.5的設(shè)備能以秒級(jí)速度生成高質(zhì)量圖像;文生文應(yīng)用中,DeepSeek-R1-Distill-Qwen-1.5B模型的運(yùn)行流暢度和響應(yīng)速度均有顯著提升。這些案例表明,新一代產(chǎn)品在性能提升和生態(tài)完善的雙重作用下,大幅改善了端側(cè)AI的實(shí)際使用體驗(yàn)。
目前,“周易”X3已形成覆蓋多領(lǐng)域的解決方案矩陣,其應(yīng)用場(chǎng)景延伸至加速卡、AI PC、智能手機(jī)、具身智能、智能座艙、ADAS系統(tǒng)以及智能監(jiān)控設(shè)備等終端產(chǎn)品。該平臺(tái)通過(guò)提供NPU IP授權(quán)、開放技術(shù)合作和完整解決方案,持續(xù)推動(dòng)本土端側(cè)AI技術(shù)的規(guī)模化落地。











