在近期舉辦的“2025驍龍峰會(huì)·中國(guó)”上,AI智能體(Agent)成為芯片供應(yīng)商、手機(jī)與PC制造商以及AI技術(shù)解決方案提供商熱議的焦點(diǎn)。業(yè)內(nèi)普遍認(rèn)為,2025年不僅是AI智能體從云端走向終端設(shè)備的關(guān)鍵節(jié)點(diǎn),更是其普及應(yīng)用的重要窗口期。榮耀終端產(chǎn)品線總裁方飛在峰會(huì)上指出,今年將開啟“手機(jī)智能體與性能的引擎時(shí)代”;小米AI產(chǎn)品經(jīng)理李豪杰則透露,其個(gè)性化端側(cè)AI已實(shí)現(xiàn)無需輸入即可生成內(nèi)容的功能,并具備環(huán)境感知能力;金山辦公生態(tài)合作負(fù)責(zé)人張寧介紹了基于WPS靈犀的“原生Office辦公智能體”,展現(xiàn)了智能體在辦公場(chǎng)景的深度融合。
AI智能體的落地對(duì)終端芯片提出了更高要求。谷歌云定義顯示,智能體需具備多模態(tài)信息處理能力,可同時(shí)處理文本、語(yǔ)音、視頻等數(shù)據(jù),并實(shí)現(xiàn)自主學(xué)習(xí)與獨(dú)立決策。與被動(dòng)響應(yīng)的AI助理不同,智能體能以目標(biāo)為導(dǎo)向主動(dòng)完成任務(wù)。這一特性依賴于生成式AI與基礎(chǔ)模型的多模態(tài)功能,而多模態(tài)數(shù)據(jù)的復(fù)雜性需要異構(gòu)計(jì)算架構(gòu)的支持——以NPU為核心,協(xié)同CPU與GPU共同完成計(jì)算任務(wù)。
高通最新發(fā)布的第五代驍龍8至尊版芯片,正是為滿足這一需求設(shè)計(jì)的異構(gòu)AI引擎。其核心由自研Oryon CPU、Adreno GPU與全新Hexagon NPU組成,三者分工明確:CPU負(fù)責(zé)即時(shí)響應(yīng)任務(wù),GPU通過獨(dú)立顯存加速AI負(fù)載,NPU則專注運(yùn)行大語(yǔ)言模型與復(fù)雜推理。例如,在圖像識(shí)別場(chǎng)景中,12個(gè)標(biāo)量加速器可處理經(jīng)典AI任務(wù)并支持大模型推理;8個(gè)向量加速器能加速像素級(jí)圖像模型,延長(zhǎng)語(yǔ)音模型上下文窗口;張量加速器則針對(duì)視覺大模型等復(fù)雜用例進(jìn)行優(yōu)化。芯片集成的傳感器中樞可在保護(hù)隱私的前提下,構(gòu)建用戶個(gè)性化知識(shí)圖譜。
內(nèi)存帶寬與模型量化技術(shù)是端側(cè)部署的另一關(guān)鍵。第五代驍龍8至尊版首次支持64位內(nèi)存架構(gòu),使NPU可訪問超4GB RAM,顯著提升大模型訓(xùn)練效率與推理速度。其LP DDR5x內(nèi)存頻率達(dá)5.2GHz,進(jìn)一步優(yōu)化了響應(yīng)速度。在模型輕量化方面,Hexagon NPU支持的INT2與FP8精度技術(shù),通過降低參數(shù)精度減少內(nèi)存占用,同時(shí)保持模型準(zhǔn)確性。高通技術(shù)總監(jiān)萬衛(wèi)星透露,該芯片在三十億參數(shù)大語(yǔ)言模型上的出字速度可達(dá)220token/s以上。
CPU與GPU的性能突破同樣為智能體提供了算力支撐。第三代Qualcomm Oryon CPU采用4.60GHz超級(jí)內(nèi)核與3.62GHz性能內(nèi)核,單核性能提升20%,多核性能提升17%,能效提升35%。新一代Adreno GPU性能提升23%,光追性能提升25%,能效優(yōu)化20%,并首次引入18MB獨(dú)立高速顯存。這一設(shè)計(jì)不僅降低整機(jī)功耗10%,提升游戲性能38%,還為AI影像功能(如實(shí)時(shí)視頻分析、相冊(cè)增強(qiáng))帶來更快的推理響應(yīng)。
在PC領(lǐng)域,高通同步推出了面向筆記本電腦的驍龍X2 Elite Extreme與驍龍X2 Elite平臺(tái)。其中,X2 Elite Extreme集成3nm制程的第三代Oryon CPU,擁有12個(gè)超級(jí)核心與6個(gè)性能核心,主頻達(dá)5GHz,成為首款支持該頻率的ARM兼容CPU。其搭載的NPU具備80TOPS AI處理能力,可支持Windows 11 AI+ PC上的并發(fā)AI體驗(yàn)。高通產(chǎn)品管理副總裁Nitin Kumar強(qiáng)調(diào),該NPU的推理性能能滿足生成式AI與智能體的計(jì)算需求。
終端廠商與芯片供應(yīng)商的深度協(xié)同,成為推動(dòng)智能體落地的核心動(dòng)力。榮耀與高通聯(lián)合研發(fā)的端側(cè)AI模型方案,通過2-bit量化技術(shù)將模型存儲(chǔ)空間壓縮30%,推理速度提升15%,功耗降低20%。在峰會(huì)現(xiàn)場(chǎng),榮耀演示的“智能體驅(qū)動(dòng)的圖像AI追色”功能引發(fā)關(guān)注:用戶通過語(yǔ)音指令,讓智能體YOYO將電影海報(bào)風(fēng)格遷移至故宮照片,整個(gè)過程依賴低bit量化存儲(chǔ)與向量檢索技術(shù)實(shí)現(xiàn)高效處理。雙方開發(fā)的新一代向量化檢索技術(shù),通過稠密向量編碼將檢索性能提升400%,多模態(tài)感知能力則使個(gè)人知識(shí)庫(kù)構(gòu)建更便捷。
PC端的創(chuàng)新同樣顯著。金山辦公與高通合作,基于驍龍AI PC架構(gòu)適配的WPS Office預(yù)發(fā)布版本顯示,其啟動(dòng)速度較競(jìng)品提升20%,15MB Excel文件打開速度領(lǐng)先10%,10MB PPT文件打開速度領(lǐng)先10%。今年7月發(fā)布的WPS AI 3.0版本“WPS靈犀”,已實(shí)現(xiàn)通過自然語(yǔ)言完成文檔創(chuàng)作、演示生成等功能。張寧表示,未來WPS靈犀將與驍龍AI PC硬件深度融合,構(gòu)建協(xié)同增效的辦公生態(tài)。
2025年既是高通成立四十周年,也是其入華三十周年。高通中國(guó)區(qū)董事長(zhǎng)孟樸指出,AI將成為未來三十年與中國(guó)合作伙伴合作的核心。高通首席運(yùn)營(yíng)官Akash Palkhiwala透露,公司將與本土AI模型提供商及開發(fā)者合作,推動(dòng)智能體AI在更多終端落地,并優(yōu)化智能手機(jī)上的AI功能體驗(yàn)。















