過去一年時間里,手機廠商在AI方面的動作越來越密集,榮耀YOYO接入更多第三方智能體,實現系統層與應用層的AI能力對接;華為小藝只需一句指令便能在應用間穿梭,幫你完成一些任務。
盡管這些AI能力愈發強大,但如果把這些功能拆開來看,會發現一個很現實的情況,本質上,這些AI依然需要聯網才能使用。也就是說,手機AI仍困在端云協作的階段,還未進一步。
近期,X平臺Semi-retired-ing透露,三星將在即將發布的Galaxy S26系列上準備一套能夠在本地運行的大模型,用于實現大部分AI功能。這套大模型甚至擁有高級權限,能在必要時清除內存,留出更多空間,以確保隨時響應用戶的需求。
實際上,三星在2023年就曾展示過一套名為“高斯”的本地大模型,也曾被指出這套模型已經在Galaxy S25系列里預裝。但不知出于何種原因,三星一直在力推Google的Gemini,幾乎未再提及“高斯”。直到近期,三星的本地大模型才被重新提及。
在大多數廠商仍然以云端為主的階段,三星為何要嘗試把模型真正放進手機里?是希望通過這種方式“彎道超車”?還是移動端已經擁有了本地部署大模型的能力?無論答案是什么,我們只知道,手機AI的新階段即將拉開帷幕。
手機廠商不會拋棄端云協同
如果三星真的要將大模型部署在本地,是否說明手機AI要開始放棄端云協同的策略,轉向純本地部署了?事實上,這在短期內可能并不會實現。
端云協同在當前的手機AI里,是幾乎完美的方案。云端承擔的是模型規模、復雜推理和快速迭代的任務,背后的優勢自然是云服務器擁有更充足的算力資源,也更方便進行模型更新、統一治理和安全審查。而端側負責對接用戶的第一道指令,像是喚醒、語音識別、基礎意圖判斷,然后把復雜請求轉交給云端完成。
這種分工邏輯,對于偶爾用用AI的用戶而言,其實沒什么問題。查一條信息,哪怕多等一兩秒,也不會明顯影響體驗;對廠商而言,這種模式還不會多占用手機的資源,哪怕是性能稍差一些的手機也能使用。而三星Galaxy S26系列內置大模型這套策略,大概率不會開放給舊機型,這就是區別。
但問題在于,這套邏輯的前提是,AI的使用頻率不會太高。隨著手機AI的發展方向逐漸清晰,廠商的目標已經不再是“幫你回答問題”,而是“替你完成操作”。AI不再只是對話窗口,而是開始嘗試理解屏幕內容、拆解任務目標、規劃執行路徑,最終形成完整的AI Agent鏈路。
一旦AI進入這種高頻、連續、系統級的交互場景,端云協同的短板就會被迅速放大。例如在弱網環境下,云端響應延遲會讓操作出現明顯斷點;在連續指令場景中,網絡中斷就可能讓整個流程停在原地。對于用戶來說,效率低下是很難被接受的。
也正因為如此,近期廠商開始頻繁討論“端側大模型”,并不意味著它們要徹底拋棄云端,而是希望把更多即時判斷和關鍵決策留在設備本身。端云協同顯然是這個階段里的最優解。
端側大模型,落點難在何處?
既然端云協同有缺點,那么為何本地大模型很難在手機端落地呢?其實倒也不是并不是廠商不愿意嘗試,而是受限條件過于明確。
首先是硬件約束。內存、算力和功耗,是端側AI的三個核心條件。哪怕模型規模不算夸張,只要需要常駐后臺,就會對系統資源形成持續占用,光是內存這個條件,甚至迫使蘋果提升了iPhone的內存空間。
其次是穩定性和維護成本。云端模型可以快速迭代、即時修復錯誤,而本地模型一旦部署,優化節奏就只能依賴系統更新。對于系統級AI而言,這意味著更高的風險,也更高的測試成本。
但2025年的變化在于,芯片能力大幅提升,讓手機純端側大模型幾乎要成為現實。
以第五代驍龍8至尊版為例,高通披露其Hexagon NPU在本地生成式任務中,已經可以實現約200 token/s級別的輸出速度。這個指標的意義在于,端側模型已經能夠進行連續、自然的語言生成,這種連續性,是AI執行復雜交互指令的前提條件。
同樣地,聯發科天璣9500在NPU 990上引入了更激進的能效設計。按照官方說法,在 3B 規模的端側模型上,其生成效率提升的同時,整體功耗還有明顯下降。這意味著端側模型不再只是“能跑一次”,而是開始具備更現實的常駐可能。
搭載最新一代旗艦芯片的新機們,或多或少都已經利用好了芯片算力提升帶來的紅利,推出了各種AI交互功能。比如榮耀的YOYO智能體,在Magic8 Pro上已經能夠支持多達3000+場景的自動任務執行。
但即便如此,用純端側AI去實現復雜任務,還是有一定難度。
就連被爆料內置本地大模型的Galaxy S26,也需要通過定期清理系統資源,才能確保模型常駐運行。這本身就說明,完全依靠端側模型去承載復雜 AI 任務,在短期內仍然不現實。
端側 AI 不會“掀桌”,但會成為旗艦機分水嶺
從目前主流廠商的選擇來看,端云協同仍然是最穩妥的方案。
以華為為例,小藝依然是國內系統級AI助理中完成度最高的一套方案,覆蓋語音交互、系統控制、跨設備協同等多個維度。但即便如此,其核心架構依然是典型的端云協同——端側負責感知和基礎理解,云端承擔復雜推理。
這并不是廠商“做不到端側”,而是一個更現實的取舍問題。當AI開始深度介入系統和服務層,穩定性、效率和資源控制,始終比激進部署更重要。
與此同時,今年最引人關注的變化,其實是AI開始嘗試接管“操作權”,豆包手機助手卻嘗試了把大模型能力前移到手機交互層,讓AI不只是回答問題,而是直接理解屏幕內容、規劃操作路徑,甚至模擬用戶完成跨App行為。這種模式,瞬間讓整個行業沸騰。
不過,豆包手機助手、華為小藝、榮耀YOYO、小米超級小愛等一系列開啟了“自動駕駛”的手機AI,本質上代表著一個前進的方向,正如前文所說的,這是下一階段的AI手機必須掌握的技能。
無論如何,端側大模型并不會在短時間內徹底改變手機AI的整體方向。無論是三星、華為,還是國內幾家主流廠商,當前的選擇都是端云協同的方案。
畢竟手機并不是為大模型而生的設備,這使其必須在性能、功耗、穩定性和安全之間找到平衡點。一旦AI開始深度介入系統操作,就不能讓用戶的體驗出現問題,這也是為什么廠商不會貿然跟進。
從這個角度看,端側大模型可能不會成為手機發布會上的“爆點”,但將會悄然抬高旗艦機的技術門檻,讓有端側和僅云端的AI手機在AI功能實現的體驗上出現差距。而這個分水嶺,或許就在不久的將來就會到來。









