近年來,手機廠商在人工智能領域的布局愈發密集,從系統交互到應用聯動,AI能力正深度融入用戶日常操作。榮耀YOYO通過接入第三方智能體,打通了系統層與應用層的AI功能;華為小藝則憑借一句指令實現跨應用任務處理,展現出更強的場景適應能力。然而,這些看似強大的功能仍依賴云端算力,手機AI尚未突破“端云協作”的既有框架,本地化部署仍處于探索階段。
三星近期被曝出將在Galaxy S26系列中內置本地大模型,引發行業關注。該模型不僅具備高級權限,可自主清理內存以保障運行流暢,還能處理大部分AI任務。這一動作并非首次——三星早在2023年就曾展示過名為“高斯”的本地模型,但后續因與谷歌Gemini的合作而擱置。此次重新聚焦本地化,或標志著手機AI技術路徑的潛在轉向。
端云協同仍是當前主流方案,其優勢在于分工明確:云端負責復雜推理與模型迭代,端側承擔語音喚醒、基礎意圖識別等輕量任務。這種模式對低頻使用場景足夠高效,且能兼容性能較弱的設備。例如,用戶查詢天氣時,云端延遲一兩秒并不影響體驗;廠商也無需為舊機型增加硬件成本。然而,隨著AI目標從“回答問題”轉向“替代操作”,端云協同的局限性逐漸顯現。
當AI開始理解屏幕內容、拆解任務目標并規劃執行路徑時,高頻交互場景對實時性的要求陡增。弱網環境下云端響應延遲可能導致操作中斷,連續指令中網絡波動更會破壞流程連貫性。用戶對效率的敏感度提升,迫使廠商重新思考技術架構。近期“端側大模型”成為熱議話題,并非要完全拋棄云端,而是希望將即時判斷與關鍵決策權下放至設備本身,形成“端側預處理+云端深度支持”的新平衡。
本地化部署的挑戰主要來自硬件限制與維護成本。內存占用、算力需求與功耗控制構成三重門檻:即便模型規模適中,常駐后臺也會擠壓系統資源,蘋果甚至為此提升了iPhone內存配置。云端模型可通過OTA快速修復漏洞,本地模型則需依賴系統更新,測試周期與風險成本顯著增加。這些因素導致純端側方案長期難以落地,即便強如三星Galaxy S26,仍需通過定期清理資源來維持模型運行。
技術突破正在改變局面。2025年旗艦芯片的NPU性能大幅提升,為端側AI提供了硬件基礎。高通第五代驍龍8至尊版的Hexagon NPU在本地生成任務中可達200 token/s輸出速度,支持連續語言生成;聯發科天璣9500的NPU 990在3B規模模型上實現效率提升與功耗下降,使常駐運行更具可行性。廠商已開始利用這些紅利:榮耀YOYO在Magic8 Pro上支持3000+場景自動任務,豆包手機助手則嘗試讓AI直接理解屏幕內容并模擬用戶操作,推動交互模式從“問答”向“代理”演進。
盡管如此,純端側AI仍難獨立承擔復雜任務。華為小藝、小米超級小愛等系統級AI助理,核心架構仍以端云協同為主,端側負責感知與基礎理解,云端完成深度推理。這種選擇源于現實考量:當AI深度介入系統操作時,穩定性與資源控制比激進部署更重要。廠商不會因追求技術噱頭而犧牲用戶體驗,這解釋了為何本地化方案尚未成為主流。












