近年來(lái),手機(jī)廠商在人工智能領(lǐng)域的布局愈發(fā)密集,各大品牌紛紛推出具備AI功能的智能助手。榮耀YOYO通過接入更多第三方智能體,實(shí)現(xiàn)了系統(tǒng)層與應(yīng)用層AI能力的深度融合;華為小藝則憑借一句指令即可在多個(gè)應(yīng)用間自由切換,幫助用戶高效完成任務(wù)。然而,這些看似強(qiáng)大的AI功能,本質(zhì)上仍依賴網(wǎng)絡(luò)連接,手機(jī)AI尚未突破端云協(xié)作的局限,仍處于這一發(fā)展階段。
近期有消息稱,三星計(jì)劃在即將發(fā)布的Galaxy S26系列中引入一套本地運(yùn)行的大模型,用于支撐大部分AI功能。據(jù)透露,該模型具備高級(jí)權(quán)限,可在必要時(shí)自動(dòng)清理內(nèi)存,確保隨時(shí)響應(yīng)用戶需求。事實(shí)上,三星早在2023年就曾展示過名為“高斯”的本地大模型,并一度被傳預(yù)裝于Galaxy S25系列,但后來(lái)三星轉(zhuǎn)向力推Google的Gemini,幾乎未再提及“高斯”。此次本地大模型的重新回歸,引發(fā)了業(yè)界對(duì)手機(jī)AI發(fā)展方向的廣泛討論。
在多數(shù)廠商仍以云端為主的背景下,三星為何選擇將模型部署于本地?是意圖通過差異化策略實(shí)現(xiàn)“彎道超車”,還是移動(dòng)端已具備本地部署大模型的技術(shù)條件?盡管答案尚未明確,但可以確定的是,手機(jī)AI正邁向新的發(fā)展階段。不過,這并不意味著端云協(xié)同模式將被徹底取代。短期內(nèi),手機(jī)AI仍需依賴云端與端側(cè)的協(xié)同配合。
端云協(xié)同之所以成為當(dāng)前主流方案,源于其分工邏輯的合理性。云端負(fù)責(zé)處理大規(guī)模模型、復(fù)雜推理及快速迭代,依托云服務(wù)器的強(qiáng)大算力,實(shí)現(xiàn)模型更新、統(tǒng)一治理與安全審查;端側(cè)則承擔(dān)用戶初始指令的接收與基礎(chǔ)處理,如喚醒、語(yǔ)音識(shí)別及意圖判斷,再將復(fù)雜請(qǐng)求轉(zhuǎn)交云端完成。這種模式對(duì)輕度AI用戶影響不大,即使查詢信息時(shí)多等待一兩秒,體驗(yàn)也不會(huì)明顯下降。同時(shí),廠商無(wú)需占用過多手機(jī)資源,即使是性能較弱的機(jī)型也能支持。然而,隨著AI目標(biāo)從“回答問題”轉(zhuǎn)向“替代操作”,端云協(xié)同的短板逐漸顯現(xiàn)。
當(dāng)AI開始理解屏幕內(nèi)容、拆解任務(wù)目標(biāo)并規(guī)劃執(zhí)行路徑時(shí),高頻、連續(xù)、系統(tǒng)級(jí)的交互場(chǎng)景對(duì)實(shí)時(shí)性提出了更高要求。在弱網(wǎng)環(huán)境下,云端響應(yīng)延遲會(huì)導(dǎo)致操作中斷;網(wǎng)絡(luò)中斷則可能使連續(xù)指令流程停滯。這些效率問題對(duì)用戶體驗(yàn)影響顯著,因此廠商開始探索“端側(cè)大模型”,試圖將更多即時(shí)判斷與關(guān)鍵決策留在設(shè)備本地。但這并不意味著完全拋棄云端,端云協(xié)同仍是當(dāng)前最優(yōu)解。
盡管端云協(xié)同存在局限,但本地大模型的落地仍面臨諸多挑戰(zhàn)。硬件條件是首要限制因素。內(nèi)存、算力與功耗是端側(cè)AI的三大核心約束。即使模型規(guī)模適中,常駐后臺(tái)也會(huì)持續(xù)占用系統(tǒng)資源。例如,蘋果為支持端側(cè)AI,不得不提升iPhone的內(nèi)存容量。本地模型的穩(wěn)定性與維護(hù)成本也是難題。云端模型可快速迭代與修復(fù)錯(cuò)誤,而本地模型一旦部署,優(yōu)化節(jié)奏只能依賴系統(tǒng)更新,這增加了測(cè)試風(fēng)險(xiǎn)與成本。
2025年,芯片技術(shù)的突破為端側(cè)大模型的落地帶來(lái)了轉(zhuǎn)機(jī)。以第五代驍龍8至尊版為例,其Hexagon NPU在本地生成式任務(wù)中已實(shí)現(xiàn)約200 token/s的輸出速度,支持連續(xù)、自然的語(yǔ)言生成,為AI執(zhí)行復(fù)雜交互指令奠定了基礎(chǔ)。聯(lián)發(fā)科天璣9500則在NPU 990上引入更激進(jìn)的能效設(shè)計(jì),在3B規(guī)模的端側(cè)模型上,生成效率提升的同時(shí)功耗顯著下降,使模型常駐運(yùn)行成為可能。搭載新一代旗艦芯片的手機(jī)已開始利用算力提升,推出各類AI交互功能。例如,榮耀YOYO智能體在Magic8 Pro上支持超3000種場(chǎng)景的自動(dòng)任務(wù)執(zhí)行。
然而,完全依賴端側(cè)模型實(shí)現(xiàn)復(fù)雜任務(wù)仍存在難度。即使是被爆料內(nèi)置本地大模型的Galaxy S26,也需通過定期清理系統(tǒng)資源來(lái)確保模型常駐運(yùn)行。這表明,短期內(nèi)純端側(cè)AI仍難以承載復(fù)雜任務(wù)。當(dāng)前,主流廠商仍選擇端云協(xié)同方案。以華為小藝為例,其作為國(guó)內(nèi)系統(tǒng)級(jí)AI助理的標(biāo)桿,覆蓋語(yǔ)音交互、系統(tǒng)控制與跨設(shè)備協(xié)同等多個(gè)維度,但核心架構(gòu)仍依賴端側(cè)感知與云端推理的結(jié)合。這種選擇并非技術(shù)不足,而是基于穩(wěn)定性、效率與資源控制的現(xiàn)實(shí)考量。當(dāng)AI深度介入系統(tǒng)操作時(shí),用戶體驗(yàn)的穩(wěn)定性至關(guān)重要,廠商不會(huì)貿(mào)然推進(jìn)激進(jìn)部署。
盡管如此,AI接管“操作權(quán)”已成為行業(yè)趨勢(shì)。豆包手機(jī)助手嘗試將大模型能力前移至交互層,使AI不僅能回答問題,還能理解屏幕內(nèi)容、規(guī)劃操作路徑并模擬用戶完成跨應(yīng)用行為。這一模式引發(fā)了行業(yè)關(guān)注。華為小藝、榮耀YOYO、小米超級(jí)小愛等開啟“自動(dòng)駕駛”功能的手機(jī)AI,均代表了下一階段的發(fā)展方向。然而,端側(cè)大模型不會(huì)在短期內(nèi)徹底改變手機(jī)AI格局。手機(jī)作為非專為大模型設(shè)計(jì)的設(shè)備,需在性能、功耗、穩(wěn)定性與安全間尋求平衡。一旦AI深度介入系統(tǒng)操作,用戶體驗(yàn)的穩(wěn)定性便成為首要目標(biāo),這也是廠商謹(jǐn)慎推進(jìn)的原因。
在此背景下,端側(cè)大模型雖不會(huì)成為手機(jī)發(fā)布會(huì)的焦點(diǎn),卻將悄然提升旗艦機(jī)的技術(shù)門檻。具備端側(cè)與云端協(xié)同能力的手機(jī),將在AI功能體驗(yàn)上與僅依賴云端的機(jī)型形成差距。這一分水嶺或許即將到來(lái)。與此同時(shí),CES2026展會(huì)即將開幕,作為科技領(lǐng)域的重要盛會(huì),其動(dòng)態(tài)值得持續(xù)關(guān)注。









