字節跳動豆包團隊近日宣布,將聯合中興通訊共同推進AI手機的研發與量產,首款機型預計于2026年第二季度中后期正式面世。這款手機的核心亮點在于其“系統級Agent+跨應用自動化”功能,旨在通過自然語言交互實現復雜任務的自動化處理,例如跨平臺比價、多應用協同訂票、日程管理等場景。
合作模式上,中興通訊負責硬件制造與供應鏈管理,豆包團隊主導AI算法開發與功能落地,雙方按比例分享利潤。這一模式與華為、榮耀等自研生態完善的廠商形成差異——后者更傾向于在模型層合作,而應用層仍保留自有助手(如小布同學、藍心小V);中興、傳音等廠商則可能復制字節與中興的分工框架。
技術層面,手機的核心機制圍繞“大模型意圖理解+系統級權限+多模態視覺識別”展開。例如,用戶可通過語音指令同時完成飛書請假和訂票操作,系統自動拆解任務并調用對應應用。然而,當前技術仍面臨多重挑戰:跨應用調度的錯誤率超過50%,主要源于語義理解偏差、視覺識別失敗(如App界面更新導致模擬點擊失效),以及硬件算力限制——需驍龍8至尊版芯片才能穩定運行,AI功能占用內存約3GB,電量消耗較日常使用增加8%-12%。
安全與隱私是另一關鍵議題。端側模型(約130億參數)負責語音識別、本地信息管理等離線任務,數據不離開設備;云端則處理復雜文生圖、跨應用操作等需求。但高權限Agent仍存在風險,其權限層級接近系統級,可能被惡意腳本或廣告彈窗利用。為此,豆包團隊采取“關鍵步驟手動確認”策略,例如支付環節需用戶二次授權,同時通過技術手段加密傳輸數據。
用戶體驗調研顯示,80%的用戶對現有AI助手不滿,問題集中在功能調用失敗和意圖誤解上。當前演示場景(如訂票)依賴標準化指令模板,難以適應自然語言表達習慣。例如,用戶更傾向自主確認時間、地點等關鍵信息,而非完全依賴系統自動填充。為解決這一問題,團隊正優化意圖框架,使AI通過自主學習適應多樣化表達,同時與主流應用廠商協商權限開放,目前已覆蓋打車、外賣、新聞資訊等場景。
針對應用廠商的核心權限(如攜程價格系統),系統采用視覺識別替代直接調用,避免觸碰數據資產,僅通過識圖獲取信息。這種“技術繞行”策略既保護了廠商利益,也降低了合作門檻。例如,意圖理解、語音識別等能力由AI自主訓練,無需與廠商額外談判。
行業分析認為,AI手機的普及需分階段推進:初期以語音助手為基礎,聚焦單應用簡單任務,強化隱私保護;中期在旗艦機型和高知用戶中試點跨應用自動化功能;待多模態技術、模型性能和安全機制成熟后,再拓展至復雜場景,最終實現多任務并行處理。這一路徑若能落地,或將重塑手機生態——從APP分發邏輯到流量分配規則,甚至廣告模式都可能被重新定義。











