字節跳動旗下豆包團隊近日推出了一款面向手機用戶的技術預覽版應用——豆包手機助手。這款基于豆包大模型開發的AI助手,通過與手機廠商在操作系統層面的深度合作,為用戶帶來了更加便捷的交互體驗和豐富的功能服務。
據介紹,豆包大模型在推理、視覺理解、圖像創作、視頻生成和語音處理等多個領域均達到國際領先水平,尤其在圖形界面操作能力方面表現突出。該模型能夠模擬人類操作手機的方式,完成各類復雜任務。基于這些技術優勢,豆包手機助手不僅提升了傳統手機助手的功能,還通過與手機廠商的合作,將服務深度整合到系統層面。
目前,豆包團隊明確表示沒有自研手機的計劃,而是選擇以“生態合作”的形式與多家手機廠商展開洽談。通過這種方式,豆包手機助手將被整合到不同品牌的機型中,為用戶提供統一的服務體驗。相關合作進展將在后續階段逐步公布。
在技術預覽階段,開發者和科技愛好者可以通過豆包與中興合作推出的工程樣機nubia M153體驗這款應用。該版本已面向特定用戶群體限量發售,售價為3499元。這一舉措旨在收集早期用戶的反饋,為后續優化提供參考。
從演示視頻中可以看到,豆包手機助手在交互方式上進行了多項創新。用戶可以通過語音指令、側邊鍵或豆包Ola Friend耳機喚醒助手,實現無縫操作。無論處于哪個應用界面,用戶都可以直接針對屏幕內容向助手提問,獲取實時信息。語音通話、視頻通話和屏幕共享等常用功能也被嵌入到助手功能中,用戶只需雙擊側邊AI鍵即可快速調用。
在多模態交互方面,豆包手機助手與系統原生相冊實現了深度打通。用戶可以直接在相冊內通過語音指令對圖片進行編輯,例如刪除人物或清理雜物等操作。這一功能簡化了傳統修圖流程,提升了使用效率。
豆包手機助手的一大亮點是其AI操作手機功能。該功能能夠根據用戶指令在多個應用間自動切換,完成查票訂票、商品下單、批量下載文件或查詢多軟件物流進度等任務。例如,當用戶在社交媒體上看到心儀商品時,只需說出“幫我在全平臺比價下單”,助手即可在多個電商平臺搜索同款商品,對比價格和規格,并自動領券后選擇最低價商品下單。不過,在涉及支付等敏感環節時,助手會提示用戶手動操作,以確保安全性和準確性。在此過程中,用戶仍可正常使用手機的其他功能。
為了提升個性化服務水平,豆包手機助手引入了記憶功能。用戶可以根據需求選擇開啟或關閉該功能,同時團隊承諾嚴格保護用戶數據隱私。基于記憶功能,助手還推出了操作手機Pro模式。該模式不僅調用GUI Agent模擬點擊操作,還能直接調用系統工具,結合記憶數據和更強的推理能力,更高效地完成復雜任務。例如,當用戶說“幫我給女兒推薦幾個禮物放進購物車”時,若記憶中已存儲女兒的年齡和興趣信息,助手可直接查詢符合條件的方案,無需用戶逐一說明細節。
盡管演示視頻中的內容均為真實錄制,但團隊在視頻結尾特別提醒,由于大模型技術仍存在不確定性,相關場景可能無法完全復現。當前產品的實際可用性與團隊預期仍有一定差距,未來將持續進行迭代優化。
行業分析指出,隨著大模型技術的快速發展,手機AI助手領域正形成“手機廠商+大模型廠商”深度合作的趨勢。例如,谷歌Gemini與三星的合作探索已為行業提供了跨界協同的參考案例。豆包手機助手的推出,進一步印證了這一發展方向的可行性。









