在MEET2026智能未來大會上,高通公司AI產品技術中國區負責人萬衛星分享了關于終端側AI與混合AI的前沿思考。他指出,AI應用正經歷從感知到生成,再到智能體,最終邁向物理AI的演進過程。目前,行業正從生成式AI向智能體AI過渡,這一轉變標志著AI技術向更自主、更復雜的方向發展。
萬衛星將AI應用的演進劃分為四個階段。感知AI作為基礎階段,已在終端設備中實現廣泛應用。隨著ChatGPT等技術的興起,生成式AI成為第二階段,其核心是通過大規模數據預訓練,在人類監督下完成特定任務,如文本生成、圖像創作和翻譯等。第三階段是智能體AI,它能夠在無需人類干預的情況下自主行動、預測意圖并編排任務。目前,產業正處在這一關鍵躍遷期。第四階段為物理AI,AI將具備理解真實物理世界并做出相應反饋的能力,這一領域尚處于研究初期。
終端側AI的發展呈現出顯著趨勢。模型尺寸不斷擴大,手機已支持近百億參數的模型部署,PC支持約200億參數,車載場景則可支持200億至600億參數。模型質量同步提升,支持思維鏈和推理能力的模型已能在端側運行。上下文處理能力從兩年前的1K-2K增長至今年的8K-16K,特殊場景下甚至可實現128K的端側部署。模態方面,終端AI正從單一文字向文本、圖片、視頻、音頻等多模態,乃至全模態交互演進。
端側運行AI的優勢在于個性化服務。數據在終端產生,本地推理既保護隱私又無需聯網,且完全免費。然而,這一模式也面臨挑戰:終端內存限制模型參數量,帶寬影響推理速度,高集成度設備的功耗控制尤為關鍵。為突破這些瓶頸,高通通過量化壓縮技術將模型精度從8 bit降至2 bit,顯著減少內存占用;采用并行解碼技術提升token生成速率;利用先進NPU和異構計算架構推動AI服務從被動響應向主動個性化轉變。
智能體AI的典型用例展現了其復合性與主動性。例如,用戶可通過自然語言指令智能體發布微博:系統理解意圖后,自動打開應用、搜索照片、添加濾鏡并完成發布,全程無需人工干預。用戶還能通過交互監測回復并執行點贊或評論等操作。這一用例在驍龍峰會上全程端側運行,驗證了技術可行性。高通的芯片已覆蓋智能眼鏡、PC、汽車、手表和IoT設備,支持驍龍設備間的智能互聯。算力較小的設備可通過連接手機或汽車,共享本地數據,實現分布式個性化推理。
混合AI被視為未來發展方向。終端側運行垂類高效模型,提供安全、個性化的服務;云端部署大尺寸模型,提供通用、強能力的支持。高通憑借低時延、高速且安全的連接技術,確保端云協同與連接,為AI體驗的升級奠定基礎。











