12月1日,豆包手機正式開啟小規模市場發售,市場反響熱烈程度遠超預估。盡管該手機助手尚未打通各類應用程序的API接口,但其憑借AI技術模擬用戶點擊、滑動等操作,直接理解屏幕內容并跨應用執行指令,成功在某種程度上打破了應用程序間的“信息孤島”現象,實現了應用間的協同操作。
在12月17日舉辦的FORCE原動力大會上,火山引擎宣布推出豆包大模型1.8版本。該版本不僅強化了Agent相關能力,還在多模態理解和上下文管理方面取得顯著進展。與此同時,萬億Token俱樂部成員數量突破100家,這一規模已超越某頭部云服務提供商。火山引擎總裁譚待在會上強調,模型領域的關鍵不在于競爭,而在于共同開拓市場。他指出,火山引擎率先提出模型的重要性,并通過技術革新大幅降低成本,同時保持盈利能力。這一策略最初引發質疑,但如今已有更多廠商跟進降價措施。
譚待在現場公布的數據顯示,截至今年12月,豆包大模型的日均token使用量突破50萬億,較去年同期增長超10倍,自發布以來累計增長417倍。目前已有超過100家企業客戶的累計token使用量超過一萬億,標志著企業級AI應用正加速規模化落地。豆包大模型1.8版本在設計階段便聚焦多模態Agent場景,系統性提升了多輪交互、復雜指令遵循及操作系統級Agent操作能力。在視覺能力方面,該版本通過底層升級實現了對低幀率超長視頻的理解,并在視頻語義解析、空間關系理解及文檔結構化處理等領域取得突破。其原生支持的智能上下文管理機制允許用戶通過策略配置自動清理歷史信息,確保超長多步驟任務的穩定執行。
火山引擎的視頻生成模型Seedance也迎來重大升級。從春季發布的1.0版本到冬季的1.5 Pro版本,該模型采用原生音視頻聯合生成架構,支持環境音、背景音樂及人聲等多元素同步輸出,實現毫秒級音畫對齊。Seedance 1.5 Pro還具備多人跨語言對話能力,可根據畫面中說話角色的數量和景深信息精準匹配口型,有效解決“張口不發聲”或口型錯位等問題。該版本原生支持多語言及四川話、粵語、上海話等中文方言,顯著拓展了視頻內容創作的實用場景。相較于市場上其他模型在口型匹配和語義一致性方面的不足,Seedance 1.5 Pro在這兩項關鍵指標上實現顯著提升。
在定價策略上,火山引擎推出業內首個“AI節省計劃”,覆蓋旗下所有按量后付的大模型產品,包括豆包大模型家族及第三方開源模型,最高可為用戶節省47%的使用成本。針對企業Agent應用的規模化落地難題,火山引擎推出推理代工服務,提供極致彈性伸縮、全棧推理優化及分布式緩存支持。該服務被比喻為“已調校完成的頂級賽車”,用戶只需“插入模型發動機”即可快速運行。
隨著大模型智能水平的持續提升,Agent技術正逐步滲透企業核心業務。譚待預測,未來兩三年內Agent將引發生產力革命,但企業當前更關注如何將構建好的Agent轉化為大規模業務價值。為此,火山引擎發布AI Agent平臺AgentKit+HiAgent技術體系。其中,AgentKit作為基礎設施底座,集成了身份認證、運行時環境、云沙箱、網關、記憶庫、可觀測性、評測系統及安全圍欄等功能。傳統Agent開發需手動調用模型、解析結果并處理異常狀態,前端邏輯需編寫七八百行代碼,后端接口及云資源調用同樣需要相同量級,總代碼量達1500至2000行且易出錯。AgentKit通過SDK和服務化封裝將復雜控制邏輯開箱即用,前端Agent僅需約50行代碼,后端僅需十幾行即可完成簡單串聯,整套實現控制在61行以內,代碼量減少約96%。依托預置云端服務,該平臺顯著提升了Agent開發與運行的穩定性,加速了企業將Agent推向生產環境的進程。
火山引擎于2024年發布的HiAgent解決方案也在持續迭代。今年推出的“1+N+X”體系包含統一AI任務調度入口、N個企業通用智能體及X個業務定制智能體應用,進一步助力企業加速Agent規模化部署。通過這些技術突破,火山引擎正推動AI從技術潛力轉化為實際行業生產力。











