火山引擎在近日舉辦的原動力大會上,正式推出了豆包大模型1.8版本以及音視頻創作模型Seedance 1.5 pro。這兩款新產品的發布,標志著該公司在人工智能領域的技術實力再上新臺階。權威評測結果顯示,豆包大模型在多模態理解、生成能力以及Agent能力方面,已成功躋身全球領先行列。
據火山引擎總裁譚待透露,截至目前,豆包大模型的日均token使用量已突破50萬億大關,與去年同期相比增長超過10倍。這一數據充分顯示了市場對豆包大模型的廣泛認可和高度需求。同時,已有超過100家企業客戶的累計token使用量超過一萬億,進一步證明了豆包大模型在企業級應用中的強大實力。
作為豆包家族的最新旗艦,豆包大模型1.8針對多模態Agent場景進行了深度優化。該模型在工具調用、復雜指令遵循以及OS Agent能力方面均得到了顯著提升,從而大幅增強了模型在處理復雜任務時的規劃與執行能力。特別是在視覺理解方面,豆包1.8的單次視頻理解幀數從640幀提升至1280幀,支持以低幀率理解超長視頻,并能調用工具對關鍵片段進行高幀率理解,為在線教育、產品質檢等領域提供了強大的技術支持。
在多項公開評測中,豆包1.8展現出了卓越的性能。在視覺推理、通用視覺問答、空間理解及視頻理解等任務中,該模型均取得了最佳或接近最佳的成績。在通用智能體測評集BrowserComp上,豆包1.8的表現更是領先全球。在數學與推理等基礎能力維度上,豆包1.8的整體水平也已接近全球頂尖的通用模型。
為了滿足日益增長的視頻創作需求,火山引擎還推出了Seedance 1.5 pro音視頻創作模型。該模型不僅具備影視級的敘事張力,能夠精準捕捉運動細節并細膩呈現人物情緒,更在音畫同步技術上取得了重大突破。Seedance 1.5 pro采用創新的原生音視頻聯合生成架構,支持環境音、背景音樂、人聲等多種元素,實現了毫秒級的音畫同步輸出。在對白處理上,該模型支持多人多語言對話,口型對齊精準,覆蓋中文方言、英文及小語種,極大地提升了視頻內容的真實感和全球化創作潛力。
為了進一步降低創作門檻和成本,Seedance系列即將上線“Draft樣片”功能。創作者可以先生成低分辨率樣片進行預覽,其關鍵要素與最終成片高度一致,真正做到“預覽即所得”。據數據顯示,該功能可幫助創作者提升65%的整體效率,并減少60%的無效創作成本。目前,個人用戶已可在豆包、即夢AI等平臺體驗該模型;企業用戶則可從指定日期起,通過火山引擎API接入Seedance 1.5 pro模型服務。
譚待在大會上指出,傳統的IT架構已無法滿足Agent時代的需求,以模型為中心的AI云原生架構正在形成,并圍繞Agent的開發與運營進行重構。為此,火山引擎全面升級了企業級AI Agent平臺——AgentKit,覆蓋了Agent從開發、部署到管控的全生命周期,旨在解決企業在Agent落地中面臨的核心挑戰。同時,火山引擎還推出了HiAgent智能體工作站,通過構建統一的企業AI任務調度中心、提供一系列開箱即用的通用智能體以及支持個性化定制智能體應用,幫助企業實現Agent的規模化管理與應用。
為了降低企業使用門檻,火山引擎還推出了業內首個“AI節省計劃”。該計劃覆蓋所有按量后付費的大模型產品,通過階梯式折扣,幫助企業最高節省47%的成本。這一舉措無疑將進一步推動AI技術在各行各業的普及和應用。









