在AI技術飛速發(fā)展的當下,企業(yè)級應用正迎來新的突破。近日,火山引擎在FORCE原動力大會上宣布,豆包大模型1.8版本正式發(fā)布,同時推出多項創(chuàng)新技術,為企業(yè)AI應用提供更強大的支持。這一系列舉措標志著AI技術正從實驗室走向規(guī)模化落地,為企業(yè)帶來實實在在的生產(chǎn)力提升。
豆包大模型1.8版本在多模態(tài)理解和Agent能力方面實現(xiàn)了顯著提升。該模型在設計之初就針對多模態(tài)Agent場景進行了優(yōu)化,在多輪交互、復雜指令遵循以及操作系統(tǒng)級Agent操作等方面表現(xiàn)出色。特別是在視覺能力上,新版本進行了底層升級,能夠以低幀率處理超長視頻,并在視頻語義解析、空間關系理解和文檔結構化處理等方面取得突破性進展。原生支持的智能上下文管理機制,使模型在執(zhí)行超長、多步驟任務時能夠自動清理歷史信息,確保任務持續(xù)穩(wěn)定完成。
火山引擎總裁譚待在大會上分享了一組令人矚目的數(shù)據(jù):截至目前,豆包大模型的日均Token使用量已突破50萬億,較去年同期增長超過10倍,自發(fā)布以來更是增長了417倍。已有超過100家企業(yè)客戶的累計Token使用量超過一萬億,顯示出企業(yè)級AI應用正在快速規(guī)模化。譚待強調(diào),火山引擎一直致力于通過技術創(chuàng)新降低成本,推動模型降價策略,目前已有更多廠商跟進這一趨勢,共同做大市場蛋糕。
在視頻生成領域,火山引擎也取得了重要進展。去年春季發(fā)布的視頻模型Seedance 1.0,如今已升級至1.5 Pro版本。新版本采用原生音視頻聯(lián)合生成架構,支持環(huán)境音、背景音樂和人聲等多種元素,實現(xiàn)了毫秒級的音畫同步輸出。更值得一提的是,Seedance 1.5 Pro支持多人跨語對話,能夠根據(jù)畫面中說話角色的數(shù)量和景深信息,實現(xiàn)精準的口型匹配,有效解決了"張口不發(fā)聲"或口型錯位等問題。該模型還原生支持多語言及多種中文方言,包括四川話、粵語和上海話等,大大拓展了視頻內(nèi)容創(chuàng)作的實用邊界。
為了幫助企業(yè)更好地實現(xiàn)Agent的規(guī)模化落地,火山引擎推出了推理代工服務,支持極致彈性伸縮、全棧推理優(yōu)化和分布式緩存。這項服務就像一臺已調(diào)校完成的頂級賽車,企業(yè)只需將模型"插入發(fā)動機"即可快速運行。針對企業(yè)構建Agent過程中面臨的身份權限管理、黑盒測試、存量系統(tǒng)智能化等挑戰(zhàn),火山引擎發(fā)布了AI Agent平臺AgentKit+HiAgent技術體系。
AgentKit構建了一套讓Agent走向生產(chǎn)規(guī)模化落地的基礎設施底座,具備身份認證、運行時管理、云沙箱、網(wǎng)關、記憶庫、可觀測性、評測和安全圍欄等功能。與傳統(tǒng)開發(fā)方式相比,AgentKit大幅簡化了開發(fā)流程。傳統(tǒng)開發(fā)需要手動調(diào)用模型、解析結果并處理各種狀態(tài)和異常,前后端代碼量至少需要1500至2000行。而使用AgentKit后,前端Agent僅需約50行代碼,后端十幾行即可完成簡單串聯(lián),整套實現(xiàn)控制在61行以內(nèi),代碼量減少約96%,同時開發(fā)和運行穩(wěn)定性也大幅提升。
去年發(fā)布的HiAgent解決方案也在不斷迭代,今年推出了"1+N+X"體系,即一個統(tǒng)一AI任務調(diào)度入口、N個企業(yè)通用智能體和X個業(yè)務定制智能體應用,幫助企業(yè)加速Agent的規(guī)模化落地。這些創(chuàng)新技術正在推動AI從技術潛力轉化為實實在在的行業(yè)生產(chǎn)力,為企業(yè)帶來新的增長機遇。











