火山引擎近日宣布,豆包大模型家族迎來重要更新——豆包大模型1.6-vision正式上線。這一版本是該系列中首個具備工具調用能力的視覺深度思考模型,標志著多模態技術實現新突破。
據技術團隊介紹,1.6-vision版本在通用多模態理解與推理能力上顯著提升。該模型不僅支持更復雜的視覺場景解析,還能通過Responses API實現與外部工具的深度交互,為智能系統開發提供更靈活的解決方案。
回顧今年6月的FORCE原動力大會,火山引擎曾集中發布多項技術成果。當時同步推出的豆包大模型1.6版本,已展現出強大的文本處理能力。而此次發布的視覺專項升級,則進一步補全了多模態技術矩陣。
同期亮相的還有豆包·視頻生成模型Seedance 1.0 pro,該模型在動態畫面生成領域取得突破。豆包·語音播客模型與實時語音模型也完成全量上線,形成覆蓋文本、視覺、語音的完整AI技術體系。
技術專家指出,1.6-vision版本的核心優勢在于其深度思考機制。通過構建視覺-語言聯合推理框架,模型能夠模擬人類分析問題的邏輯鏈條,在醫療影像診斷、工業質檢等場景中展現應用潛力。