在2025百度世界大會上,百度正式推出新一代原生全模態大模型——文心大模型5.0。這款模型以2.4萬億參數量為核心,采用原生全模態統一建模技術,突破傳統多模態模型后期融合的局限,實現文本、圖像、音頻、視頻等信息的原生理解與生成一體化。從訓練階段開始,模型便融合語言、視覺、聽覺等多維度數據,通過統一的自回歸架構完成多模態特征的深度協同優化。
百度首席技術官王海峰指出,文心5.0的技術路線與業界主流多模態模型形成鮮明對比。傳統模型多采用后期融合方式處理不同模態數據,而文心5.0通過原生全模態建模架構,使多模態特征在統一框架下實現深度交互。這種設計不僅提升了模型對復雜場景的理解能力,更支持跨模態內容的無縫生成,例如根據文本描述生成動態視頻,或通過圖像與音頻的聯合分析完成環境感知。
在權威基準評測中,文心5.0展現出顯著優勢。其語言與多模態理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型持平,圖像與視頻生成能力則達到垂直領域專精模型水平。特別是在40余項綜合測試中,模型在指令遵循、創意寫作、事實核查、智能體規劃等維度表現突出,驗證了原生全模態架構的技術潛力。
百度創始人李彥宏在發布會上強調,大模型技術的迭代速度已成為核心競爭壁壘。他表示:"智能本身即是最大的應用場景,而技術迭代的效率決定了模型的能力邊界。百度將持續投入前沿研發,推動智能水平突破現有極限。"據其透露,文心5.0已具備自我學習與迭代能力,模型思考時間顯著延長,創新能力持續增強。
目前,文心大模型5.0 Preview版本已通過文心App向公眾開放體驗,開發者和企業用戶可通過百度千帆大模型平臺調用API服務。值得注意的是,在11月8日LMArena大模型競技場最新排名中,文心ERNIE-5.0-Preview-1022在文本任務評測中位列全球第二、中國第一,尤其在復雜問題推理與創意內容生成領域表現優異。
該模型的推出標志著原生全模態技術進入實用化階段。通過消除傳統多模態模型中不同模態間的處理壁壘,文心5.0為智能助手、內容創作、工業檢測等場景提供了更高效的解決方案。百度方面表示,后續將持續優化模型性能,并探索其在自動駕駛、醫療診斷等領域的落地應用。











