在2025百度世界大會上,百度宣布推出新一代原生全模態大模型——文心大模型5.0。這款模型參數量高達2.4萬億,采用原生全模態統一建模技術,能夠同時處理文本、圖像、音頻、視頻等多種信息輸入與輸出,實現了全模態理解與生成能力的突破。
據介紹,文心大模型5.0在基礎能力上實現了全面升級。在多模態理解、指令遵循、創意寫作、事實性核查、智能體規劃與工具應用等多個維度,該模型均展現出卓越性能。在40余項權威基準測試中,其語言與多模態理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型持平,圖像與視頻生成能力則達到垂直領域專精模型水平,躋身全球領先行列。
百度首席技術官王海峰詳細解釋了技術路線創新。他表示,不同于傳統多模態模型采用的后期融合方式,文心5.0從訓練階段就通過統一的自回歸架構實現原生全模態建模,將語言、圖像、視頻、音頻等多模態數據深度融合。這種設計使多模態特征在統一框架下充分交互優化,真正實現了原生的全模態統一理解與生成。
在架構設計上,文心5.0依托飛槳深度學習框架,采用超稀疏混合專家架構。盡管總參數規模超過2.4萬億,但激活參數比例控制在3%以下,既保證了模型強大能力,又顯著提升了推理效率。同時,通過大規模工具環境合成復雜任務軌跡數據,結合思維鏈與行動鏈的端到端強化學習訓練,模型在智能體交互和工具調用方面的能力得到質的提升。
百度創始人李彥宏在會上強調,大模型技術正經歷快速迭代,其智能水平持續突破極限。他指出:"當前模型不僅思考時間延長,更實現了原生全模態統一,具備自我學習和迭代創新能力。智能本身已成為最大的應用場景,而技術迭代速度將是決定競爭力的關鍵因素。"百度承諾將持續投入資源,推動模型技術向更高智能水平發展。
在應用落地方面,文心大模型5.0 Preview版本已同步上線文心App,普通用戶可直接體驗其強大功能。同時,開發者和企業用戶可通過百度千帆大模型平臺調用API服務,快速集成到各類應用場景中。值得關注的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務評測中取得全球并列第二、中國第一的優異成績,尤其在創意寫作和復雜問題理解方面表現突出。









