在2025百度世界大會上,百度正式推出其最新力作——原生全模態大模型文心大模型5.0。這款模型以其高達2.4萬億的參數量和原生全模態統一建模技術,成為行業矚目的焦點。它不僅能夠理解文本、圖像、音頻和視頻等多種信息,還能實現這些模態的生成,為用戶提供全方位的智能體驗。

文心大模型5.0在基礎能力上實現了全面升級,尤其在多模態理解、指令遵循、創意寫作、事實性以及智能體規劃與工具應用方面表現卓越。經過40余項權威基準的綜合評測,該模型的語言與多模態理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型不相上下,圖像與視頻生成能力更是與垂直領域的專精模型相當,展現了其全球領先的技術水平。
百度創始人李彥宏在大會上強調,大模型技術正處于快速迭代階段,其智能水平不斷突破極限。他指出,隨著模型思考時間的延長和原生全模態的統一,大模型將具備自我學習和迭代的能力,甚至能夠創新。李彥宏表示,智能本身是最大的應用,而技術迭代的速度則是百度構建護城河的關鍵。百度將持續投入研發,推動智能技術的不斷進步。
百度首席技術官王海峰進一步介紹了文心大模型5.0的技術特點。他表示,與業界多數采用后期融合方式的多模態模型不同,文心5.0采用了統一的自回歸架構進行原生全模態建模,實現了理解與生成的一體化。這種技術路線從訓練階段便融合了語言、圖像、視頻、音頻等多模態數據,使得多模態特征在統一架構下充分融合并協同優化,從而實現了原生的全模態統一理解與生成。

依托飛槳深度學習框架,文心大模型5.0采用了超稀疏混合專家架構進行全模態訓練,總參數規模超過2.4萬億,但激活參數比例低于3%。這一設計在保持模型強大能力的同時,有效提升了推理效率。該模型還基于大規模工具環境合成長程任務軌跡數據,并采用基于思維鏈和行動鏈的端到端多輪強化學習訓練,顯著提升了模型的智能體和工具調用能力。
目前,文心大模型5.0 Preview已同步上線文心App,用戶可以直接體驗其強大的功能。同時,開發者和企業用戶也可以通過百度千帆大模型平臺調用文心大模型5.0的API服務,進一步拓展其應用場景。
值得一提的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務評測中位列全球并列第二、中國第一,尤其在創意寫作和復雜問題理解方面表現尤為突出,再次證明了百度在大模型領域的領先地位。









