在2025百度世界大會上,一款名為文心大模型5.0的原生全模態大模型正式亮相。這款模型擁有高達2.4萬億的參數量,通過原生全模態統一建模技術,實現了對文本、圖像、音頻、視頻等多種信息輸入輸出的全面支持,展現出強大的全模態理解與生成能力。
文心大模型5.0在基礎能力上實現了全面躍升。在多模態理解、指令遵循、創意寫作、事實性以及智能體規劃與工具應用等多個維度,該模型均展現出卓越的性能。經過40余項權威基準的綜合評估,其語言與多模態理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型不相上下,圖像與視頻生成能力更是與垂直領域專精模型比肩,標志著其已躋身全球領先行列。
百度創始人李彥宏在大會上強調,大模型技術正處于高速迭代階段,其智能水平不斷突破新高度。他指出,模型思考時間的延長、原生全模態的統一,以及自我學習和迭代能力的具備,使得模型具備了創新能力。李彥宏表示,智能本身即是最大的應用場景,而技術迭代的速度則是構筑競爭優勢的關鍵。百度將持續加大投入,研發更為前沿的模型,不斷推高智能技術的天花板。
百度首席技術官王海峰進一步闡釋了文心大模型5.0的技術特色。他介紹,與業界多數采用后期融合方式的多模態模型不同,文心5.0從訓練之初便采用統一的自回歸架構進行原生全模態建模,實現了理解與生成的一體化。這種技術路線使得語言、圖像、視頻、音頻等多模態數據在統一架構下充分融合并協同優化,從而實現了原生的全模態統一理解與生成。
依托飛槳深度學習框架,文心大模型5.0采用了超稀疏混合專家架構進行全模態訓練,總參數規模超過2.4萬億,但激活參數比例低于3%。這一設計在保持模型強大能力的同時,有效提升了推理效率。模型還基于大規模工具環境合成長程任務軌跡數據,并采用基于思維鏈和行動鏈的端到端多輪強化學習訓練,顯著增強了模型的智能體和工具調用能力。
目前,文心大模型5.0 Preview已同步上線文心App,供用戶直接體驗。同時,開發者和企業用戶也可通過百度千帆大模型平臺調用文心大模型5.0的API服務,進一步拓展其應用場景。
值得一提的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務評測中位列全球并列第二、中國第一,尤其在創意寫作和復雜問題理解方面表現尤為突出,再次證明了文心大模型系列的強大實力。





