在2025百度世界大會上,一款名為文心大模型5.0的原生全模態大模型正式亮相。這款由百度研發的模型參數量高達2.4萬億,采用創新的原生全模態統一建模技術,能夠同時處理文本、圖像、音頻和視頻等多種形式的信息輸入與輸出,展現了強大的多模態交互能力。
據介紹,文心大模型5.0在基礎能力上實現了全面突破。在多模態理解、指令執行、創意內容生成、事實準確性以及智能體規劃與工具應用等多個維度,該模型均展現出卓越性能。通過40余項權威基準測試的綜合評估,其語言與多模態理解能力已達到國際頂尖水平,與Gemini-2.5-Pro、GPT-5-High等知名模型不相上下;在圖像與視頻生成領域,其表現更可與垂直領域專業模型比肩。
百度首席技術官王海峰在會上詳細闡釋了技術路線創新。他指出,不同于傳統多模態模型采用的后期融合方式,文心5.0從訓練階段就通過統一的自回歸架構實現多模態數據融合。這種原生全模態建模方法,使語言、圖像、視頻、音頻等特征在統一框架下深度交互,真正實現了理解與生成的一體化。
在架構設計方面,該模型依托飛槳深度學習框架,采用超稀疏混合專家架構。這種設計在保持2.4萬億參數規模的同時,將激活參數比例控制在3%以下,既保證了模型的處理能力,又顯著提升了推理效率。通過大規模工具環境合成任務軌跡數據,并結合思維鏈與行動鏈的端到端強化學習,模型的智能體交互和工具調用能力得到質的提升。
百度創始人李彥宏在演講中強調,大模型技術正經歷快速迭代,其智能水平持續突破邊界。他特別指出,模型思考時間的延長、原生全模態的統一以及自我學習能力的進化,標志著人工智能正邁向更具創新性的發展階段。"智能技術本身就是最大的應用場景,而技術迭代速度將成為決定競爭力的核心要素。"李彥宏表示,百度將持續加大研發投入,推動智能技術邊界不斷拓展。
值得關注的是,在11月8日公布的LMArena大模型競技場最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任務評測中取得全球并列第二、中國第一的優異成績。該模型在創意寫作、復雜問題解析等高階認知任務中表現尤為突出,驗證了其在實際應用場景中的強大潛力。
目前,文心大模型5.0 Preview版本已通過文心App向公眾開放體驗,開發者和企業用戶也可通過百度千帆大模型平臺調用其API服務。這一舉措標志著百度在推動人工智能技術普惠化方面邁出重要一步,為各行業智能化轉型提供了強有力的技術支撐。









