在2025云棲大會現場,阿里云智能首席技術官周靖人宣布了一系列重大技術突破。當天,通義大模型家族迎來七項重要更新,覆蓋模型智能水平提升、Agent工具調用與編程能力優化、深度推理強化及多模態交互等多個領域,標志著人工智能技術邁向新高度。
作為通義千問系列的核心產品,Qwen3-Max旗艦模型正式登場。該模型采用36T tokens的預訓練數據,參數規模突破萬億級別,在編程實現與工具調用領域展現出卓越性能。其強大的代碼生成能力可支持復雜系統開發,Agent框架則能高效整合第三方工具,為智能化應用提供底層支撐。
在基礎架構層面,Qwen3-Next系列模型實現重大突破。新一代架構在保持與2350億參數版本相當性能的同時,大幅優化計算效率,為大規模商用部署奠定基礎。專項模型方面,編程專用模型Qwen3-Coder完成迭代升級,在算法優化與代碼糾錯能力上取得顯著進展。
多模態領域同樣亮點紛呈。視覺理解模型Qwen3-VL正式開源,在圖像語義解析與跨模態推理方面樹立新標桿。全模態交互模型Qwen3-Omni首次亮相即引發關注,該模型在音視頻處理領域創下32項SOTA紀錄,具備類人級的聽說讀寫綜合能力,可適配車載系統、智能眼鏡及移動終端等多樣化場景。
視覺創作領域迎來重要升級,通義萬相推出Wan2.5-preview系列模型,集成文生視頻、圖生視頻、文生圖及圖像編輯四大功能模塊。新版本全面強化中英文字體生成與圖表繪制能力,支持通過自然語言指令實現圖像精細化編輯,大幅降低專業設計門檻。
語音交互方面,通義百聆大模型家族正式組建。其中語音識別模型Fun-ASR基于數千萬小時真實語音數據訓練,具備上下文感知與行業適配能力;語音合成模型Fun-CosyVoice提供超百種預制音色庫,可滿足客服、電商直播、有聲讀物、消費電子等領域的多樣化需求。
截至目前,阿里通義大模型已開源300余個版本,形成覆蓋全尺寸、全模態的完整生態。其全球下載量突破6億次,衍生模型達17萬個,在開源社區影響力持續領跑全球。從基礎架構到垂直領域,從文本處理到多模態交互,通義大模型正以持續創新推動AI技術普惠化進程。











