滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

阿里云棲大會發布7款大模型，通義萬相Wan2.5-preview成AI視覺生成新標桿

時間：2025-09-26 18:35:18 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在杭州舉辦的云棲大會上，阿里巴巴集團一口氣發布了七款人工智能大模型，其中最受矚目的當屬通義萬相Wan2.5-preview。這款全模態視覺生成模型首次實現了音畫一體的視頻生成功能，標志著阿里在多模態技術領域取得了重大突破。

據阿里云智能集團首席技術官周靖人介紹，通義萬相Wan2.5-preview采用了原生多模態架構，將文本、圖像、音頻等不同模態的數據統一處理。該模型集成了文生視頻、圖生視頻、文生圖和圖像編輯四大功能模塊，能夠生成電影級別的視頻內容，為用戶提供全感官的敘事體驗。

在實際測試中，Wan2.5-preview展現出了驚人的文本理解和推理能力。用戶只需輸入一段文字描述，模型就能自動生成與之匹配的語音和視頻畫面，且人物口型與語音完美同步。例如，當輸入一段關于白人女性拆禮物的詳細描述后，模型不僅生成了逼真的光影效果和人物表情，還精準還原了鋼琴聲和人物對話。

這款模型在視頻生成方面實現了多項升級。視頻時長從原來的5秒延長至10秒，支持24幀每秒的1080P高清輸出，能夠生成更完整的劇情故事。在操控性方面，模型對復雜指令的理解能力顯著提升，可以完成運鏡控制和人物變身等高級圖像編輯任務。

Wan2.5-preview的最大亮點在于其原生多模態架構。這是國內首個將聲音、圖像、文本作為統一語料進行訓練的模型，能夠在同一框架下完成多種任務。相比傳統非原生架構，這種設計避免了信息損耗和誤差累積，使模型具備了更強的跨模態推理和生成能力。

在圖像生成方面，該模型的美學質感和指令遵循能力都有顯著提升。它能夠根據復雜的詩歌描述生成意境匹配的圖片，在圖表生成和文字穩定性方面也表現出色。圖像編輯功能支持豐富的指令操作，同時保持視覺元素的一致性。

具體應用案例展示了模型的強大能力。在生成婚禮求婚場景時，模型不僅準確還原了人物動作和光影效果，還完美匹配了婚禮進行曲和新郎的對話。對于極快語速的RAP說唱，模型也能確保人物口型與語音同步，毫無破綻。

音效生成是Wan2.5-preview的另一大特色。在騎士騎馬和女子打網球的場景中，模型生成了馬蹄聲、裁判哨音、網球撞擊聲等環境音效，大大增強了視頻的真實感。對于跳舞場景，模型還能根據描述生成匹配的背景音樂，準確把握嘻哈風格的節奏特點。

目前，用戶可以通過阿里云百煉平臺調用API，或直接在通義萬相官網體驗這款模型。阿里提供的官方數據顯示，通義萬相系列模型已支持十多種視覺創作功能，累計生成了3.9億張圖片和7000萬個視頻，成為中國調用量最大的視覺生成模型之一。

在開源領域，通義萬相也取得了顯著成果。自今年2月以來，該系列已連續開源20多款模型，在開源社區和第三方平臺的下載量超過3000萬次，成為最受歡迎的視頻生成模型之一。隨著世界模型的面世，阿里在人工智能領域的布局將更加完善。

更多>同類資訊

蘋果前COO杰夫?威廉姆斯退休，庫克盛贊其為蘋果發展立下汗馬功勞

11-15

中國通號自主研發系統助力青藏鐵路構建無人機立體防護網

11-15

十二載輪回落幕，生肖酒新篇開啟：文化與市場博弈下的新征程

11-15

嵐圖泰山18日上市，45萬起售，大六座SUV市場或迎新格局

11-15

存儲芯片價格瘋漲，手機廠商采購暫緩，中高端機型或迎漲價潮

11-15

阿里通義App煥新升級更名為千問 5.0.0攜三大核心能力對標ChatGPT

11-15

中國AI務實突圍：從DeepSeek到MiniMax，誰將打破OpenAI神話？

而在此前提下，再疊加算力可控和訓練成本低等優勢，以MiniMax為代表的中國AI模型便正好踩中了一個非常罕見的時間窗口——在OpenAI忙著追逐AGI和構建未來超級系統的時間縫隙中，國內AI正好可以在短期的…

11-15

“天衍-287”超導量子計算機問世，處理特定問題速度遠超超級計算機

11月14日，中國電信量子研究院發布消息，搭載“祖沖之三號”同款芯片的超導量子計算機“天衍-287”完成搭建。據介紹，其擁有105個數據比特和182個耦合比特，由中電信量子集團與科大國盾量子技術股份有限公司聯…

11-15

AI浪潮涌動烏鎮！相芯科技攜全鏈條數字人成果亮相世界互聯網大會

11-15

阿里巴巴“通義”升級更名“千問”，消費級AI戰場再添強勁競爭者

根據官方消息，“千問”定位為阿里旗下最重要的大模型應用入口，其核心能力基于阿里自研的大模型體系Qwen（千問）。分析人士指出，阿里此前在To B市場和模型研發側擁有技術基礎，但在消費端應用分發層面還未形成…

11-15

阿里巴巴“通義”App升級更名“千問”，AI戰略轉向消費級市場新布局

根據官方消息，“千問”定位為阿里旗下最重要的大模型應用入口，其核心能力基于阿里自研的大模型體系Qwen（千問）。分析人士指出，阿里此前在To B市場和模型研發側擁有技術基礎，但在消費端應用分發層面還未形成…

11-15

圖靈測試已落伍？奧特曼攜手量子計算之父提出新標準衡量AI智能

【新智元導讀】隨著現在的主流大模型都能輕松通過圖靈測試，這個持續了數十年的標準開始逐漸過時。奧特曼和量子計算之父David Deutsch討論得出了一個新的圖靈測試2.0標準，可以更好地衡量究竟怎樣AI才…

11-15

AI賦能時代：普通人如何借力AI工具，實現個人能力的躍遷與進化？

11-15

UCLA等團隊研發ARES框架：讓AI學會“量體裁衣”式智能推理

11-15

Salesforce革新AI訓練：Webscale-RL破解數據困局，效率躍升百倍

11-15

點擊查看更多 +

全站最新

11月14日車圈動態：小米汽車公布超速提示專利問界M8交付破12萬臺廣汽新品牌將發布

百度引領AI新航向：以“內化AI能力”為鑰，攜創業者共啟“效果涌現”盛宴

夫妻攜手創業34年，攜12位親戚沖刺IPO，“家族模式”能否闖關成功？

科大訊飛LUMIE10 Pro學習機：AI助力個性化學習，護眼大存儲伴成長每一步

昆明國際車展盛大啟幕，近千款車型亮相引市民觀展購車熱潮

11月14日車圈動態：小米汽車新專利提升安全問界M8交付破12萬臺啟境品牌將發布

熱門內容

本欄最新

東風奕派eπ007+深圳煥新登場：14萬級激光雷達加持，四驅轎跑新選擇

24.9萬起售！全新奔馳純電CLA攜四大突破，重塑豪華純電新標桿

東風奕派兩周年獻禮，eπ007+攜四大優勢登場，助力新能源賽道加速跑

東風奕派兩周年獻禮：eπ007+攜四大優勢登場，為年輕人出行注入新動力

東風奕派eπ007+高能登場，以“奕派速度”為年輕人解鎖百萬級出行新體驗

嵐圖泰山來襲：外觀大氣內飾豪華能否在高端SUV市場分一杯羹？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

阿里云棲大會發布7款大模型，通義萬相Wan2.5-preview成AI視覺生成新標桿