阿里巴巴旗下AI應用夸克近日推出全新AI創作平臺“造點”,該平臺整合了AI圖像生成與視頻生成兩大核心功能,成為國內首個支持音畫同步視頻生成的創作工具。通過接入通義萬相Wan2.5模型,“造點”實現了視頻畫面與音效、背景音樂的智能匹配,單次生成即可完成10秒時長的完整劇情,并支持24幀/秒的1080P高清輸出,畫面質量達到電影級標準。
在視頻生成領域,“造點”的突破性在于其指令遵循能力。平臺可精準控制運鏡、轉場等復雜動態效果,例如模擬專業攝像機的推拉搖移軌跡。一位參與內測的影視創作者評價稱:“新模型升級后,音頻與視頻的同步輸出極大提升了制作效率,人物口型、動作與配樂的契合度遠超預期。”
圖像生成方面,“造點”引入國際領先的Midjourney V7模型,并針對亞洲用戶需求進行深度優化。平臺支持多圖參考、風格代碼調用及精細化參數調整,在中文文字生成、國風元素渲染及人像細節處理上表現突出。例如,電商設計師可快速生成符合品牌調性的產品海報,游戲開發者則能通過風格轉換功能實現概念圖到3D模型的轉化。
內測期間,平臺涌現出大量創意作品,包括“中世紀油畫大合唱”“文物吃月餅”等跨次元內容。這些作品通過AI技術將歷史元素與現代場景融合,展現了AI創作的多元可能性。數據顯示,使用“造點”生成視頻的效率較傳統流程提升3倍以上,且畫質穩定性顯著增強。
用戶可通過夸克PC端“AI生圖”入口或訪問zaodian.quark.cn體驗服務。即日起至9月30日,平臺開放通義萬相Wan2.5視頻生成功能的7天免費試用。移動端則提供輕量化創作模式,支持“一句話P圖”“AI創意視頻”等趣味功能,同時涵蓋濾鏡、美顏、去路人等日常修圖需求,并延伸至換發型、3D手辦生成等熱門場景。
據開發團隊介紹,“造點”的研發重點在于降低專業工具的使用門檻。例如,用戶輸入“生成一張賽博朋克風格的貓咪海報”即可獲得多版設計方案,而無需掌握復雜參數。這種“所見即所得”的交互方式,正在吸引更多非專業用戶參與AI創作。