字節跳動旗下豆包App近日迎來重要功能更新,其視頻生成能力全面升級,正式接入新一代Seedance1.5 Pro模型。用戶只需打開應用對話框,選擇“照片動起來”功能,上傳靜態圖片并輸入創意提示詞,再選定1.5 Pro模型,即可一鍵生成聲音與畫面高度匹配的有聲視頻,操作流程簡潔高效。
根據字節跳動Seed官網披露的技術細節,Seedance1.5 Pro作為原生音視頻聯合架構的集大成者,通過精細化后訓練技術實現了多模態指令的深度解析。該模型在三大核心領域取得突破性進展:其一,音畫同步精度達到行業領先水平,不僅能精準匹配多種語言及地方方言的語音韻律,還能捕捉說話者的情感波動,確保視聽體驗的高度一致性;其二,創新引入電影級運鏡控制系統,具備自主鏡頭調度能力,可實現專業影調的畫面銜接與動態構圖,使生成視頻具備電影般的視覺張力;其三,語義理解模塊經過強化訓練,能夠精準解析敘事語境,顯著提升長視頻段落的敘事連貫性,為專業內容創作者提供可靠的技術支撐。
在實際應用場景中,Seedance1.5 Pro展現出強大的跨領域適應能力。影視創作者可利用其生成具有專業質感的分鏡腳本,短視頻團隊能快速產出多鏡頭切換的宣傳片,廣告行業可高效制作動態產品展示視頻,甚至傳統戲曲表演也能通過數字化演繹煥發新生。該模型對文化語境的精準把握,使其在不同題材的內容創作中均能保持敘事表現力與視聽融合度的平衡。
值得關注的是,此前于2025年6月發布的Seedance1.0 Pro版本已奠定技術基礎。該版本支持文字與圖片雙輸入模式,生成的視頻具備多鏡頭無縫切換能力,在主體運動穩定性和畫面自然度方面獲得市場認可。此次升級的1.5 Pro版本在繼承前代優勢的基礎上,通過架構優化與算法迭代,將音視頻協同創作推向新的高度。






