可靈數字人迎來重大升級,其全新2.0版本現已面向所有用戶開放使用。用戶只需完成上傳角色圖像、輸入配音文本、設定角色表現三個簡單步驟,即可快速生成具備專業表演能力的數字人視頻內容。
此次升級在原有功能基礎上實現了三大技術突破。新版本不僅強化了數字人的表情表現力,更通過深度優化算法實現了手部動作與口型同步的精準控制。在內容時長方面,單段視頻生成上限從1分鐘延長至5分鐘,為創作者提供更廣闊的敘事空間。升級后的系統能夠智能解析文本語義,自動匹配符合情境的肢體語言、表情變化和鏡頭運動,使數字人呈現更具感染力的情緒表達。
回顧該功能的發展歷程,今年9月首次推出的數字人生成系統已具備行業領先水平。當時的技術方案通過單張角色圖片與文字/音頻輸入,即可生成1080p分辨率、48幀率的視頻內容。其核心優勢在于采用Transformer架構的DiT模型,該模型在時序信息處理和細節控制方面表現突出,能夠精準捕捉面部特征變化,實現口型與語音的毫秒級同步,同時根據語義內容自動生成匹配的微表情和肢體動作,確保數字人形象在視頻全程保持高度一致性。
技術團隊透露,此次升級著重優化了動作生成模塊的算法復雜度,通過引入更精細的骨骼控制參數,使手部動作的生成精度提升40%。在口型同步方面,新系統采用多模態融合訓練方法,將語音特征與面部肌肉運動數據聯合建模,使口型匹配準確率達到98%以上。這些技術突破使得數字人能夠勝任新聞播報、產品解說、劇情短片等多樣化場景的應用需求。











