鳳凰網(wǎng)科技訊 12月10日,面壁智能宣布,VoxCPM 1.5版本正式上線并開源,多項(xiàng)核心能力升級(jí)。
其中,AudioVAE采樣率從16kHz提升至44.1kHz,模型可根據(jù)高質(zhì)量音頻,克隆效果更佳、細(xì)節(jié)更豐富的聲音;VoxCPM 1.5僅需6.25個(gè)token即可生成1秒音頻,較此前版本提高一倍,在保持速度的同時(shí)提升了音頻生成質(zhì)量。同時(shí),VoxCPM 1.5版本穩(wěn)定性增強(qiáng),減少音頻偽影,優(yōu)化長(zhǎng)文本音頻的生成效果。











