滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

?阿里推出新語(yǔ)音模型“百聆”：三秒錄音實(shí)現(xiàn)多語(yǔ)言與情感切換

時(shí)間：2025-12-16 00:02:30 來(lái)源：CHINAZ編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

阿里巴巴通義大模型宣布，其 “百聆” 系列語(yǔ)音模型迎來(lái)了重大升級(jí)，并正式開(kāi)源。此次更新的兩款語(yǔ)音模型，能夠在僅需三秒的錄音后，實(shí)現(xiàn)無(wú)縫切換至多達(dá)九種語(yǔ)言和十八種方言，包括普通話(huà)、粵語(yǔ)、日語(yǔ)、英語(yǔ)等，同時(shí)還可以模擬多種情感如開(kāi)心和憤怒。

在這次升級(jí)中，F(xiàn)un-CosyVoice3模型得到了顯著改善。模型的首包延遲降低了50%，大幅提升了中英混說(shuō)的準(zhǔn)確率。模型的音色克隆能力得到了增強(qiáng)，用戶(hù)只需提供一段三秒以上的錄音，便能復(fù)刻出相應(yīng)的音色并合成新語(yǔ)音。此功能的開(kāi)發(fā)使得實(shí)時(shí)語(yǔ)音助手、直播配音和無(wú)障礙閱讀等場(chǎng)景變得更加高效和便捷。

Fun-ASR 模型的能力同樣得到了提升，噪聲環(huán)境下的準(zhǔn)確率達(dá)到了93%。這一模型不僅支持歌詞和說(shuō)唱的識(shí)別，還可以進(jìn)行多語(yǔ)言自由混說(shuō)，覆蓋多種中文方言與口音。為了提升用戶(hù)體驗(yàn)，流式識(shí)別的首字延遲已降低至160毫秒，大幅提升了語(yǔ)音交互的流暢性。

這兩款模型均支持本地部署與二次開(kāi)發(fā)，開(kāi)發(fā)者可以根據(jù)自己的需求進(jìn)行定制化調(diào)整。開(kāi)源地址也已公布，用戶(hù)可以前往相關(guān)平臺(tái)體驗(yàn)和使用這兩款語(yǔ)音模型，進(jìn)一步推動(dòng)語(yǔ)音技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。

GitHub:https://github.com/FunAudioLLM/CosyVoice

劃重點(diǎn):

12-16

螞蟻數(shù)科宣布開(kāi)源數(shù)據(jù)分析智能體技術(shù) 當(dāng)前登頂BIRD

12-16

富士康將在美國(guó)建設(shè)一座大型工廠但可能不會(huì)為蘋(píng)果代工

12-15

虎鯨文娛發(fā)布tudoo Tbox AI主機(jī) 標(biāo)準(zhǔn)版定價(jià)1499元

12-15

馬斯克：太陽(yáng)是巨大的免費(fèi)聚變反應(yīng)堆在地球上造“微型版”太愚蠢

12-15

vivo S50系列煥新登場(chǎng)：美學(xué)設(shè)計(jì)融合長(zhǎng)焦影像，2999元起開(kāi)啟全能體驗(yàn)

12-15

抖音電商再升級(jí)規(guī)范：嚴(yán)打“打假測(cè)評(píng)揭黑”蹭熱不當(dāng)獲利行為

12-15

阿里通義百聆開(kāi)源新模型：Fun-CosyVoice實(shí)現(xiàn)3秒音色克隆，F(xiàn)un-ASR輕量化登場(chǎng)

12-15

螞蟻數(shù)科開(kāi)源數(shù)據(jù)分析智能體關(guān)鍵技術(shù) 登頂BIRD-SQL并規(guī)劃持續(xù)開(kāi)源新能力模塊

12-15

富士康擬在美國(guó)建大型工廠，投資1.74億美元，或不為蘋(píng)果代工

12-15

虎鯨文娛推新品牌“tudoo” 首發(fā)Tbox AI主機(jī) 12月18日全網(wǎng)開(kāi)售

12-15

2026年1月BCOM指數(shù)再平衡，黃金白銀或遇技術(shù)性?huà)亯海袌?chǎng)博弈加劇

12-15

海普諾凱能立多全新升級(jí)，科研護(hù)航低敏配方，精準(zhǔn)滿(mǎn)足“敏寶”家庭需求

12-15

摩根大通：存儲(chǔ)巨頭市值將向1.5萬(wàn)億美元進(jìn)發(fā)，2027年供需仍緊俏

12-15

朱雀三號(hào)回收試驗(yàn)雖未成功，總指揮戴政稱(chēng)離“圓滿(mǎn)”僅差40米

12-15

點(diǎn)擊查看更多 +

全站最新

廣汽高域布局飛行汽車(chē)矩陣，GOVY AirCab進(jìn)入適航審定或2026年量產(chǎn)交付

奔馳“Mission X”計(jì)劃新突破：螺絲組裝車(chē)燈，環(huán)保與經(jīng)濟(jì)雙贏

回歸“老本行”：smart #2雙門(mén)純電小車(chē)啟動(dòng)路試

比亞迪第1500萬(wàn)輛新能源汽車(chē)即將下線

比亞迪海豚四周年慶：第100萬(wàn)輛整車(chē)下線領(lǐng)跑?chē)?guó)內(nèi)A0級(jí)純電市場(chǎng)

當(dāng)寒武紀(jì)、華為昇騰被同時(shí)適配，商湯科技在下一盤(pán)什么棋？

熱門(mén)內(nèi)容

本欄最新

當(dāng)寒武紀(jì)、華為昇騰被同時(shí)適配，商湯科技在下一盤(pán)什么棋？

抖音電商再升級(jí)規(guī)范：嚴(yán)打違規(guī)蹭熱打假測(cè)評(píng)，凈化網(wǎng)絡(luò)購(gòu)物環(huán)境

科大訊飛助聽(tīng)器深度評(píng)測(cè)：AI賦能聽(tīng)力，舒適與音質(zhì)如何雙在線？

哈啰陷雙重困境：兩輪電動(dòng)車(chē)斷服引維權(quán)，Robotaxi撞人致信任危機(jī)

凱迪拉克Optiq初體驗(yàn)：配置豐富價(jià)格親民，能否撼動(dòng)德系電動(dòng)SUV地位？

魏牌九年沉浮錄：從頻繁換帥到高山奪冠，品牌再迎關(guān)鍵轉(zhuǎn)折？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶(hù)提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

?阿里推出新語(yǔ)音模型“百聆”：三秒錄音實(shí)現(xiàn)多語(yǔ)言與情感切換