滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

谷歌Gemini 2.5音頻模型來襲：實時翻譯還能捕捉情緒，開啟交互新時代

時間：2025-12-15 09:05:56 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

谷歌近日發布了一項突破性技術——Gemini 2.5 Flash原生音頻模型，將AI語音交互推向了全新高度。這項技術不僅實現了實時語音翻譯，還能精準捕捉并復刻說話者的語調、節奏和情感，讓AI對話更加自然流暢，仿佛與真人交流一般。

想象一下這樣的場景：你漫步在異國街頭，周圍是陌生的語言和嘈雜的環境。一位當地人突然用方言向你問路，語速急促且帶著焦慮。過去，你可能需要手忙腳亂地打開翻譯軟件，等待機械化的語音輸出。而現在，只需佩戴耳機，就能立刻聽到用母語流暢翻譯的問候，甚至能感受到對方急切的情緒。更神奇的是，你的回答也會被自動轉換成對方的語言，并保留你的語氣和表達方式。這種無縫的跨語言交流體驗，正是谷歌最新推出的Gemini 2.5 Flash原生音頻模型帶來的變革。

與傳統語音交互技術不同，Gemini 2.5 Flash原生音頻模型跳過了“語音轉文字-AI處理-文字轉語音”的繁瑣流程，直接實現“聽-想-說”的無縫銜接。這種原生處理方式不僅大幅提升了響應速度，還能完整保留人類交流中的微妙細節，如語氣、停頓和情感。例如，當對方用歡快的語調提問時，翻譯后的聲音也會充滿活力；若對方語氣低沉猶豫，回復中也會自然流露出遲疑。這種情感層面的精準傳遞，在商務談判或敏感對話中尤為重要。

目前，這項技術的實時語音翻譯功能已在美國、墨西哥和印度的安卓設備上開啟Beta測試，iOS版本也將陸續推出。其核心優勢包括：支持70多種語言和2000多個語言對，覆蓋全球主流語言；具備多語言混輸能力，可同時處理對話中的多種語言；針對嘈雜環境優化，具備強大的噪聲過濾能力；以及獨特的風格遷移功能，能完美復刻說話者的情緒和表達方式。雙向對話模式可自動識別說話者，無需手動切換，真正實現“無感”翻譯。

對于開發者而言，Gemini 2.5 Flash原生音頻模型同樣帶來了重大突破。在函數調用方面，新模型能更精準地獲取實時信息，并將數據無縫融入對話，避免打斷交流流暢性。在指令遵循測試中，其準確率從84%提升至90%，可更可靠地執行復雜指令。同時，多輪對話能力顯著增強，能更有效地記憶上下文，保持對話連貫性和邏輯性。這些提升使得構建企業級AI客服的門檻大幅降低，開發者可輕松創建能聽、能說、能辦事的智能助手。

除了原生音頻模型，谷歌還推出了一項實驗性工具——Disco。這款來自Google Labs的產品內置了基于Gemini 3打造的GenTabs功能，可主動理解用戶需求，將雜亂的標簽頁和聊天記錄轉化為交互式網絡應用。例如，用戶只需簡單描述需求，如“制定周餐計劃”或“教孩子認識行星”，Disco就能自動生成專屬工具，無需編寫代碼。目前，macOS版本已開放排隊體驗，盡管仍處于早期階段，但已展現出將“瀏覽”升級為“創造”的潛力。

更多>同類資訊

SpaceX估值飆至8000億美元，2026年IPO或成全球最大規模上市交易

如果馬斯克最終決定推進IPO，這將是他又一次引發市場轟動的大動作。這家由馬斯克掌舵的公司，目標是為整體業務爭取約1.5萬億美元的估值，這一水平將接近沙特阿美在2019年創紀錄上市時確立的市值。不過，約翰…

12-15

12月下半月手機圈再掀熱潮三款新機齊發最高售價直逼萬元

該系列定位中高端，定位低于此前發布的華為Mate 80系列，將推出包括華為nova 15和華為nova 15Pro在內的多款機型。作為該系列第四款機型，小米17 Ultra聚焦專業級移動攝影體驗，預計將搭載…

12-15

雷軍回應“準新車”引爭議，運損車貼新標，消費者質疑誠意與責任

網友們的不滿，其實并非針對小米出售修過的車這件事本身，而是反感明明是“運損車”，卻非要貼上“新”字的標簽，更不認同品牌方還想靠著所謂的“透明化”操作，讓消費者對此心懷感激。但小米的操作邏輯，更像是互聯網行業的…

12-15

雷軍詳解小米“準新車”開售，全年交付量有望突破40萬輛大關

瑞財經吳文婷12月12日，小米汽車微博官方賬號發布消息稱，今早11點，小米汽車“現車選購”新增準新車上架開售，消費者可來小米汽車APP選購。據介紹，現車包含全新現車、官方展車、準新車，已通過嚴格質檢，可享快速…

12-15

一加15：3999元起售卻配置拉滿，3500元檔位性價比“王者”來襲

搭載3nm驍龍8至尊芯、7300mAh電池+120W快充、165Hz電競屏和全焦段三攝，用旗艦配置打出中端價格，成為3500元檔位最兇猛的'價格屠夫。設計細節上，一加15延續簡潔利落的「金屬魔方」Deco設計…

12-15

探秘小米汽車超級工廠：科技賦能打造新能源智能制造新標桿

在中國汽車工業飛速發展的浪潮中，小米汽車超級工廠如一顆璀璨的明珠，正閃耀在京華大地上。這個由小米公司投資建設的大型現代化汽車生產基地，展現了前所未有的科技魅力和制造實力。涂裝車間則以環保為先，采用80%水性涂…

12-15

新邁騰B9：智慧配置升級通勤體驗，多重福利助力輕松購車

40W高功率無線充電模塊，兼容主流手機品牌，上班途中就能為手機充滿電，避免下班時面臨電量不足的尷尬；遠程控制功能支持通過手機APP啟動發動機、調節空調溫度，冬天提前預熱、夏天提前降溫，上車就能享受舒適溫度，無…

12-15

知乎2025電Club新知技術大會：聚焦新能源，共探技術革新與信任構建新路徑

基于這些專業討論，知乎在現場發布了“2025知乎汽車年度十問”，評選出過去一年最受用戶關注的十大汽車問題和精選回答，從智駕趨勢到安全駕駛，從行業新規到個人消費，每一個問題都關乎當下消費者對汽車行業的困惑，因此…

12-15

特斯拉Robotaxi新突破：奧斯汀街頭開啟無安全員無乘員路測

12-15

特斯拉奧斯汀開啟Robotaxi真無人測試完全自動駕駛目標近在咫尺

12-15

馬斯克旗下Grok AI再“翻車”：邦迪海灘槍擊事件回應混亂不堪

12-15

亞馬遜Kindle新功能“向本書提問”上線iOS，助力閱讀但存版權爭議

12-15

董明珠回應空調“鋁代銅”未達同等技術保障正研究

12-15

李飛飛世界模型公司招聘要求：AI技能比文憑更重要

12-15

谷歌推出耳機實時翻譯測試版：引入Gemini高級功能

12-15

點擊查看更多 +

全站最新

雷軍回應“準新車”引爭議，運損車貼新標，消費者質疑誠意與責任

雷軍詳解小米“準新車”開售，全年交付量有望突破40萬輛大關

新邁騰B9：智慧配置升級通勤體驗，多重福利助力輕松購車

知乎2025電Club新知技術大會：聚焦新能源，共探技術革新與信任構建新路徑

特斯拉Robotaxi新突破：奧斯汀街頭開啟無安全員無乘員路測

汽車熄火剎車變硬別慌！行駛中突發熄火3步“保命”操作速收藏

熱門內容

本欄最新

特斯拉奧斯汀開啟Robotaxi真無人測試完全自動駕駛目標近在咫尺

2025知乎電Club新知技術大會成都啟幕聚焦AI賦能下新能源汽車信任與未來

2025科大訊飛平板怎么選？7款熱門型號深度測評，幫孩子找到學習好幫手

小米汽車銷量揭秘：這座城市占比7%領跑全國，年輕高收入群體成主力軍

不造硬件的“靈魂掌控者”：豆包與鴻蒙智駕的產業變革路徑與未來角逐

誤闖紅燈別慌神！掌握這些應對法，保住駕照分還能少罰款

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

谷歌Gemini 2.5音頻模型來襲：實時翻譯還能捕捉情緒，開啟交互新時代