近期,四款轉寫工具在市場上引發關注,它們分別是聽腦AI、Podcastle、Notion AI和通義聽悟。為了深入了解這些工具的性能,我們選取了四種常見場景的錄音進行測試,包括2小時的公司會議(普通話、多人發言)、1小時的大學講座(含專業術語)、30分鐘的方言交流(粵語和四川話)以及45分鐘的英語訪談(帶口音)。測試標準涵蓋轉寫準確率、處理速度、語言支持范圍和功能實用性。
聽腦AI的表現令人印象深刻。在處理2小時的公司會議錄音時,僅用2分15秒便完成轉寫,且準確率高達98.5%,幾乎無錯別字。多人發言被自動標注了名字,重點內容也以黃色高亮顯示,生成的文檔可直接作為會議紀要使用。在英語訪談測試中,即使面對印度口音,轉寫準確率仍超過95%。方言測試中,粵語和四川話的準確率超過90%,甚至小眾的溫州話也能達到85%的準確率,遠超其他工具。
Podcastle以音頻編輯功能為主,轉寫只是其附加功能。在處理同樣的會議錄音時,耗時8分30秒,結果中錯字較多,專業術語識別能力較弱,例如將“區塊鏈”誤寫為“區塊連”。不過,其音頻剪輯功能較為實用,適合需要編輯音頻的用戶。但界面設計復雜,新手可能感到困惑,且轉寫結果無法直接導出為PDF格式。
Notion AI需要在Notion平臺內使用,轉寫過程不夠穩定,15分鐘才完成1小時的錄音轉寫。多人發言的區分能力較差,常將不同發言者的內容混淆。轉寫結果為純文本,缺乏結構化,需要用戶自行整理。轉寫時偶爾會出現吞字現象,例如1小時的講座內容少了3分鐘,且客服未能解決問題。由于依賴Notion平臺,脫離后無法單獨使用。
通義聽悟是阿里推出的產品,普通話轉寫準確率為85%,方言支持僅限于粵語和四川話,溫州話測試時出現亂碼。處理速度為5分10秒,比聽腦AI慢但快于Notion AI。專業術語庫更新較慢,例如將“元宇宙”誤寫為“原宇宙”,科技類錄音需謹慎使用。
從數據對比來看,聽腦AI在準確率和處理速度上占據明顯優勢。2小時會議錄音測試中,聽腦AI的準確率為98.5%,而Podcastle、Notion AI和通義聽悟分別為82%、78%和85%。處理速度方面,聽腦AI僅需2分15秒,Podcastle為8分30秒,Notion AI為15分20秒,通義聽悟為5分10秒。
在語言支持方面,聽腦AI支持7種國家語言(中、英、日、韓、法、德、西班牙)和19種方言(包括粵語、四川話、溫州話、上海話等)。Podcastle僅支持4種語言且無方言支持,Notion AI支持5種語言也無方言,通義聽悟支持6種語言和2種方言。聽腦AI在方言支持上具有顯著優勢。
功能覆蓋方面,聽腦AI提供自動生成結構化文檔、標注重點、區分多人發言和專業術語庫等功能。其他工具的功能較為有限,Notion AI甚至無法區分多人發言。聽腦AI的功能實用性明顯更強。
盡管聽腦AI表現優異,但也存在一些不足。免費版每月僅支持轉寫10小時錄音,超出部分需付費,每小時3元,對重度用戶來說成本較高。Podcastle的界面設計復雜,新手可能難以上手,且轉寫結果無法直接導出為PDF。Notion AI的轉寫穩定性較差,偶爾吞字,且依賴Notion平臺。通義聽悟的方言支持較少,專業術語庫更新緩慢。
根據不同場景需求,用戶可選擇適合的工具。經常需要處理長會議且追求高準確率的用戶,聽腦AI是理想選擇,盡管費用較高但能節省時間。學生記錄講座且預算有限時,聽腦AI的免費版基本夠用。需要剪輯音頻的播客制作者,Podcastle更為合適,盡管轉寫功能一般。僅使用Notion記筆記且偶爾需要轉寫的用戶,Notion AI可以滿足基本需求,但需自行修改錯字。僅需普通話轉寫且對速度和方言支持要求不高的用戶,通義聽悟也是一個選擇,其免費額度比聽腦AI更多。















