滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

英偉達發布TiDAR：單步生成多個Token吞吐量提升600%

時間：2025-12-03 09:49:47 來源：IT之家編輯：快訊 IP：北京 發表評論無障礙通道

12 月 2 日消息，科技媒體 Tom's Hardware 今天（12 月 2 日）發布博文，報道稱英偉達在最新論文中，詳述名為 TiDAR 的新型 AI 解碼方法，巧妙融合了自回歸（Autoregressive）與擴散（Diffusion）兩種模型機制，利用 GPU 的“空閑槽位”加速文本生成。

自回歸（Autoregressive）是一種生成方式，AI 必須根據上一個字才能猜出下一個字，像接龍一樣，只能按順序一個接一個生成。

擴散（Diffusion）常用于 AI 繪畫的技術，通過逐步去除噪點來生成內容，在 TiDAR 中，它被用來一次性“猜”出好幾個可能的詞，供后續篩選。

援引博文介紹，當前的語言模型通常一次生成一個 Token（詞元），這種逐個生成的機制導致了極高的計算成本和延遲。

TiDAR 的核心理念在于利用模型推理過程中未被使用的“空閑槽位”，在不犧牲生成質量的前提下，通過單步生成多個 Token 來大幅提升響應速度并降低 GPU 運行時長。

在技術原理方面，TiDAR 創新性地訓練單個 Transformer 模型同時執行兩項任務：標準的自回歸“下一詞預測”和基于擴散的“并行起草”。

不同于以往依賴獨立草稿模型的投機解碼（Speculative Decoding），TiDAR 通過結構化的注意力掩碼（Attention Mask）將輸入分為三個區域：前綴區、驗證區和起草區。

投機解碼是一種加速技術，先用一個小模型快速草擬一段話，再由大模型進行檢查和修正。TiDAR 試圖在同一個模型內完成這兩步。

這種設計讓模型在利用擴散頭并行起草新 Token 的同時，還能通過自回歸頭驗證這些草稿，最關鍵的是，它確保了 KV 緩存（KV Cache）的結構有效性，解決了早期擴散解碼器面臨的部署難題。

研究團隊基于 Qwen 系列模型進行了測試。在 Humaneval 和 GSM8K 等基準測試中，TiDAR 的準確率與基準模型持平甚至略有提升。

在速度方面，15 億參數版本的 TiDAR 模型實現了 4.71 倍的吞吐量增長；而 80 億參數版本的表現更為搶眼，吞吐量達到了 Qwen3-8B 基準的 5.91 倍。這表明在當前測試規模下，TiDAR 能有效利用 GPU 的顯存帶寬，在不增加額外顯存搬運的情況下生成更多 Token。

該媒體指出盡管實驗數據亮眼，TiDAR 目前仍面臨規模擴展的挑戰。論文中的測試僅限于 80 億參數以下的中小模型，且未涉及定制化的內核級優化（如 fused kernels），僅使用了標準的 PyTorch 環境。

隨著模型參數量和上下文窗口的擴大，計算密度可能會飽和，從而壓縮“多 Token 擴展”的成本優勢。研究人員表示，未來將在更大規模的模型上進行驗證，以確定該技術是否能成為云端大規模 AI 部署的實用替代方案。

更多>同類資訊

眾擎全尺寸人形機器人T800發布：18萬元起售

12-03

阿童木天兵一號ATOM01人形機器人迭代升級發布

12-03

IBM CEO：以現有成本建設AI數據中心“幾乎不可能回本”

12-03

陳天橋發文：當管理退出認知升起，KPI崩塌了

12-03

“豆包”3499元的手機一天就賣光，閑魚掛價最高近萬元

12-03

AI聊天機器人ChatGPT今天突發故障，OpenAI緊急修復

12-03

押注OpenAI，軟銀痛斬英偉達

12-03

國內作物學界迎首位AI科研伙伴“豐登” 明年將全球上線助力育種研究

12-03

神舟二十號舷窗現細微裂紋中國緊急發射二十二號飛船保障安全

相關負責人介紹，針對出現異常的神舟二十號飛船，后續將安排神舟二十一號任務的航天員在出艙作業期間，對舷窗裂紋情況進行近距離觀察與評估。后續，神舟二十號將按計劃以無人狀態再入返回，整個返回過程將采集大量真實環境…

12-03

本周硬核突破！航空航天到氣象預報，我國多領域成果閃耀世界

經過為期一年的艙外暴露實驗后，首批用于月面建造研究的“月壤磚”樣品，日前隨神舟二十一號飛船順利返回地球。我國自主研制的全球首個氣溶膠-氣象耦合預報人工智能模型，在不到1分鐘的時間內，可以完成未來5天、涵蓋…

12-03

北京首座太空算力中心加速建設 “辰光一號”將開啟太空算力新篇章

北京市科委、中關村管委會副主任龔維冪表示，作為重要信息基礎設施，太空數據中心是商業航天和人工智能領域戰略交叉的重要方向，太空數據中心將成為北京國際科技創新中心建設的重點布局方向之一，會對其加大支持力度、加快推…

12-03

北京發力太空算力領域：“辰光一號”將升空太空數據中心未來可期

IT之家從文章獲悉，太空數據中心創新聯合體就是以太空數據中心建設與應用為核心目標，通過整合國內商業航天領域的創新鏈、產業鏈資源，協同開展多項前沿交叉技術、關鍵核心技術和核心零部件攻關。據北京星空院院長張善…

12-03

碳化硅市場風云變幻：從汽車到AI，探尋下一個盈利增長點

12-03

2025專家展望：數字經濟核心產業比重將升至15%，AI與數據成新引擎

12-03

理想Q3財報背后的十年布局：組織煥新、產品升級、技術突圍

12-03

點擊查看更多 +

全站最新

生學教育與火山引擎強強聯合：AI技術賦能，開啟數智教育新征程

AI技術平權時代：普通人用一句話“搓”出生活新工具

12月商超經營全攻略：從營銷策劃到陳列規劃，沖刺年終消費高峰

49.9元眉筆牽手高端絲芙蘭：是美妝寒冬下的突圍還是錯位博弈？

盒馬“大姐”李衛平接棒高鑫零售，能否帶領商超巨頭走出業績陰霾？

比亞迪11月狂銷48萬輛創年內新高海外銷量同比激增297%領跑全球

熱門內容

本欄最新

階躍星辰開源GELab-Zero：GUI Agent模型落地消費級，多終端一鍵部署成亮點

嵐圖追光L 12月10日上市，以實力重塑中大型轎車新標桿

魏牌藍山智能進階版實車亮相：VLA大模型賦能，續航超1300km對標理想L8

智能舒適新標桿！東風日產N6上市，打造家庭出行新體驗

易鑫獲評“年度AI應用場景突破企業” 開源大模型引領汽車金融智能化升級

第七屆工業互聯網大賽新興產業賽落幕共繪“工業互聯網×新興產業”新藍圖

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

英偉達發布TiDAR：單步生成多個Token吞吐量提升600%