在近日舉辦的英偉達秋季GTC大會上,公司首席執行官黃仁勛向外界展示了全新的Vera Rubin超級計算平臺。這一平臺被英偉達稱為“超級芯片”,其命名靈感源自著名天文學家薇拉·魯賓,象征著對宇宙探索與科學前沿的致敬。
Vera Rubin平臺由全新的Vera CPU與Rubin GPU共同構成,旨在同時支持人工智能大模型訓練、科學計算以及國家級超級計算任務。首批系統將部署于美國洛斯阿拉莫斯國家實驗室,由惠普企業協助英偉達構建兩臺新一代超級計算機“Mission”和“Vision”,分別服務于國家安全和開放科研領域。
這一平臺的推出正值英偉達面臨激烈競爭之際。其老對手AMD剛剛贏得美國能源部價值10億美元的超算合同,給英偉達在高性能計算市場帶來了顯著壓力。Vera Rubin的亮相因此被視為英偉達在戰略層面的一次重要回應。
從技術架構來看,Vera Rubin是英偉達迄今為止最復雜的計算平臺,分為普通版Vera Rubin NVL144和高端版NVL576。NVL144平臺將采用兩顆全新設計的芯片,其中Rubin GPU由兩顆Reticle大小的芯片組成,FP4性能高達50 PFLOP,并配備288 GB的下一代HBM4顯存。平臺還搭載一顆88核Vera CPU,采用定制ARM架構,擁有176個線程,以及高達1.8 TB/s的NVLINK-C2C互連能力。
在性能擴展方面,NVL144平臺將提供3.6 Exaflops的FP4推理算力和1.2 Exaflops的FP8訓練算力,較之前的GB300 NVL72提升3.3倍。其內存帶寬和快速內存容量也顯著增加,分別達到13 TB/s和75 TB,比GB300提升60%。NVLINK和CX9功能的額定速度分別達到260 TB/s和28.8 TB/s。
NVL144主要面向AI模型的極大規模訓練與實時推理,預計將于2026年下半年發布。更強大的NVL576平臺則計劃于2027年推出,其FP4推理性能將達到15 Exaflops級別,FP8訓練性能達5 Exaflops。
黃仁勛強調,Rubin平臺的設計并非僅針對AI應用,而是兼顧了科研與AI的雙重需求。因此,平臺在低精度AI性能與傳統高性能計算能力之間取得了平衡,仍支持高精度FP64科學計算,確保物理模擬、氣候模型和量子化學等科研任務能夠充分發揮性能。
洛斯阿拉莫斯實驗室的Vision系統將率先采用Vera Rubin架構,用于開放科學研究與AI模型開發;而Mission系統則專注于國家核安全任務,計劃于2027年正式上線。據預計,Vision的性能將至少比其前代系統Venado提升一倍以上。
Rubin平臺支持NVLink Gen6與CX9網絡,可在節點間提供高達260 TB/s和28.8 TB/s的總帶寬,使數千個GPU能夠以接近單機的延遲進行協同計算。這一特性對于訓練超大規模多模態模型尤為重要。
在大會上,英偉達還推出了一項名為NVQLink的互連技術。黃仁勛將其形容為“連接量子和經典超級計算機的羅塞塔石碑”,該技術將量子處理器與傳統超級計算機整合為一個統一系統,標志著量子GPU計算時代的到來。
NVQLink能夠將量子處理器和控制硬件系統的多種方法直接連接到AI超級計算機上,幫助量子研究人員克服擴展硬件時面臨的集成難題。作為一種開放系統架構,它可以將GPU計算與量子處理器緊密結合,從而為量子超級計算機帶來加速。
據了解,量子比特是量子計算機處理信息的基本單位,其運行需要復雜的校準技術、量子誤差校正技術和控制算法。此前,這些算法必須依賴傳統超級計算機的低延遲和高吞吐量連接才能控制量子比特誤差,實現相關量子應用。而NVQLink提供的互連能力為打造跨行業應用提供了必要環境。
目前,用戶可以通過與英偉達CUDA-Q軟件平臺的集成來訪問NVQLink,實現CPU和GPU的無縫利用,并創建關于量子處理器的應用程序。該技術已為17個量子行業機構、5個控制器行業機構和9家實驗室實現了量子與GPU計算的互連,并被應用于美國布魯克海文國家實驗室等機構,助力量子研究人員實現大規模量子計算和量子糾錯所需的控制算法,加速化學和材料領域的下一代應用開發。





