AIPress.com.cn報道
NVIDIA正式發布CUDA 13.1,并推出過去二十年來幅度最大的一次更新——CUDA Tile編程模型。這項新功能被視為CUDA平臺的重大里程碑,旨在讓AI開發過程變得更簡單、更高效,尤其是面向最新的Blackwell架構GPU。
與傳統CUDA需要程序員手動規劃每個線程執行路徑不同,CUDA Tile允許開發者只需按“Tile(數據塊)”劃分任務,通過更高層的方式描述算法邏輯。至于這些Tile如何分配到線程、是否啟用Tensor Core、如何調度執行,全部交給編譯器和運行時自動完成,開發者可以減少大量硬件適配與性能調優工作。
首批支持CUDA Tile的GPU為Blackwell系列,未來版本將向更多架構擴展。為了保證可持續兼容,NVIDIA推出了CUDA Tile IR——一種面向Tile操作的虛擬指令集,讓代碼在現有和未來的Tensor Core架構上都能運行。同時,NVIDIA還發布了cuTile Python,讓AI開發者可以直接在Python中使用Tile模型進行編程。
隨著AI算力規模持續增長,Tensor已成為核心數據結構,Tensor Core和TMA等硬件的能力也快速提升。CUDA Tile的目標,就是把復雜硬件封裝在底層,讓開發者更專注于模型和算法,而不是線程分配細節,實現更高性能、更低門檻的GPU開發體驗。(AI普瑞斯編譯)











