近日,國家超算互聯(lián)網(wǎng)AI社區(qū)迎來了一位“新成員”——DeepSeek-V3.2-Exp模型。該模型由DeepSeek團(tuán)隊(duì)正式發(fā)布,作為實(shí)驗(yàn)性版本,它標(biāo)志著新一代架構(gòu)探索邁出了重要一步。
DeepSeek-V3.2-Exp是在V3.1-Terminus版本基礎(chǔ)上升級而來,其核心亮點(diǎn)在于引入了DeepSeekSparseAttention(DSA)稀疏注意力機(jī)制。這一創(chuàng)新技術(shù)首次實(shí)現(xiàn)了細(xì)粒度稀疏注意力,在保持模型輸出質(zhì)量穩(wěn)定的同時,顯著提升了長文本場景下的訓(xùn)練和推理效率。據(jù)研發(fā)團(tuán)隊(duì)介紹,DSA機(jī)制通過優(yōu)化注意力計算方式,有效降低了計算資源消耗,為處理大規(guī)模文本數(shù)據(jù)提供了更高效的解決方案。
依托國產(chǎn)深算智能加速卡和全國一體化算力網(wǎng)的支持,DeepSeek-V3.2-Exp現(xiàn)已在國家超算互聯(lián)網(wǎng)AI社區(qū)開放免費(fèi)下載。企業(yè)和開發(fā)者可通過該平臺快速獲取模型文件,開展各類AI應(yīng)用開發(fā)。這一舉措不僅降低了技術(shù)門檻,也為國內(nèi)AI生態(tài)建設(shè)注入了新動力。
目前,超算互聯(lián)網(wǎng)AI社區(qū)已聚集超過700款國內(nèi)外優(yōu)質(zhì)開源模型,形成了一個資源豐富的AI開發(fā)環(huán)境。其中,DeepSeek系列模型占據(jù)重要位置,包括DeepSeek-V3.1-Terminus、DeepSeek-R1-0528、DeepSeek-R1、DeepSeek-V3等多個版本。開發(fā)者登錄社區(qū)后,可一站式體驗(yàn)API調(diào)用、Chatbot在線推理、分布式訓(xùn)練、模型微調(diào)等MaaS服務(wù),覆蓋從原型開發(fā)到生產(chǎn)部署的全流程需求。