近日,人工智能領(lǐng)域傳來新動向,深度求索公司即將推出一款備受矚目的全新大模型——DeepSeek V3.2。這款模型計(jì)劃在國慶假期前完成正式發(fā)布,其基礎(chǔ)版本(V3.2-Base)已悄然上傳至Hugging Face平臺,但目前處于隱藏狀態(tài),普通用戶暫時(shí)無法直接訪問。
據(jù)技術(shù)文檔披露,DeepSeek V3.2的參數(shù)規(guī)模高達(dá)6850億,采用BF16-F8_E4M3-F32張量類型進(jìn)行計(jì)算,并以Safetensors格式存儲模型權(quán)重。這種配置在同類模型中屬于較高水平,顯示出開發(fā)團(tuán)隊(duì)在算力優(yōu)化和存儲效率上的技術(shù)追求。不過,截至目前,官方尚未發(fā)布完整的模型卡片,也未部署可供調(diào)用的推理服務(wù),開發(fā)者社區(qū)暫時(shí)無法進(jìn)行實(shí)際測試。
與該系列此前模型的發(fā)布策略不同,此次DeepSeek V3.2選擇在技術(shù)文檔準(zhǔn)備尚未完全就緒時(shí)提前上傳基礎(chǔ)版本,這種“先存后釋”的節(jié)奏引發(fā)了AI社區(qū)的廣泛討論。部分開發(fā)者認(rèn)為這可能是為后續(xù)快速迭代預(yù)留空間,也有觀點(diǎn)指出這或許與當(dāng)前大模型領(lǐng)域的競爭態(tài)勢有關(guān)。盡管具體發(fā)布細(xì)節(jié)仍待官方確認(rèn),但可以預(yù)見的是,這款參數(shù)規(guī)模龐大的新模型將為行業(yè)帶來新的技術(shù)參考。











