近日,人工智能領域傳來新動向,深度求索公司即將推出一款備受矚目的全新大模型——DeepSeek V3.2。這款模型計劃在國慶假期前完成正式發布,其基礎版本(V3.2-Base)已悄然上傳至Hugging Face平臺,但目前處于隱藏狀態,普通用戶暫時無法直接訪問。
據技術文檔披露,DeepSeek V3.2的參數規模高達6850億,采用BF16-F8_E4M3-F32張量類型進行計算,并以Safetensors格式存儲模型權重。這種配置在同類模型中屬于較高水平,顯示出開發團隊在算力優化和存儲效率上的技術追求。不過,截至目前,官方尚未發布完整的模型卡片,也未部署可供調用的推理服務,開發者社區暫時無法進行實際測試。
與該系列此前模型的發布策略不同,此次DeepSeek V3.2選擇在技術文檔準備尚未完全就緒時提前上傳基礎版本,這種“先存后釋”的節奏引發了AI社區的廣泛討論。部分開發者認為這可能是為后續快速迭代預留空間,也有觀點指出這或許與當前大模型領域的競爭態勢有關。盡管具體發布細節仍待官方確認,但可以預見的是,這款參數規模龐大的新模型將為行業帶來新的技術參考。











