近日,英偉達(dá)宣布與大型語言模型開發(fā)商 Mistral AI 達(dá)成合作,旨在加速開發(fā)和部署一系列新的開放源模型。根據(jù)雙方的合作協(xié)議,英偉達(dá)將利用其強(qiáng)大的平臺(tái)來支持 Mistral 最新推出的模型家族 ——Mistral 3。
Mistral 3 系列被描述為開放源、多語言和多模態(tài)的,且針對(duì)英偉達(dá)的超級(jí)計(jì)算和邊緣平臺(tái)進(jìn)行了優(yōu)化。該模型采用混合專家(MoE)架構(gòu),這種架構(gòu)的特點(diǎn)是只有與特定任務(wù)相關(guān)的部分會(huì)被激活,從而實(shí)現(xiàn)更高效和更精確的部署。英偉達(dá)表示,結(jié)合其 GB200 NVL72 系統(tǒng)與 Mistral 的 MoE 架構(gòu),將使企業(yè)能夠更高效地部署和擴(kuò)展大型模型,充分利用 “先進(jìn)的并行性” 和硬件優(yōu)化。
Mistral 3 模型具有 410 億個(gè)活躍參數(shù)、6750 億個(gè)總參數(shù)以及 256K 的大上下文窗口,能夠?yàn)槠髽I(yè) AI 工作負(fù)載提供良好的可擴(kuò)展性、效率和適應(yīng)性。雙方還透露,該新模型將于 12 月 2 日全面上線,可在云端、數(shù)據(jù)中心及邊緣設(shè)備上使用。
此次合作還延續(xù)了兩家公司之前的合作基礎(chǔ),包括為聊天機(jī)器人和編碼任務(wù)開發(fā)的 Mistral NeMo 12B 語言模型。Mistral 還發(fā)布了九個(gè)小型語言模型,旨在幫助開發(fā)者在各種設(shè)備上運(yùn)行 AI。這些模型設(shè)計(jì)用于在英偉達(dá)的硬件上運(yùn)行,包括 Spark、RTX PC 和筆記本電腦,以及 Jetson 設(shè)備。開發(fā)者可以通過 AI 框架 Llama.cpp 和 Ollama 訪問這些模型。
Mistral 3 家族對(duì)研究人員和開發(fā)者開放,這一舉措被認(rèn)為是幫助 “民主化” 前沿 AI 的努力。值得一提的是,英偉達(dá)還在同一周內(nèi)宣布對(duì)芯片制造商 Synopsys 投資 20 億美元,這進(jìn)一步強(qiáng)調(diào)了公司在 AI 和計(jì)算領(lǐng)域的實(shí)力。
劃重點(diǎn):










