滾動資訊

英偉達攜手Mistral AI：開源模型性能飆升，從云端到邊緣全場景賦能

時間：2025-12-03 21:02:14 來源：互聯(lián)網編輯：快訊 IP：北京 發(fā)表評論無障礙通道

英偉達與法國人工智能初創(chuàng)企業(yè)Mistral AI的合作取得突破性進展，雙方聯(lián)合推出的新一代開源模型家族在性能、能效和部署靈活性方面實現顯著提升。通過整合英偉達最新芯片技術，Mistral AI的模型在云端到邊緣設備的全場景應用中展現出強大競爭力，標志著開源AI技術向實用化階段邁出關鍵一步。

核心成果體現在Mistral Large 3大型模型的性能飛躍上。該混合專家模型（MoE）采用675億總參數架構，其中410億參數處于活躍狀態(tài)，配合25.6萬token的超大上下文窗口，在英偉達GB200 NVL72系統(tǒng)上實現每秒處理超500萬個token的能效表現。相較于前代H200芯片方案，新系統(tǒng)在保持精度不變的前提下，將單次響應成本降低90%，同時能源效率提升10倍。這種突破得益于三項關鍵技術：Wide Expert Parallelism技術通過優(yōu)化內存分配實現專家模塊的高效協(xié)同；NVFP4低精度推理技術將計算內存需求壓縮40%；Dynamo分布式框架則通過解耦預填充與解碼階段，使長文本處理速度提升3倍。

針對邊緣計算場景，Ministral 3系列推出九款輕量化模型，覆蓋30億至140億參數規(guī)模，每個參數等級均提供基礎版、指令優(yōu)化版和推理加速版三種變體。這些模型支持12.8萬至25.6萬token的上下文處理，并具備多語言視覺理解能力。在硬件適配方面，模型在RTX 5090顯卡上達到每秒385個token的推理速度，在Jetson Thor嵌入式設備上通過vLLM框架實現8并發(fā)273token/秒的處理能力。通過與Ollama、llama.cpp等工具鏈的深度優(yōu)化，開發(fā)者可在單GPU環(huán)境下部署機器人控制、無人機導航、車載助手等實時性要求嚴苛的應用。

商業(yè)化進程方面，Mistral AI正加速構建企業(yè)服務生態(tài)。本周與匯豐銀行簽署的金融領域合作協(xié)議，涵蓋風險評估、文檔處理等核心業(yè)務場景。物理人工智能領域已啟動三項重大合作：與新加坡內政科技局聯(lián)合開發(fā)安防機器人，攜手德國Helsing公司研發(fā)軍用無人機智能系統(tǒng)，并為Stellantis集團提供車載語音交互解決方案。技術輸出層面，Mistral Large 3和Ministral-14B-Instruct模型已通過英偉達API目錄開放調用，企業(yè)用戶可借助NIM微服務框架在任意GPU基礎設施上快速部署，所有模型代碼均可在Hugging Face平臺獲取。

該公司聯(lián)合創(chuàng)始人Guillaume Lample指出，經過垂直領域微調的中小型模型，在90%的企業(yè)應用場景中可達到與閉源大模型相當的效果，而部署成本降低75%，響應速度提升5倍。這種技術路線正獲得資本市場認可——2024年9月完成的17億歐元融資中，除英偉達戰(zhàn)略注資外，荷蘭ASML集團投入13億歐元，推動公司估值突破117億歐元。隨著與OpenAI、谷歌等頭部企業(yè)的競爭加劇，Mistral AI通過開源策略構建的開發(fā)者生態(tài)，正在重塑AI技術的商業(yè)化路徑。

12-03

亞馬遜推Trainium3芯片：性能能效雙提升，Trainium4將支持英偉達技術

12-03

亞馬遜云科技發(fā)布三款AI智能體，Kiro自主編程數日，助力編碼效率提升

12-03

谷歌再出招：測試將搜索AI概覽與AI模式融合直面OpenAI競爭

12-03

ChatGPT對話中突現Peloton推薦引付費用戶反感 OpenAI緊急回應優(yōu)化體驗

12-03

一加Ace 6T原神神里綾華定制機上架預約驍龍8芯+豐富定制禮盒來襲

12-03

摩托羅拉與Bose聯(lián)合打造Soundflow智能音箱或成智能家居新選擇

12-03

聯(lián)想ISG上海大規(guī)模裁員？“冷血”操作與亮眼業(yè)績反差引熱議

12-03

OpenAI遇勁敵：谷歌Gemini崛起，奧特曼拉響“紅色警報”應對挑戰(zhàn)

12-03

安卓手機安全警報：谷歌2025年12月更新緊急修復107個漏洞

12-03

小米財報亮眼！CFO透露手機與AIoT毛利率穩(wěn)定超20%

12-03

真我15 Pro《權力的游戲》限定版12月8日開售，熱感變色設計重現經典名場面

12-03

奧特曼拉響紅色警報，大語言模型是否已觸達發(fā)展天花板？

12-03

馬斯克轉發(fā)擎天柱實驗室跑步視頻，僅4秒團隊稱刷新紀錄，量產線將啟

12-03

豆包手機助手新技能上線：自動關廣告還能助用戶收集螞蟻森林能量

12-03

點擊查看更多 +

全站最新

加和科技獲CAAC數委會“杰出貢獻獎”，數據智能與AI賦能品牌穩(wěn)健增長

亞馬遜云科技發(fā)布三款AI Agent：革新軟件構建、安全與運維新路徑

《中國AI+互聯(lián)網媒體行業(yè)研究報告》出爐：AI賦能，媒體生態(tài)煥新升級

互聯(lián)網賦能物流革新：效率躍升、體驗升級與綠色轉型并行

華為“AI數智南研”項目入選WAA優(yōu)秀案例引領數智園區(qū)創(chuàng)新發(fā)展

唐山文旅置業(yè)發(fā)展集團增資至10.7億增幅約79%

熱門內容

本欄最新

加和科技獲CAAC數委會“杰出貢獻獎”，數據智能與AI賦能品牌穩(wěn)健增長

亞馬遜云科技發(fā)布三款AI Agent：革新軟件構建、安全與運維新路徑

《中國AI+互聯(lián)網媒體行業(yè)研究報告》出爐：AI賦能，媒體生態(tài)煥新升級

亞馬遜云科技發(fā)布三款AI智能體，Kiro自主編程數日助力開發(fā)效率提升

AWS re：Invent2025：亞馬遜云科技以全棧AI創(chuàng)新引領Agent變革時代

2025快手年終購物狂歡節(jié)來襲，多主題活動助力年末消費熱潮

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

英偉達攜手Mistral AI：開源模型性能飆升，從云端到邊緣全場景賦能