滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

中國信通院推出“方升”3.0基準測試，助力AI評測升級與行業(yè)創(chuàng)新發(fā)展

時間：2025-10-10 00:31:34 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

中國信息通信研究院（以下簡稱“信通院”）近日宣布，其自主研發(fā)的“方升”人工智能基準測試體系已完成3.0版本升級，標志著我國AI評測能力邁入新階段。此次升級不僅擴展了基礎測試維度，更首次將全模態(tài)理解、長期記憶等十項高級智能能力納入評測范圍，為工業(yè)制造、金融科技、基礎研究等領域提供了更具針對性的評估框架。

據(jù)介紹，3.0版本在原有評測體系基礎上新增了模型底層特征評估模塊，涵蓋參數(shù)規(guī)模、推理效率等核心指標。針對未來AI發(fā)展方向，體系特別設計了高級智能測試單元，重點考察模型在復雜場景下的多模態(tài)交互、自主決策等能力。信通院相關負責人表示，這種分層設計既能反映當前技術水平，又能為前沿研究提供方向指引。

為保障評測結果的權威性，信通院同步推進了三大基礎設施建設項目。首先是測試數(shù)據(jù)資源擴容，計劃新增300萬條涵蓋多語言、多任務的標準化數(shù)據(jù)，以滿足不同場景下的評測需求。其次是測試方法創(chuàng)新，重點攻關高質量數(shù)據(jù)合成、動態(tài)質量評估等關鍵技術。第三是構建智能評測基座，通過引入多智能體交互仿真環(huán)境，實現(xiàn)對復雜系統(tǒng)協(xié)同能力的精準評估。

在最新完成的季度評測中，141個大模型和7個智能體接受了全面檢驗。測試覆蓋基礎認知、邏輯推理、代碼生成、多模態(tài)理解四大維度。結果顯示，OpenAI的GPT-5在綜合性能上保持領先，但國內(nèi)模型表現(xiàn)可圈可點——阿里巴巴的Qwen3-Max-Preview和月之暗面的Kimi K2在特定場景下已接近國際先進水平。值得注意的是，多模態(tài)模型在圖像識別領域取得突破，但在需要多步驟推理的任務中仍存在提升空間。

代碼應用能力專項測試暴露出行業(yè)共性問題。雖然參評模型在簡單函數(shù)實現(xiàn)上表現(xiàn)優(yōu)異，但在真實項目開發(fā)中的架構設計、錯誤處理等方面明顯不足。專家指出，這反映出當前AI工具從實驗室到產(chǎn)業(yè)應用的轉化過程中，仍需突破工程化能力瓶頸。

隨著評測體系持續(xù)完善，信通院已建立雙月評測機制，定期發(fā)布技術分析報告。相關負責人透露，下一步將重點加強評測標準國際化建設，通過與全球研究機構合作，推動中國AI評測體系獲得更廣泛的國際認可，為技術創(chuàng)新和產(chǎn)業(yè)升級提供有力支撐。

更多>同類資訊

雙11智能眼鏡熱銷背后：AI技術賦能，人機交互新入口崛起

11-13

AI“理解”世界新突破：世界模型如何開啟AI未來新篇章？

11-13

百度2025世界大會發(fā)布AI新成果，李彥宏：AI內(nèi)化將引爆生產(chǎn)力革命

李彥宏在大會上表示，“我們用AI重構搜索結果頁，不是簡單地在搜索結果中插入AI摘要，而是把搜索從一個以文字內(nèi)容和鏈接為主的互聯(lián)網(wǎng)應用，轉化為一個以圖片視頻等富媒體內(nèi)容為主的AI應用。” 在李彥宏看來，AI數(shù)字…

11-13

百度世界大會官宣：“羅永浩”同款慧播星數(shù)字人技術全球開放，互動升級加速出海

后續(xù)，還將發(fā)力東南亞、美國等重點國家和區(qū)域市場，積極拓展 Shopee、Lazada 等平臺。 IT之家注意到，在今年 6 月舉行的百度 AIDay 活動上，百度副總裁、百度電商總經(jīng)理平曉黎宣布，羅永浩將擔…

11-13

李彥宏2025百度世界大會發(fā)聲：AI邁向效果涌現(xiàn) 產(chǎn)業(yè)構建倒金字塔生態(tài)

11月13日舉辦的2025百度世界大會上，百度創(chuàng)始人李彥宏圍繞 AI 技術發(fā)展階段與產(chǎn)業(yè)生態(tài)發(fā)表觀點，指出 AI正從技術演示走向實際應用，產(chǎn)業(yè)結構也在發(fā)生根本性轉變。在 AI 產(chǎn)業(yè)結構層面，李彥宏表示該領…

11-13

AI從“智能涌現(xiàn)”邁向“效果涌現(xiàn)”，李彥宏：百度引領AI產(chǎn)業(yè)結構新變革

李彥宏在大會上表示，“我們用AI重構搜索結果頁，不是簡單地在搜索結果中插入AI摘要，而是把搜索從一個以文字內(nèi)容和鏈接為主的互聯(lián)網(wǎng)應用，轉化為一個以圖片視頻等富媒體內(nèi)容為主的AI應用。” 在李彥宏看來，AI數(shù)字…

11-13

百度世界大會發(fā)布“自我演化”超級智能體百度伐謀助力多領域尋“最優(yōu)解”

在11月13日舉辦的百度世界大會上，百度正式發(fā)布全球首個可商用的“自我演化”超級智能體百度伐謀。百度創(chuàng)始人李彥宏表示，百度伐謀的主要應用場景是在真實的產(chǎn)業(yè)場景中尋找“全局最優(yōu)解”，可被應用于交通、能源、金融、…

11-13

2025百度世界大會：文心大模型5.0發(fā)布，多領域表現(xiàn)達全球領先水平

文心5.0基礎能力全面升級，在多模態(tài)理解、指令遵循、創(chuàng)意寫作、事實性、智能體規(guī)劃與工具應用等方面表現(xiàn)突出，擁有強大的理解、邏輯、記憶和說服力。不同于業(yè)界多數(shù)的多模態(tài)模型采用后期融合的方式，文心5.0的技術路…

11-13

2025百度世界大會聚焦AI發(fā)展：成果發(fā)布，內(nèi)化能力引領新質生產(chǎn)力變革

本屆大會以“效果涌現(xiàn)”為主題，聚焦國產(chǎn)芯片最新進展、大模型升級、AI應用創(chuàng)新與全球出海，呈現(xiàn)了百度作為中國人工智能領軍企業(yè)，如何將AI技術內(nèi)化為產(chǎn)業(yè)發(fā)展的原生動能，為加快形成新質生產(chǎn)力提供可落地的“百度方案”…

11-13

李彥宏2025百度世界大會發(fā)聲：搜索AI化革新，AI API開放賦能合作

11-13

00后少年黃一：攜全開源雙足機器人，與馬斯克共赴開源未來之約

11-13

百度文心大模型5.0發(fā)布：2.4萬億參數(shù)領跑全球，用戶即刻體驗

11-13

百度AI進化論：打破常態(tài)偏見，以原生之力重構產(chǎn)業(yè)未來版圖

11-13

三星Galaxy S26系列尺寸全揭秘：輕薄與大屏兼得超大杯厚度再減

11-13

消息透露iPhone 18 Pro Max機身或增厚增重裸機重量有望創(chuàng)蘋果Max機型新高

11-13

點擊查看更多 +

全站最新

三星Galaxy S26系列尺寸全揭秘：輕薄與大屏兼得超大杯厚度再減

消息透露iPhone 18 Pro Max機身或增厚增重裸機重量有望創(chuàng)蘋果Max機型新高

影視颶風CEO潘天鴻“扮初中學歷”相親引熱議網(wǎng)友：婚戀該看標簽還是潛力？

華為Mate 80系列或推Pro Max新機：主動散熱成亮點 11月登場

榮耀500 Pro核心配置揭秘：驍龍8至尊版加持 2億主攝+8000mAh大電池

百度文心大模型5.0發(fā)布：原生全模態(tài)，多項能力達全球領先水平

熱門內(nèi)容

本欄最新

三星Galaxy S26系列尺寸全揭秘：輕薄與大屏兼得超大杯厚度再減

消息透露iPhone 18 Pro Max機身或增厚增重裸機重量有望創(chuàng)蘋果Max機型新高

影視颶風CEO潘天鴻“扮初中學歷”相親引熱議網(wǎng)友：婚戀該看標簽還是潛力？

華為Mate 80系列或推Pro Max新機：主動散熱成亮點 11月登場

榮耀500 Pro核心配置揭秘：驍龍8至尊版加持 2億主攝+8000mAh大電池

百度文心大模型5.0發(fā)布：原生全模態(tài)，多項能力達全球領先水平

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

中國信通院推出“方升”3.0基準測試，助力AI評測升級與行業(yè)創(chuàng)新發(fā)展