“智能體概念雖火,落地卻困難重重。”如今,幾乎所有企業(yè)都在積極探索人工智能技術(shù)的實際應(yīng)用,智能體更是被視為企業(yè)AI轉(zhuǎn)型的關(guān)鍵突破口。然而,在推進過程中,企業(yè)面臨著諸多阻礙,這些問題如同橫亙在智能化道路上的巨石,嚴重制約著企業(yè)的轉(zhuǎn)型步伐。
浪潮信息首席AI戰(zhàn)略官劉軍在相關(guān)交流中指出:“大模型時代,企業(yè)面臨的挑戰(zhàn)是多維度的。技術(shù)層面的問題首當其沖,數(shù)據(jù)質(zhì)量參差不齊、模型適配困難、算力投入巨大,同時還要在成本與效益之間找到精準的平衡點。”這些挑戰(zhàn),讓企業(yè)在智能體落地過程中舉步維艱。
為幫助企業(yè)突破智能體落地的困境,在近期舉辦的一場人工智能計算大會上,浪潮信息發(fā)布了面向智能體優(yōu)化的AI計算系統(tǒng),為企業(yè)指明了方向。
隨著模型參數(shù)量的急劇增長,企業(yè)面臨的壓力與日俱增。劉軍表示:“按照Scaling Law的發(fā)展趨勢,模型參數(shù)量會持續(xù)增大。如何在一臺機器上運行更大參數(shù)的模型,是企業(yè)必須攻克的難題。”從最初的幾億參數(shù)到如今的上萬億參數(shù),模型的復(fù)雜度和計算需求呈指數(shù)級攀升,這對硬件的計算能力、系統(tǒng)的擴展性和穩(wěn)定性都提出了前所未有的高要求。
在智能體商業(yè)化進程中,能力、速度和成本是決定成敗的三大要素。模型能力隨著大模型的發(fā)展不斷提升,但速度和成本問題卻成為企業(yè)亟待解決的痛點。劉軍在專訪中提到:“速度越快,客戶體驗就越好,能解決的場景問題也就越多。但速度提升往往伴隨著成本增加,企業(yè)需要在兩者之間找到最佳平衡點,才能實現(xiàn)商業(yè)化成功。”
在此背景下,企業(yè)迫切需要一種全新的計算系統(tǒng)架構(gòu)來應(yīng)對挑戰(zhàn),面向智能體優(yōu)化的AI計算系統(tǒng)應(yīng)運而生。浪潮信息推出的元腦SD200超節(jié)點AI服務(wù)器和元腦HC1000超擴展AI服務(wù)器,正是為解決智能體產(chǎn)業(yè)化面臨的交互速度和token成本兩大瓶頸而設(shè)計,為多智能體協(xié)同與復(fù)雜任務(wù)推理的規(guī)模化落地提供了高速度、低成本的算力支撐。
劉軍介紹:“浪潮信息不會盲目追求技術(shù)和指標,而是緊密結(jié)合產(chǎn)業(yè)發(fā)展需求,聚焦算力應(yīng)用中的核心挑戰(zhàn)、痛點和瓶頸,針對性地進行優(yōu)化和設(shè)計,確保產(chǎn)品能有效解決客戶問題。”
在速度方面,浪潮信息通過技術(shù)創(chuàng)新,讓智能體響應(yīng)進入“毫秒級”時代。劉軍將智能體交互比作高速公路上的車輛行駛:“智能體交互通常是小數(shù)據(jù)包,關(guān)鍵不在于道路寬度,而在于上下高速是否順暢。浪潮信息通過技術(shù)優(yōu)化,讓數(shù)據(jù)直通上下高速,將延遲壓到極致。”
以元腦SD200超節(jié)點AI服務(wù)器為例,它成功將DeepSeek R1大模型的token生成速度降低至8.9毫秒,引領(lǐng)國內(nèi)大模型token生成速度進入“10毫秒時代”。為實現(xiàn)極低的通信延遲,元腦SD200采用精簡高效的三層協(xié)議棧,原生支持多種內(nèi)存語義操作,避免冗余數(shù)據(jù)拷貝,將基礎(chǔ)通信延遲降至百納秒級。同時,硬件化鏈路層重傳與分布式預(yù)防式流控進一步適配高吞吐、低延遲的AI推理場景。
在成本方面,浪潮信息通過多種方式實現(xiàn)從“昂貴”到“可承受”的轉(zhuǎn)變。一方面,將計算過程拆分解耦,提高每一部分資源的利用率,從而大幅節(jié)省成本;另一方面,在硬件設(shè)計上進行優(yōu)化,降低能耗,提高計算模塊的效率。
具體到產(chǎn)品架構(gòu),元腦HC1000采用全對稱DirectCom極速架構(gòu),通過無損超擴展設(shè)計,聚合海量本土AI芯片,支持極大推理吞吐量。這種架構(gòu)不僅提高了計算效率,還顯著降低了硬件成本。在降本和軟硬協(xié)同增效方面,浪潮信息創(chuàng)新16卡計算模組設(shè)計、單卡“計算 - 顯存 - 互連”均衡設(shè)計,大幅降低單卡成本和每卡系統(tǒng)分攤成本。據(jù)測算,元腦HC1000通過算網(wǎng)深度協(xié)同、全域無損技術(shù),實現(xiàn)推理性能相比傳統(tǒng)RoCE提升1.75倍,單卡模型算力利用率最高提升5.7倍,最終實現(xiàn)了每百萬token成本首次擊破1元。
劉軍強調(diào):“Token成本決定了智能體的盈利能力,只有降低成本,才能實現(xiàn)大規(guī)模的商業(yè)化應(yīng)用。”
這兩款產(chǎn)品還針對不同行業(yè)的應(yīng)用場景進行了優(yōu)化。元腦SD200針對金融和能源等對延遲敏感的行業(yè)用戶,能夠快速響應(yīng)客戶需求,提升客戶體驗;元腦HC1000則能以更低的成本提供更多的Token服務(wù),滿足大規(guī)模商業(yè)部署的需求。
在數(shù)智化時代,智能體已成為企業(yè)數(shù)字化轉(zhuǎn)型的核心驅(qū)動力。它不僅能提高企業(yè)的運營效率,還能創(chuàng)造新的商業(yè)模式,幫助企業(yè)實現(xiàn)更高效的客戶互動、更精準的市場預(yù)測和更智能的決策支持。
浪潮信息通過元腦SD200和元腦HC1000,為醫(yī)療、能源等行業(yè)提供了強大的算力支持。在醫(yī)療行業(yè),元腦SD200的高精度和高安全性計算架構(gòu),支持醫(yī)療影像分析和疾病診斷,大幅縮短診斷時間,提高醫(yī)療服務(wù)質(zhì)量和效率;在能源行業(yè),元腦HC1000的超擴展性和高可靠性,支持大規(guī)模的能源管理和優(yōu)化,實現(xiàn)對能源生產(chǎn)、傳輸和消費的全鏈條智能監(jiān)控與優(yōu)化,提高能源利用效率,降低運營成本。
劉軍指出:“未來5年,需要實現(xiàn)單Token成本同等數(shù)量級的下降,才能保持Token消耗量增加的相對平衡。這不僅需要技術(shù)創(chuàng)新,還需要企業(yè)與生態(tài)伙伴的緊密合作。”浪潮信息通過開放生態(tài),與上下游伙伴、生態(tài)伙伴和客戶緊密合作,共同推動數(shù)字化轉(zhuǎn)型,加速轉(zhuǎn)型速度,提高轉(zhuǎn)型成功率。











