華為近日正式推出名為Flex:ai的AI容器軟件解決方案,該技術(shù)通過創(chuàng)新的算力切分機(jī)制,將單張GPU或NPU硬件的算力資源進(jìn)行精細(xì)化分割。據(jù)技術(shù)文檔顯示,系統(tǒng)支持將物理算力卡劃分為多個(gè)虛擬單元,切分精度可達(dá)總算力的10%,這種設(shè)計(jì)使得單張硬件能夠同時(shí)運(yùn)行多個(gè)AI計(jì)算任務(wù)。
在資源調(diào)度方面,F(xiàn)lex:ai突破了傳統(tǒng)硬件的負(fù)載限制。通過動(dòng)態(tài)分配機(jī)制,系統(tǒng)能夠根據(jù)不同AI模型的計(jì)算需求,將切分后的虛擬單元靈活分配給多個(gè)工作負(fù)載。例如在圖像識(shí)別與自然語言處理混合場景中,單張GPU可同時(shí)支撐5-8個(gè)輕量化模型的并行運(yùn)算,硬件利用率較傳統(tǒng)模式提升3-5倍。
該技術(shù)更引人注目的創(chuàng)新在于構(gòu)建了分布式算力共享體系。在集群部署環(huán)境下,F(xiàn)lex:ai能夠自動(dòng)識(shí)別各節(jié)點(diǎn)的空閑算力資源,通過智能聚合算法將這些離散資源整合為統(tǒng)一的"共享算力池"。這種設(shè)計(jì)使得企業(yè)無需額外購置硬件即可應(yīng)對(duì)突發(fā)性的算力需求,特別適用于AI訓(xùn)練任務(wù)波動(dòng)較大的研發(fā)場景。
為推動(dòng)技術(shù)生態(tài)建設(shè),華為決定將Flex:ai的核心代碼開源發(fā)布。開發(fā)團(tuán)隊(duì)選擇在魔擎社區(qū)作為主要開源平臺(tái),提供完整的開發(fā)文檔與使用案例。技術(shù)白皮書顯示,開源版本已支持主流AI框架的深度適配,并預(yù)留了二次開發(fā)接口,方便開發(fā)者根據(jù)特定場景進(jìn)行功能擴(kuò)展。
行業(yè)分析師指出,這種軟硬件協(xié)同優(yōu)化方案有望重塑AI算力市場格局。通過將硬件資源虛擬化與集群管理相結(jié)合,F(xiàn)lex:ai既降低了中小企業(yè)使用高端算力的門檻,也為大型數(shù)據(jù)中心提供了更高效的資源調(diào)度方案。特別是在多模態(tài)AI應(yīng)用快速發(fā)展的當(dāng)下,該技術(shù)可能成為推動(dòng)AI平民化的重要基礎(chǔ)設(shè)施。











