在人工智能算力需求持續(xù)攀升的背景下,GPU主導(dǎo)的市場(chǎng)格局正迎來多元化變革。非GPU路線的AI專用芯片憑借獨(dú)特優(yōu)勢(shì),逐漸成為行業(yè)關(guān)注的焦點(diǎn)。這種趨勢(shì)不僅體現(xiàn)在美股市場(chǎng),國(guó)內(nèi)市場(chǎng)同樣呈現(xiàn)出ASIC定制芯片快速發(fā)展的態(tài)勢(shì)。
博通公司近期百億美元訂單的爆發(fā)式增長(zhǎng),折射出云服務(wù)廠商對(duì)替代英偉達(dá)GPU生態(tài)的技術(shù)需求。以谷歌TPU、Groq LPU為代表的專用芯片,正在構(gòu)建新的技術(shù)路徑。這種轉(zhuǎn)變背后,是產(chǎn)業(yè)界對(duì)更高費(fèi)效比的持續(xù)追求。中昊芯英聯(lián)合創(chuàng)始人鄭瀚尋指出,隨著專用芯片制造成本下降,自研架構(gòu)的個(gè)性化AI解決方案正獲得更多企業(yè)青睞。
定制化ASIC芯片的崛起并非偶然。當(dāng)傳統(tǒng)漸進(jìn)式技術(shù)迭代難以追趕英偉達(dá)時(shí),行業(yè)開始探索"彎道超車"的可能性。英偉達(dá)的成功源于其深厚的工程化積累,這為后來者設(shè)置了難以復(fù)制的門檻。相比之下,專用芯片在特定場(chǎng)景下的效率優(yōu)勢(shì)日益凸顯,成為打破GPU壟斷的關(guān)鍵突破口。
TPU芯片的快速發(fā)展印證了這種判斷。自英偉達(dá)在Tesla V100中引入Tensor Core以來,張量計(jì)算單元的迭代始終是重點(diǎn)。鄭瀚尋分析稱,在大模型時(shí)代,張量運(yùn)算的規(guī)模效應(yīng)顯著:數(shù)據(jù)傳輸量每增加N倍,計(jì)算量可實(shí)現(xiàn)N2級(jí)增長(zhǎng)。這種特性使得TPU在處理大規(guī)模數(shù)據(jù)時(shí),展現(xiàn)出類似"3D打印"的一體化計(jì)算優(yōu)勢(shì),遠(yuǎn)超傳統(tǒng)CPU和GPU的運(yùn)算模式。
面對(duì)大模型發(fā)展帶來的算力集群挑戰(zhàn),芯片互聯(lián)能力成為新的競(jìng)爭(zhēng)焦點(diǎn)。中昊芯英已實(shí)現(xiàn)千卡集群內(nèi)1024片芯片的光模塊高速互聯(lián),并探索OCS全光互聯(lián)等新技術(shù)。這種技術(shù)路線與英偉達(dá)的InfiniBand形成差異化競(jìng)爭(zhēng),后者雖被視為大規(guī)模數(shù)據(jù)中心的首選方案,但其封閉性促使更多廠商轉(zhuǎn)向以太網(wǎng)生態(tài)。
以太網(wǎng)技術(shù)的進(jìn)化正在改變行業(yè)格局。頭部企業(yè)組建的以太網(wǎng)聯(lián)盟推動(dòng)了物理介質(zhì)和帶寬能力的顯著提升,特斯拉基于以太網(wǎng)開發(fā)的TTPoE協(xié)議已實(shí)現(xiàn)低延遲傳輸。鄭瀚尋透露,中昊芯英的互聯(lián)延遲指標(biāo)已優(yōu)于特斯拉公開數(shù)據(jù),顯示出國(guó)產(chǎn)芯片在技術(shù)追趕中的突破。
軟件生態(tài)建設(shè)成為國(guó)產(chǎn)芯片的另一道門檻。面對(duì)英偉達(dá)閉源的CUDA生態(tài),國(guó)內(nèi)廠商需自主構(gòu)建工具鏈和軟件棧。鄭瀚尋比喻稱,這類似于早期安卓系統(tǒng)的發(fā)展過程,國(guó)產(chǎn)芯片需要通過持續(xù)優(yōu)化實(shí)現(xiàn)跨平臺(tái)兼容。當(dāng)前Transformer架構(gòu)的主導(dǎo)地位雖未動(dòng)搖,但多模態(tài)大模型的發(fā)展正在推動(dòng)底層技術(shù)的持續(xù)創(chuàng)新。
盡管大模型技術(shù)持續(xù)迭代,但其核心架構(gòu)仍源于2017年提出的Transformer范式。鄭瀚尋強(qiáng)調(diào),當(dāng)前主流語言模型的基礎(chǔ)邏輯框架未發(fā)生根本性改變,后續(xù)優(yōu)化多集中在細(xì)微環(huán)節(jié)。這種技術(shù)穩(wěn)定性為專用芯片的發(fā)展提供了明確的優(yōu)化方向,也預(yù)示著AI算力領(lǐng)域的競(jìng)爭(zhēng)將進(jìn)入更深層次的技術(shù)比拼階段。











