谷歌TPU正以驚人的速度崛起,成為英偉達(dá)在AI芯片領(lǐng)域最強(qiáng)勁的挑戰(zhàn)者。隨著谷歌Gemini 3的發(fā)布,其背后的TPU架構(gòu)再次成為全球科技界關(guān)注的焦點(diǎn)。資本市場(chǎng)迅速做出反應(yīng),谷歌股價(jià)的攀升引發(fā)了新一輪討論:TPU是否真的具備與英偉達(dá)GPU一較高下的實(shí)力?
SemiAnalysis,這家在半導(dǎo)體和人工智能領(lǐng)域頗具影響力的研究機(jī)構(gòu),近期發(fā)布了一份由12位作者共同撰寫的深度分析報(bào)告。報(bào)告明確指出,谷歌TPUv7已正式向英偉達(dá)發(fā)起挑戰(zhàn),標(biāo)志著AI硬件市場(chǎng)的格局可能迎來(lái)重大變革。報(bào)告的核心觀點(diǎn)在于,谷歌通過(guò)打破長(zhǎng)期以來(lái)的內(nèi)部自用慣例,開始大規(guī)模向外部客戶銷售TPU硬件及算力服務(wù),這一戰(zhàn)略轉(zhuǎn)變正在重塑行業(yè)生態(tài)。
Anthropic是谷歌TPU商業(yè)化進(jìn)程中的關(guān)鍵合作伙伴。這家公司已部署超過(guò)1GW的TPU集群,成為谷歌TPU的重要客戶。盡管在單芯片理論參數(shù)上,TPU未必全面超越英偉達(dá)GPU,但谷歌憑借卓越的系統(tǒng)級(jí)工程能力,如ICI互聯(lián)和光路交換技術(shù),實(shí)現(xiàn)了極高的實(shí)際模型算力利用率(MFU)。更關(guān)鍵的是,谷歌TPU的總體擁有成本(TCO)比英偉達(dá)GB200系統(tǒng)低約30%-40%,這一優(yōu)勢(shì)使其在性價(jià)比方面具備顯著競(jìng)爭(zhēng)力。
軟件生態(tài)的短板曾是TPU推廣的主要障礙。為彌補(bǔ)這一不足,谷歌正積極推動(dòng)TPU與PyTorch原生環(huán)境的兼容,并加強(qiáng)對(duì)vLLM等開源生態(tài)的支持。這些舉措旨在從根基上瓦解英偉達(dá)CUDA的護(hù)城河,吸引更多開發(fā)者轉(zhuǎn)向TPU平臺(tái)。目前,谷歌已在多個(gè)TPU軟件倉(cāng)庫(kù)中顯著增加了貢獻(xiàn),特別是在vLLM支持方面,自3月以來(lái)貢獻(xiàn)量大幅上升,5月還創(chuàng)建了官方的vLLM TPU統(tǒng)一后端倉(cāng)庫(kù)。
英偉達(dá)對(duì)TPU的崛起并非無(wú)動(dòng)于衷。面對(duì)谷歌的挑戰(zhàn),英偉達(dá)強(qiáng)調(diào)其GPU在性能、通用性和可替代性方面仍具有優(yōu)勢(shì),并指出自己是唯一能夠運(yùn)行所有AI模型、適用于各種計(jì)算場(chǎng)景的平臺(tái)。然而,市場(chǎng)動(dòng)態(tài)已顯示出變化跡象。OpenAI雖尚未部署TPU,但僅憑“可能轉(zhuǎn)向TPU”的談判籌碼,就已從英偉達(dá)處獲得約30%的成本優(yōu)惠。這一案例表明,TPU的商業(yè)化正在對(duì)英偉達(dá)的客戶策略產(chǎn)生實(shí)質(zhì)性影響。
TPU的設(shè)計(jì)理念也在隨著大模型時(shí)代的到來(lái)而轉(zhuǎn)變。早期的TPU更注重硬件的可靠性和低算力強(qiáng)度的工作負(fù)載,如推薦系統(tǒng)模型。但隨著AI模型規(guī)模的擴(kuò)大,谷歌推出了TPUv6 Trillium和TPUv7 Ironwood等新一代產(chǎn)品,在FLOPs、內(nèi)存和帶寬方面幾乎追平了英偉達(dá)的旗艦GPU。盡管TPUv7的全面上市時(shí)間比英偉達(dá)Blackwell晚了一年,但其每顆芯片在全規(guī)模部署下的TCO比英偉達(dá)GB200服務(wù)器低44%,這一優(yōu)勢(shì)足以彌補(bǔ)峰值性能上的微小差距。
Anthropic選擇TPU的原因不僅在于成本,更在于其能夠通過(guò)自定義內(nèi)核實(shí)現(xiàn)高模型FLOPs利用率(MFU)。該公司擁有強(qiáng)大的工程團(tuán)隊(duì)和前谷歌編譯器專家,能夠深入理解TPU堆棧和自身模型架構(gòu),從而彌補(bǔ)TPU軟件堆棧開箱即用性能較弱的不足。這種技術(shù)優(yōu)勢(shì)使Anthropic在使用TPU時(shí)能夠?qū)崿F(xiàn)比商用GPU更高的每PFLOP成本性能。
谷歌的TPU戰(zhàn)略仍面臨挑戰(zhàn)。盡管在外部化方面取得進(jìn)展,但其XLA圖編譯器、網(wǎng)絡(luò)庫(kù)和TPU運(yùn)行時(shí)仍未開源,且文檔記錄不完善,這給開發(fā)者帶來(lái)了調(diào)試?yán)щy。用于多Pod訓(xùn)練的MegaScale代碼庫(kù)也未開源,限制了TPU生態(tài)系統(tǒng)的擴(kuò)展性。若谷歌能進(jìn)一步開放這些核心組件,或許能加速TPU的普及,就像PyTorch和Linux的開源策略推動(dòng)了其廣泛采用一樣。










