過去數年間,英偉達憑借AI算力需求的爆發式增長,一度穩坐行業頭把交椅。然而近期,行業風向悄然轉變,資本市場對英偉達的態度從“不可替代”轉向“存在替代可能”,其市值在一個月內蒸發超7000億美元,折射出技術競爭格局的深層變化。這場變局的觸發點并非傳統意義上的芯片巨頭對決,而是谷歌以TPU(張量處理器)為核心的專用芯片路線,正從幕后走向臺前。
11月27日,英偉達創始人黃仁勛在臺北公開表示“我真的超級累”,這一罕見情緒流露,被外界解讀為應對新競爭壓力的信號。與此同時,行業頭部玩家meta被曝正與谷歌洽談一項規模達數十億美元的芯片采購協議——從2027年起,meta計劃將谷歌TPU引入其數據中心。這一動作的象征意義遠超商業價值:作為全球AI基礎設施投入最大的公司之一,meta的選擇被視為對谷歌技術路線的重要背書。
面對挑戰,英偉達迅速亮出防御牌。公司強調其GPU平臺仍“領先業界一代”,是“唯一能運行所有人工智能模型并實現跨場景計算的解決方案”。其核心論點在于CUDA生態構建的開發者護城河,以及GPU在通用性和靈活性上的不可替代性。但行業討論的焦點已悄然轉移:當AI訓練與推理規模持續擴張,能耗正成為新的約束條件,而谷歌TPU在能效比上的優勢開始顯現。
半導體專家張國斌指出,TPU作為為深度學習定制的ASIC芯片,通過犧牲通用性換取極致性能。例如,谷歌最新一代Ironwood TPU的能效比是初代產品的30倍,在同等工藝下遠超GPU。這種技術優勢已轉化為實際成果:OpenAI開始使用TPU進行部分訓練,Anthropic宣布將TPU v5e作為下一代大規模訓練平臺,理由正是“性能與成本的平衡”。更關鍵的是,谷歌通過“硬件即服務”(HaaS)模式,將TPU部署在合作伙伴數據中心并按使用量分成,大幅降低了中小云廠商的硬件投入門檻。
谷歌的野心不止于此。其正在構建“TPU+OCS(光路交換系統)+Gemini大模型+云服務”的全棧體系,實現從芯片到應用的深度整合。這種系統級優化使得數據中心網絡拓撲完全服務于TPU超節點,例如最新發布的第七代TPU Ironwood,通過ICI scale-up網絡可支持9216顆芯片的超大規模集群,峰值性能達4614TFLOPS,是上一代的10倍。華泰證券分析認為,谷歌正以“游擊戰”策略滲透市場,其全棧生態可能對英偉達的通用算力體系構成長期威脅。
技術競爭的維度正在從“單卡性能”轉向“系統效率”。盡管英偉達在單卡算力上仍占優勢,但超節點集群的互聯能力成為新的戰場。華為、阿里、百度等中國廠商在這一領域動作頻頻:華為推出的Atlas 960 SuperPoD支持15488張昇騰卡互聯,阿里云磐久128超節點服務器單柜容納128顆AI芯片,百度昆侖芯則通過百舸5.0實現超節點量產部署。國產GPU廠商也在加速追趕,壁仞、燧原、沐曦、摩爾線程等企業通過光互連技術、分布式并行架構等創新,推動超節點規模向千卡級邁進。
華龍證券觀察指出,中美AI競爭已進入“體系化”階段。中國廠商通過集群建設、開源生態和工程化交付,正在AI基建領域形成差異化優勢。例如,曦智科技聯合壁仞、中興推出的光互連GPU超節點LightSphereX,實現了跨芯片的高速數據傳輸;燧原云燧ESL系統單節點支持64卡全帶寬互聯,沐曦曦云C600則通過metaXlink技術擴展超節點規模。這些突破表明,當算力競爭從“芯片之爭”升級為“生態之爭”,系統效率、能效比和規模化交付能力正在重新定義行業規則。
對于英偉達而言,挑戰與機遇并存。其CUDA生態仍擁有全球最龐大的開發者社區,GPU的通用算力在多元場景中難以被完全替代。但谷歌TPU的崛起,以及云服務廠商自研ASIC的擴散,正在打破原有的技術壟斷格局。當meta愿意將數十億美元投向競爭對手,當中國廠商在超節點領域實現局部領先,行業格局的微妙變化已不容忽視。這場關于“夠用、便宜、可規模化”的競爭,或許才剛剛拉開序幕。










