高通于近日正式推出AI200與AI250兩款專為數據中心設計的AI推理芯片,同步發布基于這兩款芯片的加速卡及機架級解決方案。根據規劃,AI200將于2026年投入商用,AI250則定于2027年進入市場。這是高通繼2019年Cloud AI 100、2023年Cloud AI 100 Ultra之后,在數據中心AI推理領域的第三次重要布局。
資本市場對這一動作反應熱烈。新品發布當日,高通股價盤中一度飆升22%至205美元,創下2024年6月下旬以來的最高紀錄,最終以188美元收盤,漲幅達11.09%。摩根大通、美銀證券、TD Cowen等多家投行隨即更新評級,維持“買入”建議,部分機構將目標價上調至200美元。
同日,高通宣布與沙特阿拉伯AI企業HUMAIN達成戰略合作,雙方將共同推動AI200與AI250的落地應用。HUMAIN正在開發阿拉伯語多模態大語言模型,計劃與高通邊緣設備生態深度整合,構建從芯片到應用的完整技術鏈條。高通將為該項目提供“全球人工智能推理服務”,助力沙特打造全球首個邊緣到云混合AI中心。
隨著AI應用場景的爆發式增長,市場對推理芯片的需求持續攀升。今年以來,英偉達、谷歌、華為等科技巨頭均已推出相關新品。例如,英偉達9月發布的RubinCPX GPU專注于AI視頻生成與上下文處理,計劃2026年底上市;華為同月推出的昇騰950PR則著重提升推理性能,預計2026年第一季度面世。高通此時入局,旨在搶占AI推理市場的關鍵窗口期。
AI推理與訓練芯片的側重點存在差異。訓練場景強調芯片的并行計算能力,而推理場景更關注能效、時延與成本等綜合表現。高通新品針對這些需求進行了優化設計:AI200機架解決方案支持單卡768GB低功耗內存,通過擴大容量降低成本;AI250則首次采用近內存計算架構,在提升帶寬的同時降低功耗。兩款方案均配備直接液冷散熱系統,單機架功耗達160kW,并通過PCIe縱向擴展與以太網橫向擴展實現高效連接。
市場研究機構巴克萊銀行預測,到2026年,AI推理計算需求將占通用人工智能總需求的70%以上,甚至可能達到訓練需求的4.5倍。然而,現有芯片資源難以滿足這一增長,預計需新增近3000億美元的資本支出。面對這一缺口,高通選擇與競爭對手正面交鋒。若以巴克萊的預測為基準,即便僅占據1%的市場份額,也將為高通帶來可觀的營收增長。
高通的數據中心布局并非一蹴而就。2018年,其服務器芯片部門曾因高層離職與大規模裁員被外界解讀為退出該領域。直到2024年,公司CEO Cristiano Amon在Computex展會確認重返數據中心市場,并啟動一系列動作:2025年5月宣布與英偉達合作定制CPU,用于加速GPU通信;6月以24億美元收購半導體IP企業Alphawave,以增強高端接口技術;近日又通過與HUMAIN的合作,將業務延伸至中東市場。
盡管布局節奏緊湊,但數據中心板塊的營收貢獻仍需時間沉淀。Amon在財報電話會中透露,高通正與一家超大規模云端服務供應商深入洽談,預計最快2028會計年度開始產生相關收入。與此同時,高通也在拓展智慧駕駛、物聯網等多元化場景,以降低對單一業務的依賴。值得注意的是,其與蘋果的基帶芯片供應協議將于2026年末到期,而蘋果目前占高通營收約20%,如何填補這一缺口將成為市場關注的焦點。











