《科創板日報》12月9日訊(記者 張洋洋)“沒有一百萬張顯卡,你根本做不了大模型。”這是過去兩年籠罩在AI行業頭頂的“資金算力決定論”。但在月之暗面(Kimi)總裁張予彤看來,當算力資源不再是唯一的敘事邏輯時,事情正在發生變化。
近日,張予彤現身清華大學進行了公開分享。這是其自2024年底卷入與金沙江創投主管合伙人朱嘯虎的“股權隱瞞”風波后,張予彤罕見的一次公開露面。
去年底,金沙江創投主管合伙人朱嘯虎曾公開指責張予彤在職期間隱瞞在月之暗面的900萬股免費股份,違反受托之責;而月之暗面創始人楊植麟則隨后發文力挺,明確其作為聯合創始人的身份,強調股份授予是基于其在公司運營、戰略及融資方面的長期貢獻,且“與部分股東沒有投資月之暗面的決策獨立”。
風波并未影響這位Kimi“二號人物”的步調。作為負責公司整體戰略與商業化的總裁,張予彤在此次分享中,不僅披露了最新上線模型 Kimi K2 Thinking 的技術細節,也集中闡述了這家公司接下來的業務走向和商業化思考。
▍打破“唯算力論”
“從 Kimi 創業之初,行業里最大的質疑就是:你們沒有百萬張卡,怎么跟大廠拼?”張予彤坦言,這種質疑源于一種線性的行業共識:更強的模型必然對應天價的資本開支,“但當我們慢慢意識到算力資源不是唯一敘事時,事情就變得有意思了”。
張予彤透露,月之暗面在訓練萬億參數的Kimi K2模型時,首次驗證了二階優化器Muon的大規模可行性,實現了至少兩倍的token效率提升,“這不僅意味著訓練成本下降兩倍,而是同一份數據我們能得到更多的智能。”
張予彤強調,“現在訓練的真正瓶頸是數據墻,而不是算力本身“。Muon優化器此前已被發明,但從未有人將其應用于萬億參數模型訓練。月之暗面團隊攻克了規模化使用時面臨的訓練穩定性難題,讓這一技術真正落地。
除了算法創新,月之暗面還推行“Day-0 Co-Design”理念——在模型開始訓練前,就進行基礎設施與算法的深度耦合設計。張予彤表示,基礎設施和算法人才的緊密協同,讓每一項改進都以“復利”方式體現在智能效率上。
這種技術路線得到了市場驗證。今年11月上線的Kimi K2 Thinking模型,在“人類最后的考試”(Humanity's Last Exam)等多項基準測試中,表現對標GPT-5和Claude Sonnet 4.5等全球頂尖模型。在斯坦福大學HELM綜合評測中,K2模型獲得非思考模型最佳成績。第三方盲測平臺LMArena顯示,Kimi K2 Thinking是開源模型中表現最好的。
“我們不是說今天就做到了世界最好,但已經能夠做到在單位算力上產出最高的智能價值”,張予彤坦言,這是公司接下來最重要的戰略目標。
目前,Cursor、Youware、Genspark以及Perplexity等全球知名AI應用已接入Kimi K2模型。Perplexity作為擁有數千萬活躍用戶、月訪問量2.8億次的AI搜索應用,在其模型列表中,除四個閉源模型外,唯一接入的就是Kimi K2 Thinking。
張予彤特別提到,AI搜索中的深度研究是Kimi模型的優勢場景。K2 Thinking支持多達200-300輪工具調用,可以邊思考邊使用工具完成復雜調研任務。Vercel創始人在社交媒體透露,其內部Agent場景測試中,Kimi實際表現優于其他閉源模型。投資機構Social Capital的CEO也表示,旗下投資公司已將大量工作轉至K2平臺,因為“性能強,成本又比頂尖閉源模型低得多”。
從產品層面,月之暗面今年踐行“模型即產品”理念,將模型與Agent產品體驗垂直整合。張予彤介紹,團隊從預訓練階段就加入大量真實Agent場景數據,包括工具使用和多輪規劃的軌跡數據;產品上線后,用真實用戶體驗作為信號持續優化模型。
今年推出的“OK Computer”Agent模式,產品名靈感源自Radiohead經典專輯。該模式目前支持包括圖片生成、音頻生成在內的20多種工具,工具調用最高可達50步,近期將升級至200-300步。“我們的目標是讓OK Computer成為每個人的全棧助理,”張予彤說。
她透露,用戶對OK Computer進行了極限測試:有人上傳龐大Excel文件處理上百萬行數據,有人上傳大量文件要求Agent完整理解上下文。這種“長時任務”能力正是月之暗面下一步重點方向——讓Agent能夠像在公司工作一樣,開完周會后連續工作一整周。
▍不競爭的競爭策略
在底層效率問題被創新攻克后,如何將技術突破轉化為商業壁壘和市場份額,成為新的考量。大模型市場依舊火熱,這家獨角獸公司如何在巨頭環伺下贏得市場地位,也是現場關注的焦點。
“我覺得最有效的競爭方式就是不競爭,”當被問及同大廠巨頭競爭時,張予彤給出了這樣的回答,她解釋,不競爭不是躺平,而是找到自己的敘事和真正擅長的事情。
對月之暗面而言,第一個核心優勢是底層技術創新。“大模型領域還有很多真正需要解決的問題,這些問題本質上都需要底層技術創新,這正是創業公司最有優勢的地方。”
第二個優勢是端到端的聯合優化能力。張予彤直言,大企業內部不可避免存在組織壁壘、信息傳遞不暢等問題,而月之暗面只有300人,算法、工程、產品可以全部坐在一起,“很多新想法可以當天提出、當天實驗”。
從產品定位看,Kimi有意識地做出取舍。張予彤稱,生活娛樂方向沒做,多模態生成也沒做,“我們更專注于邏輯層、Agent層,以及深入研究、PPT、數據分析、網站開發這類偏生產力、偏復雜任務的鏈路,”她表示,這些任務需要長程規劃和復雜工具調用,能創造更高經濟價值。
談及模型公司與AI應用的關系,張予彤認為這是一個動態演進過程。她表示,與互聯網產品不同,大模型能力仍在快速變化,應用側需要具備“前瞻性設計”能力,去想象尚未出現但一定會沿技術演進路徑出現的能力。“如果沒有這種前瞻性,可能會出現產品革新了體驗但模型能力跟不上,或者模型能力躍升但產品設計還停留在分步調用的舊范式。”










