在近期舉辦的AI創造者嘉年華上,硅星人創始人兼CEO駱軼航與月之暗面(Kimi)技術副總裁付強展開深度對話,圍繞K2模型研發過程中的創新突破、技術路線選擇及AGI(通用人工智能)發展路徑展開探討。這場對話揭示了Kimi在預訓練架構選擇、模型能力構建及開源生態建設等方面的獨特思考。
針對K2模型采用與DeepSeekV3相似架構的爭議,付強回應稱技術決策需平衡創新與實用性。他以汽車工業類比指出:“架構相似性并非核心競爭力,關鍵在于能否通過優化實現性能突破。K2選擇成熟架構的核心考量是兼容現有推理資源,同時通過超參數調整、專家模型數量擴展等技術創新,在保持架構相似性的前提下實現性能躍升。”技術報告顯示,K2在注意力機制設計、基礎模型緊致度等方面進行了深度優化,這些改進使模型在數據集和訓練策略差異下仍能展現獨特優勢。
面對行業預訓練投入縮減的趨勢,Kimi選擇逆勢加大投入。付強坦言:“這需要企業忍受階段性沉默,2024年Kimi減少市場曝光正是為了專注模型研發。”他反駁“Scaling Law失效”論調,指出高質量語料庫的局限性才是制約因素:“單純增加訓練次數無法突破數據邊界,關鍵在于提升單位數據的價值密度。”通過類比人類學習過程,付強解釋了Kimi的技術路徑:“如同優秀學生能通過一本書領悟更多知識,我們致力于提升模型對文本信息的深度解析能力,而非簡單堆砌數據量。”
在開源戰略選擇上,Kimi展現出差異化定位。付強認為開源不僅是技術展示,更是構建進化閉環的關鍵:“開發者基于開源模型的應用創新,能為我們提供下一代模型研發的方向指引。這種‘領先半步’的策略,既保持技術開放性,又確保核心競爭力。”他特別強調開源對技術可信度的重要性:“閉源模型可能通過工程化手段掩蓋真實能力,而開源生態的透明驗證機制,更能推動模型向真正的AGI演進。”
針對Agent技術發展路徑,付強用賽車手與賽車的比喻闡明觀點:“第三方Agent如同專業車手,能通過API調用最大化發揮模型性能,但模型公司必須深度參與應用場景構建。”他指出當前Agent市場存在的認知誤區:“某些方案試圖通過人工規則實現智能調度,這本質上仍是工程化MoE(混合專家模型),而非模型原生能力。”Kimi的解決方案是在訓練階段就融入應用場景考量,通過端到端訓練使模型具備原生工具調用能力,而非依賴后期微調。
在AI Coding領域,Kimi選擇將編程能力作為AGI發展的重要標尺。付強解釋這一選擇的深層邏輯:“編程結果的客觀可驗證性,使其成為衡量模型智能程度的理想指標。相比需要主觀判斷的情緒價值輸出,代碼能否運行直接反映模型的真實能力。”這種技術導向也體現在K2的評估體系中,其編程能力獲得OpenRouter等平臺用戶及頂級IDE廠商的認可,證明技術路線與市場需求的契合度。
對于AGI的發展方向,付強重申“苦澀的教訓”理論:“歷史經驗表明,真正突破性的智能必須通過通用能力構建,而非特定場景優化。”他描繪了模型與人類協同進化的愿景:“理想的AI不應是被圈養的寵物,而應具備像人類祖先那樣探索世界的能力——從鉆木取火到科學實驗,通過持續交互實現自我進化。”這種理念貫穿Kimi的技術研發,使其在追求模型智能密度的同時,始終保持對通用能力構建的關注。











