近日,人工智能初創企業月之暗面(Moonshot AI)的三位核心高管在Reddit平臺舉辦了一場AMA互動活動,針對用戶提出的多個行業熱點問題展開詳細解答。這場持續24小時的問答吸引了大量科技愛好者參與,問題焦點集中在該公司最新發布的開源思考模型Kimi K2 Thinking上。
參與互動的高管包括創始人楊植麟(論壇ID:ComfortableAsk4494)、技術負責人周昕宇(zxytim)和算法專家吳育昕(ppwwyyxx)。面對用戶關于K2 Thinking推理性能的質疑,楊植麟解釋稱模型通過優化訓練方式,在單次推理中實現了更長的思考鏈。他特別提到Turbo API版本將顯著提升響應速度,同時強調原生支持的INT4數據類型有效加速了推理過程。
針對硬件配置的提問,吳育昕坦言公司目前使用配備Infiniband網絡的H800 GPU集群,雖然設備性能不及美國同類產品,但通過高效利用實現了資源最大化。周昕宇進一步補充說明,選擇INT4格式主要是為了兼容非Blackwell架構的GPU,同時復用現有推理內核降低開發成本。
當被問及模型訓練成本時,楊植麟澄清網傳的460萬美元數據并非官方統計,強調研發過程中的實驗性投入難以精確量化。對于用戶反映的代幣消耗問題,他承認當前版本更注重絕對性能,未來將通過獎勵機制優化思考過程的簡潔性。
在邏輯推理能力爭議方面,楊植麟承認HLE測試高分與實際使用體驗存在差距,但表示團隊正在通過改進通用能力來提升模型實用性。周昕宇則重點介紹了新架構KDA的技術優勢,該架構通過雙注意力機制在提升基準測試分數的同時,實現了更快的訓練和部署速度。
關于后續產品規劃,楊植麟透露KDA架構的實驗成果很可能應用于K3模型開發,并幽默表示K3的發布時間將早于某科技巨頭價值萬億美元的數據中心建成。對于視覺-語言模型的研發計劃,他明確確認團隊正在推進相關項目,但未公布具體時間表。
在回應與頭部企業的對比時,周昕宇坦言不了解競爭對手的預算分配細節,強調月之暗面會堅持自身發展節奏。針對瀏覽器產品的可能性,他直接否定了套用Chromium框架的方案,認為現有技術路線已能滿足需求。











