在近期舉辦的AI創(chuàng)造者嘉年華上,硅星人創(chuàng)始人兼CEO駱軼航與月之暗面(Kimi)技術(shù)副總裁付強(qiáng)展開(kāi)了一場(chǎng)深度對(duì)話,圍繞K2模型研發(fā)過(guò)程中的“反常識(shí)”決策以及Kimi探索通用人工智能(AGI)的技術(shù)路徑展開(kāi)探討。
針對(duì)K2模型采用DeepSeekV3架構(gòu)引發(fā)的討論,付強(qiáng)回應(yīng)稱技術(shù)選擇基于現(xiàn)實(shí)考量。他指出,采用成熟架構(gòu)可復(fù)用現(xiàn)有推理資源,降低開(kāi)發(fā)成本。盡管整體架構(gòu)相似,但K2在超參數(shù)配置、專家模型數(shù)量等細(xì)節(jié)上存在顯著差異。通過(guò)優(yōu)化密集層模型緊湊度,最終實(shí)現(xiàn)的模型性能與原始架構(gòu)形成本質(zhì)區(qū)別。
當(dāng)被問(wèn)及為何在行業(yè)轉(zhuǎn)向后訓(xùn)練時(shí)重啟預(yù)訓(xùn)練路線,付強(qiáng)坦言這是戰(zhàn)略選擇。他以學(xué)生學(xué)習(xí)為例,強(qiáng)調(diào)模型需要像人類一樣具備舉一反三的能力。通過(guò)提升Token使用效率,而非單純擴(kuò)大參數(shù)規(guī)模或增加訓(xùn)練次數(shù),Kimi團(tuán)隊(duì)在有限的高質(zhì)量語(yǔ)料中挖掘更深層次的信息關(guān)聯(lián)。這種技術(shù)路線導(dǎo)致產(chǎn)品迭代周期延長(zhǎng),但為模型智能化突破創(chuàng)造了可能。
關(guān)于開(kāi)源戰(zhàn)略的決策邏輯,付強(qiáng)表示這源于技術(shù)生態(tài)建設(shè)的需要。通過(guò)開(kāi)源基礎(chǔ)模型,開(kāi)發(fā)者社區(qū)的反饋成為技術(shù)演進(jìn)的重要驅(qū)動(dòng)力。他特別強(qiáng)調(diào)要保持“半步領(lǐng)先”的節(jié)奏,既要吸收社區(qū)創(chuàng)新,又要確保核心技術(shù)自主性。這種開(kāi)放策略與某些企業(yè)通過(guò)工程化手段包裝模型性能的做法形成鮮明對(duì)比。
面對(duì)Agent技術(shù)發(fā)展的爭(zhēng)議,付強(qiáng)用賽車運(yùn)動(dòng)作類比。第三方Agent開(kāi)發(fā)者如同職業(yè)車手,能通過(guò)API調(diào)用充分發(fā)揮模型性能,但模型供應(yīng)商必須深度參與應(yīng)用場(chǎng)景構(gòu)建。他指出當(dāng)前多Agent調(diào)度方案本質(zhì)上是工程化MoE架構(gòu),真正的智能突破需要模型原生具備工具調(diào)用和環(huán)境交互能力。
在AGI實(shí)現(xiàn)路徑的討論中,付強(qiáng)強(qiáng)調(diào)代碼生成能力的特殊價(jià)值。相較于情感交互等主觀評(píng)價(jià)領(lǐng)域,編程任務(wù)的客觀可驗(yàn)證性使其成為衡量模型智能的理想標(biāo)尺。K2模型在IDE集成和調(diào)用量上的優(yōu)異表現(xiàn),印證了通過(guò)解決高復(fù)雜度問(wèn)題提升智能水平的技術(shù)路線有效性。
對(duì)于模型價(jià)值觀的探討,付強(qiáng)回歸人工智能發(fā)展的本質(zhì)命題。他引用《苦澀的教訓(xùn)》理論,主張賦予模型自主探索和試錯(cuò)能力。就像人類通過(guò)實(shí)驗(yàn)認(rèn)知世界,模型也需要具備物理操作、化學(xué)實(shí)驗(yàn)等環(huán)境交互能力,這種與人類共同進(jìn)化的模式才是通往AGI的正途。











