大模型帶來的一個變化,就是新時代的中國技術創業者,即便依舊需要商業世界的支持,也終于可以放下技術理想帶來的「羞恥感」了。
最近,《羅永浩的十字路口》訪談 Minimax 創始人閆俊杰的視頻在我的朋友圈刷屏了。
這是一場我看著挺驚喜的對話。兩個看似處于平行世界的人——一個是互聯網初代網紅、公認東半球語言大師+自信東半球最好產品人羅永浩;一個是過去極度低調、表達天賦算不上有優勢,但是絕對堪稱 AI 技術極客的閆俊杰。
這兩位硬生生聊了四個小時的「馬拉松式」的訪談,其實源于我個把月之前的拉群介紹。客觀地說,拉群的時候,我當時是有點擔心羅老師能不能說服顏閆俊杰出來和他進行這種馬拉松對話。
閆俊杰畢竟一個典型的理工男,業界也都知道他平時鮮有接受采訪或者公開做訪談。面對老羅這樣洞察力和表達力都十分犀利的提問者,會不會因為彼此擔心變成一場「尬聊」而擱淺?
結果證明,羅老師絕對可以的,他的訪談頻譜極其寬廣,在視頻播客領域一騎絕塵是理所應當的。不過,更重要的是,閆俊杰在這次訪談里讓我看到了有意思的變化。甚至可以說是個階段性的蛻變。
今天我就說說我看到的閆俊杰和他最近這些變化到底是什么?
01
一定要搞一次「純粹」的技術創業
過去 20 多年,我深度交流、了解、持續觀察過大幾百個創業者。如果我非要給閆俊杰貼一個標簽,那在我眼里,「渴望純粹」的技術創業者可能是最貼切的。
這要從他「小時候」說起。其實閆俊杰認識我,比我認識他早。因為我們倆第一次見面時候他和我說,早在他大學時期,他就是我當年做科技雜志主編時候的讀者,甚至現在竟然還著記得一些當時我每期《編者的話》里關于科技趨勢的一些「暴論」觀點。
我這輩子做內容一直圍著技術趨勢和產品創新在轉,可能從來沒有贏得過「大眾」讀者群。所以得知一個當時的大學生就對這些「小眾科技內容」如數家珍,看得出來他首先是個「真極客」。
「真極客」對技術的趨勢都是敏感的。外界往往覺得中國這一波大模型創業浪潮是被 2022 年底的 ChatGPT 引爆的,但在閆俊杰的時間表里,他早在 2021 年底就已經出發了。
在創建自己的公司之前,他是商湯最年輕的 CTO。他在商湯科技 7 年,經歷了 AI 1.0 時代的整個周期。我記得 2023 年極客公園前沿社冬季會晤的一場閉門交流中,閆俊杰曾經分享過那個技術時代的無奈:那是一個模型不通用,只能靠工具補齊的時代。A 有需求就為 A 定制一個模型,B 有需求就為 B 定制一個模型。業內唯一能做的通用化努力,只是把生產工具做通用了,用來更批量地生產那些注定無法通用的模型。
這種范式看起來熱鬧,但本質上沒有跳出做項目的桎梏,邊際成本極高,社會價值卻很薄。這個技術底座上,根本不可能做一個「純粹」的技術創業。這一度讓他很沮喪和迷茫。
說白了:如果繼續沿著舊路走,為了定制模型而把工具做通用,是死路一條。真正的出路必須反過來——把模型本身變成通用的。只有模型足夠通用,定制成本才會歸零,技術才能真正普惠。
這個認知的轉折點發生在 2020 年的一個深夜。當他第一次讀到 CLIP 的論文時,那種沖擊感讓他激動的兩三天沒睡著覺。他在那篇論文里看到了一個驚人的未來:文本和圖像之間的柏林墻倒塌了,它們在深度學習的底層本質上是統一的。這意味著 AI 1.0 的死結解開了:只要預訓練模型做得足夠好,AI 就通用地處理世間萬物。
在這次老羅的采訪中,他又一次提到:「當這件事發生時,如果你真的相信人工智能,你就應該去做點什么。」于是,他幾乎立即決定 All in 開始自己的 AI 創業。
當 2022 年末 ChatGPT 橫空出世的時候,剛開始創業的 MiniMax,其旗下的 Glow 每天處理著數以億計的 Token,體量一度超過早期的 ChatGPT。這看起來似乎還不錯,但實際上是令人擔憂的。
我曾經問過閆俊杰他有沒有遺憾當時 Glow 這個產品形態的選擇問題?閆俊杰的思考有點不一樣,他覺得 Glow 停留在娛樂層面,并非產品定位的主動選擇,而是被當時的技術水位鎖死了邊界——是一個模型的技術能力,決定了一個產品的最終形態。
這一認知,被隨后的一次事故殘酷的印證了:僅僅因為一次參數調整導致對話智能度輕微下降,三天內活躍用戶就跌去了 30%。
這讓他進一步確信,依托技術創新的商業回報不是靠運營、技巧和工程復雜度堆砌的,而是底層技術能力的直接映射。在這個邏輯里,追求 AGI 與追求商業回報不再是兩條平行線,而是完全重合的同一條曲線——智能每提升一分,用戶的留存時長就增加一分。漂亮的商業數據不再是技術的對立面,而是檢驗模型是否逼近 AGI 真相的唯一試卷。而這,就是所謂「更純粹的技術創業」。
自此之后,MiniMax 所有不太容易被人理解的決策,都基于這套邏輯。比如 2023 年,當大多數人還在研究如何復現 LLaMA 時,MiniMax 決定要做 MoE(混合專家模型)。在當時,除了不開源的 OpenAI,外界幾乎沒有成熟參考,這是一片無人區。選擇這條路,意味著沒有開源社區的作業可抄,一切都要摸黑探索。代價是慘重的——MiniMax 經歷了 3 到 4 次嚴重的預訓練失敗,每一次模型崩了,就意味著兩個月的研發周期白費,以及單次高達 1500 萬美金的算力成本打了水漂。
時代給了搞技術的新環境,這時候最關鍵的就是不能有「燒錢的羞恥感」,這背后核心是要有信仰和夠堅定。如果相信MoE 架構的上限更高。為了那個能支撐起大幾千億參數的上限,他需要更純粹,必須忽略「算小賬」。
在這次羅永浩的對談里,他講到的敢于在全模態上做研發,也是同樣的邏輯。
在創業第一天,他的動力和決心都是來自于一個論斷:真正的 AGI 一定是多模態的。但是對于一個早期資源有限的創業公司,真要要堅持文本、語音、視覺三線并行確實很少見,因為在旁人眼中這是「兵力分散」。
最終讓閆俊杰堅持踐行這個論斷的,本質上還是基于第一性原理的「純粹」。他發自內心的相信 Scaling Law,相信不同模態在深度學習層面是等價的,那么即便早期眾所周知的算力限制,不能上來就搞「原生多模態」,但是 MiniMax 還是堅持把它們作為三個獨立模型訓練。看得出來,他始終在為最終的融合做準備。
選擇單獨的模態聚焦「放衛星」維持「技術形象」,是資源有限條件下的「精神勝利法」。但如果更純粹一些去看技術競爭的底層,還是需要直面有限資源,但不能放棄解決根本問題。
哪怕要走之字形路線,要有點悲壯的長期「追趕」,也沒關系。因為這才是那個「更純粹的選擇」。
02
在「沖擊」里才能鍛造「道路自信」
我相信對閆俊杰和國內其它很多大模型創業者,2025 年都是天崩開局。
2025 年春節,DeepSeek R1 的突然爆發,給整個國內大模型行業帶來了巨大的沖擊。那種震撼感,不亞于當年的 ChatGPT,幾乎在一段時間內把所有國內大模型創業者都「干自閉了」,所有人都沉默了相當長時間。
我看到在和老羅的采訪中,閆俊杰也很坦誠地回溯了那個時刻,他也陷入了長久的自我反思。別人的成果突破帶來的沖擊,直接讓他開始自省:是技術路線有問題嗎?是我們的團隊降低了要求?還是我們搞了其他的雜念,在追求 AGI 的路上不夠堅定了?
我相信對于國內所有的大模型公司,「自省」之后,都面臨著選擇。一方面是國內同級生里出現了得高分的同學,這已經動搖了大家反正都相對落后硅谷的「模糊狀態」,這時候必須對于是否要繼續海量投入,繼續在模型本身較勁追趕甚至尋求超越做選擇。
面對國內本身就看重盡早產生商業收入的「資本審美」,如果你不能破釜沉舟在技術上緊緊咬住,甚至能保持領先的極少數,那就真不如盡早思考「開源節流」的事情了。
據我了解,閆俊杰的選擇是把自己更徹底地扔進模型技術這個更純粹的維度去死磕。曾經被外界還有猜測所謂依托模型可用能力「沿途下蛋」做產品工廠,去抓用戶提收入,進而支撐估值邏輯的另一種路線,反而明確不存在了。閆俊杰的選擇是「華山只有一條路」和「狹路相逢不能躲」。
有意思的是,他還做了一個極其實用、也極其簡單有效的決定——在戰略上堅決聚焦技術,同時組織上,發更多的錢!用這種最直接實在的方式,讓大家把丟掉的信心撿回來,把分散的注意力聚回來。還是那個邏輯,忠于目標,做該做的有效動作,不要有「羞恥感」。
在我看來 2025 年這一年,MiniMax 的聚焦和堅定之后,確實連續打贏了三場堅定信心的硬仗:
(1)架構創新的搶跑:2025 年 1 月,當行業還在 Transformer 的舒適區里內卷時,MiniMax 率先發布了國內首個線性注意力架構(Linear Attention)模型 MiniMax-Text 01;6 月,更是開源了全球首個大規模混合架構推理模型 MiniMax-M1。
雖然后來的 M2 模型并未完全沿用這一特定架構,但這種敢于偏離主流的探索本身,在我看來是有含金量的。它證明了 MiniMax 絕不是只會等著硅谷發論文再跟進的好學生,而是真正嚴肅的 AGI 挑戰者——敢于為了更高的上限,去試錯別人沒走過的路,去無人區尋找更優解。
(2)底層算法的反向輸出:在 M1 模型中,MiniMax 還提出了一種全新的強化學習算法CISPO。這不僅僅是一個技術名詞,因為隨后硅谷巨頭 meta 發布的 ScaleRL 訓練框架也采用了這一算法。這是中國創業公司在底層算法邏輯上,對國際巨頭的一次罕見且硬核的技術輸出。
(3)定義交互的新標準:到了 10 月,隨著 M2 模型的發布,MiniMax 首次將 Interleaved Thinking(交錯思維鏈)推向了行業標準。這種讓模型「像人一樣邊想邊做」的能力,迅速獲得了 OpenRouter 等國外知名開發者平臺的支持。隨后,不少大模型公司才紛紛跟進。這一次,不再是硅谷定義規則,而是 MiniMax 在定義什么是「更好的交互」。
這三場戰役之后,在和老羅的對談中,我其實反而看到了和年初時候相比,一種不一樣狀態的閆俊杰:似乎一種松弛感出現了。這種松弛感,可能也是因為他手里拼圖的最后一塊——文本模型,終于拼上了。
他和老羅的交流里,其實有一段很重要的信息。當時非常坦誠地盤點了一下 MiniMax 的家底:兩年前,他們的語音模型做到了國際領先;一年前,視頻生成模型也沖到了國際前列;連音樂模型現在也是全球三強。唯獨語言模型,之前一直還要差點火候。但隨著這次新模型 M2 的發布,MiniMax 的語言模型得到了國際開發者的認可,開始被用來做 Agent 和寫代碼——這意味著 MiniMax 補齊了最后一塊短板。
他向老羅描繪了一個比外界認知更加殘酷的 AI 技術競爭格局。他認為在美國,真正能坐在大模型牌桌上的其實只有四家公司:OpenAI、Google、Anthropic,以及 X.AI。那么他心中 MiniMax 的位置,則是成為全球極少數具備全模態整合能力的公司。「客觀來看,我們可能是中國唯一一家,在文本、視頻、語音、音樂全模態上都做到國際領先的公司。」
而讓他在這個全球技術格局中保持自信的,是中國公司獨特的「效率優勢」。比如他跟老羅算了一筆賬:美國的這四家核心公司,估值和收入可能是中國公司的 100 倍,但技術領先幅度可能只剩下 5%。「中國公司花美國同行 1/50 的錢,做出來的效果只差 5%,而且這個差距還在縮小。」
閆俊杰相信當全模態的數據和模型完成最終整合時,將通向一個從量變到質變的時刻。「我們現在還沒有合在一起。我覺得實際上現在是我們最虛弱的時候。」
這句話的坦誠是符合閆俊杰的性格的,但這句「現在是我們最脆弱的時候」在公開訪談里說出來,是不符合他這些年來對外溝通的謹慎風格的。這種變化,只能說明他內心應該已經完成某種印證「道路自信」的構建。
能說自己現在很脆弱的人,大多不那么脆弱。他已經看到了某種明確技術能力上的自信。其實閆俊杰是一位非常關注底層邏輯的人,但如果有自信,一定是因為一些底層邏輯得到了驗證。比如過去兩年外界對谷歌一度非常看衰,覺得巨頭掉隊了。但閆俊杰卻一直非常篤定地跟我說:「谷歌一定會追上來」,「他們的 TPU,非常值得關注進展」。
現在看來他說的是對的,他看透了算力基建對模型迭代的決定性支撐,以及 TPU 和模型深度共振的意義。今年 Google 的帝國反擊戰,確實也和其充分利用了 TPU 這個陣地,進行了充分發揮優勢的技術突破緊密相關。
那么從這個訪談里看到的 Minimax 多模態模型能力「分頭并進,最終融合」的路徑,可能就是閆俊杰道路自信里重要的底層邏輯。
從他這次和老羅的交流細節來看,有理由相信,「天崩開局」的 2025,可能也恰恰是閆俊杰自身「道路自信」最終建立的 2025。
03
商業世界里談理想和追求,
不應該再有「羞恥感」
曾幾何時,在中國做一家真正的技術公司,想很純粹的依托技術本身形成大的商業價值閉環,是無比艱難的。過去很多年,所謂技術公司跑到最后,技術本身都往往只是個在最終價值創造中看似不可或缺,但其實也占比很少的東西。
這可能來自于技術本身在特定時期的局限,也一定和我們的特定時期的商業環境有關。但不管怎樣,那些出發時候帶著技術信仰和熱情的創業者們,很多人也被商業世界的調教到要不就是放棄最初的目標,要不就是不得不接受現實,去適配環境,甚至被環境所改造。
由于幾乎沒有新興技術創業公司的成功案例,以至于一段時間以來,技術理想這個真正的「核動力」,在一個人或者公司沒做出偉大成果之前,都是「不足為外人道也」。甚至是在商業世界你公開說「理想和追求」,都成了有點「羞恥感」的東西,因為很少有人理解和相信,還會覺得你裝 X。
但到了今天這個新的技術時代和新的社會環境,情況也應該開始改變了。很多人覺得只有硅谷可以支持「技術理想」,但我覺得不要簡單接受結論,而是要拆解為什么是這樣,以及改變怎樣才能發生。
歷史可以告訴未來,但歷史不會就是未來。這種改變需要的可能就是一個合適的技術時代和一個足夠成功的案例,之后星星之火未必不能燎原。
就像很多人都沒意識到,DJI 這樣的一家公司,在深圳就激勵了多少新的硬件創業者敢于鄙視「性價比」,進而敢于要做全球最好的產品,拿到最高的毛利,然后做更偉大的公司。今天這不就是新的常態嗎?
「純粹」是有意義的,把更高的技術追求和更大的商業價值結果變成一個統一邏輯,開始成為越來越符合時代和環境的技術創業路徑。
看了閆俊杰和羅永浩這這四個小時的交流,能感受到閆俊杰這幾年的從思考到實踐的閉環,正在打破了一種隱形的「理想主義羞恥感」,不再把技術追求包裹到某個流行的,為了取悅投資人的商業故事里,而是寫下一個自帶生命力的、統一的新故事。
它的好處是,你不再對世界有局促和含蓄,而變成了坦蕩——只要你自己足夠相信這個「大一統」故事,就可以說出來和值得做下去。該羞恥的是那些只看見歷史,而不敢下注未來的人,不是這些技術創業者們。
在和老羅的采訪中,閆俊杰有一段說的挺好的:如果要反思技術做得好,到底需要什么。他把它總結為兩個詞,一個是想象力,一個是自信。美國企業在自信方面做得很好,他們敢于講我要引領這個行業。中國科技企業要更上一個層面,要引領世界,歸根到底也需要坦蕩的自信。
世界總有人會相信和支持你,管他是因為發自內心的認同,還是不明就里的 FOMO。時代給了技術創業者偉大的機遇,如果本身所有投資人最終都要浪費 95% 的錢(這就是風險投資投資的本質),就讓他們都浪費在「哥倫布」身上,這才更有意義。









