在近期舉辦的AI創造者嘉年華上,一場圍繞AI Agent創業的深度討論吸引了眾多行業人士的關注。語核科技創始人翟星吉、Flowith聯合創始人拐子、Macaron創始人陳鍇杰、RockFlow創始人賴蘊琦以及硅星人合伙人王兆洋,展開了一場別開生面的“辯論”。
討論伊始,王兆洋便拋出了通用與垂直這一AI Agent創業中繞不開的話題。他指出,這個話題如同一個筐,什么都能往里裝,而其背后實則關聯著對AI Agent本質的思考——到底什么是AI Agent?
陳鍇杰率先回應,他表示在討論之前甚至都沒想過產品是垂直還是通用。今年初,團隊發現AI在生產力方向已解決不少問題,但用戶生活需求仍有大量空白。一方面,AI缺乏對用戶的記憶,給出的內容可能正確卻無用;另一方面,缺少輔助小工具。基于此,Macaron應運而生,旨在通過Personal Agent為用戶打造類似mini app的工具,解決生活問題。
拐子則從Flowith的發展歷程說起。去年8月發布首個Agent時,他們將其定義為AI for DeepWork,希望既能用于深度調研工作,也能在內容創作領域發揮作用,如為新聞工作者輸出高質量研報,為自媒體工作者制作短視頻和圖文,甚至涉及代碼方向的原型圖設計等。在他看來,Flowith偏向創作領域,雖可做的事情較多,但與真正的通用Agent仍有距離,因為通用Agent在用戶認知中應具備無所不能的能力,而目前他們更愿聚焦創作場景。
翟星吉透露,語核科技從去年探索AI方向時,就明確要走垂直路線。基于AI在企業中作為生產力工具的定位,他們認為每個員工都應有垂直對應的Agent。從商業邏輯角度,創業公司需聚焦,通過在特定崗位積累知識和數據,基于數據開展工程化或模型化工作,以實現可交付的結果。
隨著討論深入,話題逐漸轉向在強大模型面前,AI Agent的生存空間與發展方向。王兆洋提及,此前與Manus交流時,對方也探討了通用與垂直的話題。Manus認為一開始選擇單一場景,可能導致用戶僅在特定需求時打開產品,為留住用戶而考慮走向通用。但這并非事先規劃,而是在市場競爭和概念討論中逐漸形成的分類。
陳鍇杰回應稱,大家在討論通用與垂直時,似乎都在逃避競爭。將產品定義為垂直,是為了表明各自領域的獨立性,避免正面沖突,以實現共同融資和發展。他指出,在海外做通用Agent,直接面臨與ChatGPT的競爭,而ChatGPT用戶量增長迅速,許多功能也在不斷完善。因此,應關注如何在特定場景中提供比ChatGPT更好的解決方案。
拐子結合Flowith的新Agent分享了看法。他們內部將新Agent戲稱為“太監”,實則是聆聽者Agent。他認為,雖然模型未來可能具備Agent能力,但從市場角度,AI Agent市場巨大,用戶更關心產品能否解決實際問題,而非產品屬于通用還是垂直類別。目前,AI Agent通過將輸出結果轉化為可交付的形式,如PPT、視頻等,為用戶帶來了更進一步的體驗,這是其存在的價值。即使模型未來向類似方向發展,仍可能采用Agent的實現方式,因此通用Agent并非偽命題。
當被問到是否認為在模型面前通用Agent是偽命題時,拐子表示不確定,但強調用戶更關注產品解決的具體問題,而非產品定義。他認為,作為CMO同時具備產品經理角色,有助于更貼近用戶,了解產品定位和用戶需求,這也是與大廠競爭的優勢。
陳鍇杰進一步闡述了對通用、Agent和模型關系的看法。他指出,去年討論通用Agent時,是基于預訓練的視角,但隨著RIO1的出現,模型智能提升主要依靠強化學習和后訓練。不同大模型因強化學習方向不同,已出現場景分化,如Anthropic在代碼領域表現優異,OpenAI在通用問題回答和內心療愈方面更勝一籌。因此,討論模型是否通用意義不大,創業公司應聚焦自身領域,找到適合的課題。
討論中,王兆洋提出了一個尖銳問題:“只服務一個場景的Agent是不是預制菜?”賴蘊琦以RockFlow為例進行解答。RockFlow專注于投資交易領域,雖然場景垂直,但不同場景下的Agent可相互協作。例如,用戶的健康數據可輔助交易Agent做出更合理的決策。她認為,只要能解決用戶問題,就是有價值的產品,不必糾結于通用或垂直的區別。
翟星吉則堅定地認為只服務一個場景的Agent是預制菜,但這是積極意義上的。他解釋道,垂直場景下的Agent因擁有該場景更多更好的數據,能通過工程化或模型微調等手段,將數據和知識轉化為產品,為用戶提供更好的體驗。這類似于預制菜,通過提前準備和優化,實現高效交付。
在探討AI Agent的核心定義時,王兆洋分享了此前聽到的兩個精彩觀點,一是“Models using tools in a loop”,二是將Cursor為開發者帶來的體驗推廣到所有行業。隨后,他邀請四位嘉賓用一句話闡述對AI Agent的理解。
陳鍇杰認為,能幫用戶做事的就是Agent,實現方式可隨技術發展而變化,關鍵在于滿足用戶需求。拐子表示,AI Agent是一個可以感知環境的智能實體,能收集和儲存Context,未來Multi-Agent將是發展趨勢。翟星吉從組織變革視角出發,認為真正能交付以前由人完成的工作,并做好做透的,就是Agent,未來可能是Multi-Agent系統。賴蘊琦則強調,解決問題的節點都可稱之為Agent。
王兆洋還提出了一個有趣的問題:能否想象RockFlow長成Macaron的樣子?賴蘊琦和陳鍇杰均表示兩者有相似之處。RockFlow倡導投資是一種生活方式,與Macaron從生活角度出發的理念相通。未來,Macaron也可能接入類似交易的場景,存在融合發展的可能性。同時,他們也指出,不同領域的Agent可滿足用戶個性化需求,如RockFlow針對年輕投資者,通過AI技術實現個性化投資體驗,這與新一代用戶表達自我、追求個性化生活的需求相契合。
針對產品不成熟情況下是否可做增長的問題,賴蘊琦以RockFlow為例說明。她表示,AI無法完成從0到1的工作,產品初期需用戶表達需求,產品再基于需求提供相應信息和操作建議。在金融監管要求下,產品通過多次確認保障用戶操作安全,重點在于在用戶邏輯基礎上提供投資行動建議,而非直接做選擇。
當被問到Flowith與語核是否可互相替代時,翟星吉和拐子均認為兩者關系不大。翟星吉表示,語核的垂直Agent與Flowith的創作場景和交互模式差異明顯,不存在替代可能性。拐子強調,Flowith起源于對多線程人機交互方式的探索,雖與其他產品在技術上有相似之處,但出發點和產品理念不同,未來將繼續圍繞畫布進行創新,提供更自由的交互體驗。
在技術層面,王兆洋提及Lilian Weng文章中列出的Agent結構,包括Memory、Action、Tools和Planing四個部分,并詢問當前技術突破的重點。陳鍇杰指出,當前技術核心在于Context engineering和Reinforcement learning。Context engineering以Manus為代表,迭代速度快,但存在系統優化不平衡的問題;Reinforcement learning以DeepSeek、Kimi等為代表,通過唯一指標實現模型優化,但指標確定和技術難度較大。他認為,在AI不斷進步的背景下,關注場景應用和價值創造更為重要。
拐子分享了Flowith在Context Engineering方面的實踐。他們通過無限上下文等工程優化,提升產品性能。以寫論文為例,他們借鑒人類思維模式,打破傳統AI工作順序,同時注重任務完成后的優化工作,但在優化過程中需考慮成本和場景適配問題。他還提到MCP工具生態的發展,以及Agent公司在工具選擇和開發方面的挑戰。
翟星吉將語核科技的技術努力分為三層。第一層是內容解析能力,包括對復雜文檔、音視頻等的理解,這是保證結果準確率的基礎;第二層是上下文管理,針對不同崗位信息的特點,進行合理的組織和使用;第三層是內置workflow的tools,將人類在特定場景下的先驗知識封裝成工具,供上層Agent調用,以提高效率和泛化性。
最后,賴蘊琦總結道,技術提升需根據業務場景確定關鍵問題,選擇最適合的技術方案。她堅信AGI終將到來,當前應充分利用現有技術,為用戶提供優質產品。











