“調查顯示,200家AI初創企業中有73%的產品實質為‘技術包裝’,核心依賴ChatGPT、Claude等第三方服務。”這一結論在AI創業領域引發廣泛爭議,也讓行業生態的真實面貌浮出水面。
2023年,OpenAI首席執行官山姆·阿爾特曼曾公開警告:“依賴ChatGPT包裝的企業終將消亡。”然而現實卻呈現相反態勢:ChatGPT的爆紅催生了投資熱潮,部分尚未推出產品的企業便已獲得資本青睞。軟件工程師特賈·庫西雷迪通過技術手段揭開行業“繁榮”表象下的真相——其團隊對200家AI企業進行逆向工程,發現大量宣稱“顛覆性創新”的公司實則依賴外部API,技術實現與市場宣傳存在顯著差距。
庫西雷迪的調查始于一個技術疑問。某日凌晨調試代碼時,他發現一家自稱擁有“自主研發深度學習基礎設施”的企業頻繁調用OpenAI API,而這家公司剛以“獨特AI技術”為由完成430萬美元融資。這一發現促使他展開系統性研究。
研究團隊構建了自動化分析工具,通過三周時間對200家AI初創企業進行技術拆解:從YC、Product Hunt等平臺抓取企業官網,監控60秒網絡流量,反編譯Javascript文件,比對API調用指紋,最終將企業宣稱的技術與實際實現進行對照。研究排除了成立不足6個月的企業,重點分析已獲外部融資且宣稱擁有“獨家技術”的初創公司。
數據顯示,73%的企業存在技術宣稱與實際不符的情況。研究將這類企業分為三類典型模式:
第一類企業將GPT-4包裝為“自研模型”。調查發現,37家宣稱擁有自研大語言模型的企業中,34家實際僅通過系統提示詞調用GPT-4。例如某企業代碼顯示,其“革命性自然語言引擎”本質是向GPT-4發送包含預設指令的請求,未進行任何模型微調或架構創新。該企業單次查詢成本約0.033美元,卻向用戶收取2.5美元,利潤率高達75倍。更極端的是,三家不同企業的代碼幾乎完全相同,包括變量名、注釋風格甚至“禁止提及OpenAI”的指令。
第二類企業采用RAG架構卻宣稱“自研基礎設施”。42家企業聲稱擁有“先進神經檢索+自研嵌入模型”,實際使用OpenAI文本嵌入模型、Pinecone或Weaviate向量數據庫,并調用GPT-4生成內容。某企業將這套標準流程包裝為“專有神經檢索架構”,單次查詢成本約0.002美元,卻向用戶收取0.5-2美元。12家企業代碼結構完全一致,23家相似度超90%,區別僅在于變量名或是否使用Redis緩存。
第三類企業宣稱“微調模型”實則依賴API。真正從零訓練模型的企業僅占7%,其基礎設施包括AWS SageMaker訓練任務、S3模型存儲等。而多數企業僅使用OpenAI微調API,本質是將提示詞和示例保存至第三方系統。
研究團隊總結了快速識別“技術包裝”企業的方法:通過瀏覽器開發者工具監控網絡請求,若出現api.openai.com等域名則屬此類;OpenAI API的響應時間通常在200-350毫秒之間;前端代碼若包含openai、claude等關鍵詞可能泄露API密鑰;營銷文案若大量使用“先進AI”“智能引擎”等模糊術語,而缺乏具體技術細節,則可能存在誤導。
調查顯示,AI初創企業的技術格局呈現明顯分層:73%的企業屬于“技術包裝”型,27%的企業可分為三類——透明包裝型(明確標注依賴GPT-4等API)、真實構建型(訓練醫療、金融等垂直領域模型)、技術創新型(開發多模型投票系統等新技術)。
這一現象引發多重影響:投資人可能為提示詞工程支付AI研究估值;客戶為API成本支付高額溢價;開發者發現核心技術門檻低于預期;整個生態因73%的企業夸大技術實力而呈現泡沫特征。
但研究也指出,合理的“技術包裝”具有商業價值。部分企業通過優化特定領域工作流、提升用戶體驗或構建數據管道,在底層使用第三方API的基礎上創造了實際價值。真正的風險在于技術宣稱與實際不符的誤導行為。
對于行業參與者,研究給出具體建議:創始人應誠實說明技術棧,在用戶體驗和行業知識上競爭;投資人應要求查看架構圖、API賬單,合理評估企業價值;客戶需檢查網絡流量、詢問基礎設施細節,避免為API調用支付過高溢價。
研究發布后,7位創始人私下聯系研究團隊,其中三家企業已著手修改營銷話術,將“專有AI”改為“基于頂級API開發”。一位創始人坦言:“我們知道在撒謊,但投資人期望這樣,整個行業都在這么做。”
庫西雷迪計劃在GitHub公開調查方法論,包括爬取基礎設施、API指紋識別技術、檢測腳本等工具。他強調:“市場最終會獎勵透明,即使初期可能受到懲罰。AI淘金熱不會結束,但誠實時代必須開始。”










