全球軟件行業(yè)正陷入一個吊詭的困局:AI編程工具的普及率達到歷史峰值,但軟件發(fā)布量卻始終未見爆發(fā)式增長。這種反差現(xiàn)象引發(fā)了一位從業(yè)25年的資深程序員的深度質(zhì)疑,他通過六周的實證研究,揭開了AI提效神話背后的殘酷真相。
這位化名"代碼老兵"的開發(fā)者,自述從琥珀色單色屏幕時代就開始編程生涯。當他看到METR研究指出開發(fā)者實際效率可能下降19%時,決定親自驗證AI工具的真實效果。通過硬幣決定是否使用AI的對照實驗,他發(fā)現(xiàn)六周內(nèi)收集的數(shù)據(jù)毫無統(tǒng)計顯著性,AI反而讓開發(fā)速度中位數(shù)下降21%。"這與METR的研究結(jié)果完全吻合,所謂的效率提升根本不存在。"他強調(diào)。
技術(shù)市場充斥著夸張的宣傳語:Cursor宣稱"非凡生產(chǎn)力",GitHub Copilot承諾"像老板一樣分配任務(wù)",谷歌聲稱其模型讓開發(fā)速度提升25%。但現(xiàn)實數(shù)據(jù)卻形成鮮明對比。Statista的全球軟件發(fā)布量圖表顯示,2022年AI工具大規(guī)模應(yīng)用后,曲線沒有出現(xiàn)任何"曲棍球棒式"增長,反而保持平穩(wěn)。Steam平臺的新游戲發(fā)布量、Verisign的域名注冊數(shù)據(jù)、GH Archive的開源項目更新量,均未顯示AI帶來的產(chǎn)出激增。
這種割裂現(xiàn)象正在產(chǎn)生嚴重后果。多位開發(fā)者反映,因未及時采用AI工具而被解雇,或被迫留在不理想的工作崗位。行業(yè)內(nèi)部形成惡性循環(huán):技術(shù)領(lǐng)袖基于FOMO心理,將公司轉(zhuǎn)型為"AI優(yōu)先",用虛構(gòu)的生產(chǎn)力敘事為裁員辯護,進而壓低開發(fā)者薪資。更荒誕的是,14%的開發(fā)者聲稱自己成為"10倍工程師",但全球軟件產(chǎn)出量卻未出現(xiàn)對應(yīng)增長。
實驗者用70美元通過BigQuery處理的數(shù)據(jù)顯示,GitHub的提交記錄在AI普及后沒有顯著變化。SteamDB的游戲發(fā)布圖表同樣平淡,2023年后未出現(xiàn)獨立開發(fā)者繁榮。這些數(shù)據(jù)直接挑戰(zhàn)了AI工具的核心賣點——如果真能提升效率,軟件市場本應(yīng)被海量新產(chǎn)品淹沒。
面對行業(yè)壓力,實驗者建議開發(fā)者保持理性:"如果AI工具讓你感覺笨重,數(shù)據(jù)會支持你的直覺。堅持使用有效的方法,你并沒有落后。"他特別指出,任何聲稱因AI成為"10倍開發(fā)者"的人,都應(yīng)該被要求出示具體成果,"拿不出30個今年開發(fā)的應(yīng)用,就別空口說白話"。
對于常見的辯解理由,實驗者逐一駁斥。針對"提示詞工程需要時間"的說法,他引用GitHub Copilot的數(shù)據(jù):用戶接受代碼建議的比例,從初始的29%經(jīng)過六個月僅提升至34%。關(guān)于"質(zhì)量提升但速度未變"的論調(diào),他指出行業(yè)代碼質(zhì)量實際倒退十年,"現(xiàn)在幾乎沒人做測試了"。
這場實證研究揭示的不僅是技術(shù)泡沫,更是整個行業(yè)的認知偏差。當技術(shù)領(lǐng)袖用虛構(gòu)的生產(chǎn)力敘事重塑企業(yè)時,真實開發(fā)者正在為無效工具付出代價。實驗者最后警告:"現(xiàn)在是2025年,這些工具已經(jīng)應(yīng)用數(shù)年卻依然糟糕。除非看到大規(guī)模交付產(chǎn)品的客觀證據(jù),否則所有關(guān)于AI提效的宣傳都該被視為謊言。"











