勞德研究所近日正式推出名為“彈弓”的首批人工智能專項資助計劃,目標直指推動人工智能領域的科學探索與實踐應用。該計劃通過整合資金、算力資源及工程支持,為研究人員提供超越傳統學術框架的配套條件,加速人工智能技術的突破與落地轉化。作為資助條件,受資助方需承諾產出具有商業轉化潛力的成果,包括但不限于初創企業、開源技術或創新研究報告。
在首批入選的15個項目中,AI評估體系的優化成為核心關注方向。多個項目已在行業內引發關注,例如專注于命令行編碼能力測試的Terminal Bench工具,以及持續更新通用人工智能能力評估標準的ARC-AGI項目。這些項目通過構建標準化測試框架,為AI性能衡量提供了可量化的參考依據。
針對當前評估機制存在的局限性,多支跨學科團隊提出了創新解決方案。加州理工學院與德克薩斯大學奧斯汀分校聯合開發的Formula Code項目,通過模擬真實代碼優化場景,評估AI代理的改進能力;哥倫比亞大學團隊設計的BizBench平臺,則聚焦白領工作場景,構建覆蓋商業決策、文檔處理等任務的復合測試體系。部分項目嘗試結合強化學習與模型輕量化技術,探索建立跨領域通用的評估標準。
值得關注的是,SWE-Bench聯合創始人John Boda Yang攜新項目CodeClash加入資助計劃。該項目借鑒競賽式評估模式,通過動態任務設計測試AI代碼生成能力。Yang在訪談中強調,第三方基準測試的開放性對行業健康發展至關重要,但需警惕評估體系被單一企業壟斷的風險,這可能阻礙技術創新的公平競爭環境。勞德研究所通過“彈弓”計劃構建的產學研協同網絡,正在重塑人工智能技術的轉化路徑。該計劃不僅為前沿研究提供資源支持,更通過設定明確的轉化目標,推動學術成果向商業應用的快速過渡。這種模式被業內視為破解AI評估體系碎片化難題的重要嘗試,其實際效果將持續引發關注。






