在第二屆CCF中國(guó)數(shù)據(jù)大會(huì)上,螞蟻數(shù)科宣布了一項(xiàng)重要舉措:正式開源其數(shù)據(jù)智能體核心技術(shù)Agentar SQL的全套資料,涵蓋論文、代碼、模型以及詳細(xì)的使用指南。這一技術(shù)旨在讓非專業(yè)人士也能通過(guò)自然語(yǔ)言輕松完成商業(yè)數(shù)據(jù)的查詢與分析,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加精準(zhǔn)、實(shí)用的智能數(shù)據(jù)分析基礎(chǔ)。
作為首期開源內(nèi)容,螞蟻數(shù)科推出了實(shí)時(shí)文本轉(zhuǎn)化結(jié)構(gòu)化查詢語(yǔ)言(Text-to-SQL)框架,為開發(fā)者提供了一套即插即用的數(shù)據(jù)查詢解決方案,顯著提升了文本與數(shù)據(jù)庫(kù)查詢之間的交互效率。未來(lái),該公司計(jì)劃在2026年陸續(xù)開源更多技術(shù)框架,包括數(shù)據(jù)庫(kù)理解與挖掘、行業(yè)知識(shí)挖掘以及實(shí)時(shí)多輪交互技術(shù),覆蓋從意圖理解到業(yè)務(wù)理解再到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。
由該技術(shù)支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL,已在全球權(quán)威的自然語(yǔ)言轉(zhuǎn)結(jié)構(gòu)化查詢語(yǔ)言(NL2SQL)評(píng)測(cè)基準(zhǔn)BIRD-SQL中脫穎而出,力壓Google等國(guó)內(nèi)外知名企業(yè),登頂排行榜。目前,該智能體在執(zhí)行準(zhǔn)確率和執(zhí)行效率兩大榜單上均保持領(lǐng)先地位,持續(xù)領(lǐng)跑超過(guò)兩個(gè)月。BIRD-SQL評(píng)測(cè)要求AI模型將自然語(yǔ)言查詢精準(zhǔn)轉(zhuǎn)換為SQL,并在真實(shí)復(fù)雜的大規(guī)模生產(chǎn)級(jí)數(shù)據(jù)庫(kù)中穩(wěn)定運(yùn)行。其數(shù)據(jù)集涵蓋金融、電力、醫(yī)療等37個(gè)行業(yè)場(chǎng)景,總量達(dá)33GB,包含超過(guò)1萬(wàn)條高復(fù)雜度查詢?nèi)蝿?wù),被公認(rèn)為全球最具挑戰(zhàn)性的NL2SQL測(cè)試。
研究機(jī)構(gòu)數(shù)據(jù)顯示,全球商業(yè)智能市場(chǎng)規(guī)模預(yù)計(jì)在2025年達(dá)到474.8億美元,而中國(guó)商業(yè)智能與分析軟件市場(chǎng)規(guī)模則有望達(dá)到12億美元。到2028年,中國(guó)商業(yè)智能軟件市場(chǎng)規(guī)模預(yù)計(jì)將增長(zhǎng)至17.9億美元,未來(lái)五年年復(fù)合增長(zhǎng)率(CAGR)為12.7%,成為企業(yè)智能技術(shù)投資的重要領(lǐng)域。
當(dāng)前,中國(guó)企業(yè)在商業(yè)智能與分析產(chǎn)品的應(yīng)用深度上存在較大差異,多數(shù)企業(yè)仍集中在數(shù)據(jù)可視化和簡(jiǎn)單分析需求,如報(bào)表、駕駛艙、儀表板等。然而,如何在保證準(zhǔn)確性的前提下,提升技術(shù)在真實(shí)生產(chǎn)環(huán)境中的可用性,仍是NL2SQL在產(chǎn)業(yè)中規(guī)模化落地的普遍難題。
螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人章鵬在會(huì)上指出,NL2SQL在實(shí)際應(yīng)用中面臨四大挑戰(zhàn):理解人類口語(yǔ)的模糊多義性、注入龐大的行業(yè)專業(yè)知識(shí)、解析復(fù)雜的數(shù)據(jù)庫(kù)結(jié)構(gòu)與關(guān)聯(lián),以及生成準(zhǔn)確無(wú)誤的復(fù)雜SQL語(yǔ)句。這些挑戰(zhàn)表明,簡(jiǎn)單的模型“套殼”無(wú)法滿足企業(yè)級(jí)應(yīng)用的可靠性與準(zhǔn)確性要求。
以金融領(lǐng)域?yàn)槔瑥臉I(yè)者需要結(jié)合復(fù)雜業(yè)務(wù)規(guī)則與多條件組合進(jìn)行數(shù)據(jù)查詢,以有效分析產(chǎn)品數(shù)據(jù)。而在業(yè)務(wù)管理中,非專業(yè)數(shù)據(jù)分析人員的口語(yǔ)化提問(wèn),則需要產(chǎn)品能夠準(zhǔn)確理解行業(yè)術(shù)語(yǔ)和詢問(wèn)意圖,并與數(shù)據(jù)庫(kù)字段精準(zhǔn)匹配,才能生成真實(shí)準(zhǔn)確的結(jié)果。
章鵬強(qiáng)調(diào),BIRD-SQL主要評(píng)測(cè)SQL的復(fù)雜度生成能力(在線擴(kuò)展OnlineScaling),但要實(shí)現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術(shù),必須構(gòu)建更完整的能力棧。除了在線擴(kuò)展,還需包括離線擴(kuò)展(Offline Scaling),即對(duì)數(shù)據(jù)庫(kù)的深度理解與知識(shí)結(jié)構(gòu)化;人機(jī)交互(Human Interaction),即智能體識(shí)別自身不確定性,主動(dòng)與用戶澄清意圖,實(shí)現(xiàn)白盒化、可糾錯(cuò)的協(xié)作;以及自我進(jìn)化(Self Evolution),即通過(guò)“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復(fù)用等“免調(diào)優(yōu)”技術(shù),使智能體能夠從錯(cuò)誤中學(xué)習(xí),持續(xù)提升,降低對(duì)大量標(biāo)注數(shù)據(jù)和專家調(diào)優(yōu)的依賴。
螞蟻數(shù)科計(jì)劃逐步開源這些更全面的能力模塊,如理解數(shù)據(jù)庫(kù)的Agentar Profiling-SQL、實(shí)現(xiàn)免調(diào)優(yōu)進(jìn)化的Agentar TuningFree-SQL等。目前,首期在線擴(kuò)展框架Agentar-Scale-SQL的開源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺(tái),供開發(fā)者免費(fèi)使用。










