由清華大學(xué)計(jì)算機(jī)系崔鵬教授團(tuán)隊(duì)與穩(wěn)準(zhǔn)智能聯(lián)合研發(fā)的結(jié)構(gòu)化數(shù)據(jù)通用大模型“極數(shù)”(LimiX)近日正式開(kāi)源。這一突破標(biāo)志著我國(guó)在結(jié)構(gòu)化數(shù)據(jù)智能處理領(lǐng)域?qū)崿F(xiàn)了技術(shù)自主創(chuàng)新與生態(tài)開(kāi)放,為降低工業(yè)領(lǐng)域AI應(yīng)用門(mén)檻提供了關(guān)鍵解決方案。特別是在泛工業(yè)場(chǎng)景中,該模型將有效破解工業(yè)數(shù)據(jù)價(jià)值挖掘難題,推動(dòng)智能制造與新型工業(yè)化進(jìn)程。
泛工業(yè)領(lǐng)域長(zhǎng)期面臨結(jié)構(gòu)化數(shù)據(jù)處理的技術(shù)瓶頸。傳統(tǒng)方法主要依賴語(yǔ)言大模型(LLM)或私有數(shù)據(jù)+專用模型的組合,但存在準(zhǔn)確率不足、泛化能力弱、通用性差、成本高昂等缺陷。這些局限性嚴(yán)重制約了AI技術(shù)在工業(yè)場(chǎng)景中的規(guī)模化應(yīng)用,尤其在數(shù)據(jù)質(zhì)量參差不齊、環(huán)境異質(zhì)性強(qiáng)的條件下,傳統(tǒng)模型難以滿足實(shí)際需求。
“極數(shù)”大模型通過(guò)創(chuàng)新的數(shù)據(jù)因果關(guān)系學(xué)習(xí)機(jī)制,實(shí)現(xiàn)了對(duì)因果變量與數(shù)據(jù)分布的動(dòng)態(tài)捕捉能力。該模型可自適應(yīng)完成分類、回歸、缺失值預(yù)測(cè)、數(shù)據(jù)生成及因果推斷等任務(wù),展現(xiàn)出跨場(chǎng)景、多任務(wù)的通用性優(yōu)勢(shì)。在產(chǎn)業(yè)實(shí)踐中,單一模型已成功適配多個(gè)工業(yè)場(chǎng)景,獲得合作企業(yè)的高度認(rèn)可,成為泛工業(yè)垂直行業(yè)智能化的核心基礎(chǔ)設(shè)施。
研發(fā)團(tuán)隊(duì)由清華大學(xué)計(jì)算機(jī)系崔鵬教授領(lǐng)銜,成員包括國(guó)家杰出青年科學(xué)基金獲得者、國(guó)家自然科學(xué)二等獎(jiǎng)得主及ACM杰出科學(xué)家等頂尖學(xué)者。團(tuán)隊(duì)在模型評(píng)測(cè)中選取了Talent等權(quán)威開(kāi)源數(shù)據(jù)集作為基準(zhǔn),該數(shù)據(jù)集涵蓋上百個(gè)真實(shí)場(chǎng)景,是當(dāng)前結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域最具代表性的評(píng)測(cè)體系之一。實(shí)驗(yàn)結(jié)果顯示,“極數(shù)”在分類任務(wù)中AUC、ACC、F1Score和ECE四項(xiàng)指標(biāo)均達(dá)到最優(yōu)水平,顯著超越24個(gè)領(lǐng)域內(nèi)最優(yōu)模型。
在回歸任務(wù)評(píng)測(cè)中,“極數(shù)”大模型在R2和RMSE指標(biāo)上均取得平均最優(yōu)成績(jī),尤其在數(shù)據(jù)存在干擾特征或無(wú)效特征時(shí),性能優(yōu)勢(shì)更為突出。這種抗干擾能力使其在復(fù)雜工業(yè)環(huán)境中具有顯著優(yōu)勢(shì),為解決實(shí)際生產(chǎn)中的數(shù)據(jù)噪聲問(wèn)題提供了有效方案。
目前,“極數(shù)”已在多個(gè)關(guān)鍵工業(yè)領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用。在工業(yè)運(yùn)維方面,該模型為鋼鐵、能源電力等行業(yè)的設(shè)備監(jiān)測(cè)、故障預(yù)警及健康評(píng)估提供核心支持;在工藝優(yōu)化領(lǐng)域,成為化工、制造、生物等行業(yè)的“生產(chǎn)智囊”;在市場(chǎng)預(yù)測(cè)方面,助力能源、零售、農(nóng)業(yè)等行業(yè)應(yīng)對(duì)市場(chǎng)波動(dòng),為風(fēng)險(xiǎn)控制、成本優(yōu)化及盈利提升提供決策依據(jù)。該模型現(xiàn)已通過(guò)GitHub、Huggingface、Modelscope等平臺(tái)開(kāi)源,搜索“LimiX”即可獲取相關(guān)資源。











