由清華大學計算機系崔鵬教授團隊與穩準智能聯合研發的結構化數據通用大模型“極數”(LimiX)近日正式開源,標志著我國在結構化數據智能應用領域實現技術突破,并為產業生態開放提供關鍵支撐。該模型通過降低AI技術門檻,將推動泛工業領域智能化轉型,助力破解工業數據價值挖掘難題,為智能制造與新型工業化注入新動能。
在泛工業領域,結構化數據的智能處理能力直接影響生產效率與科研創新。傳統方法依賴語言大模型(LLM)或私有數據+專用模型,但存在準確率低、泛化能力差、通用性不足及成本高昂等問題,嚴重制約AI技術在工業場景中的落地應用。“極數”大模型通過學習數據因果關系,構建了適應多任務場景的智能底座,可高效完成分類、回歸、缺失值預測、數據生成及因果推斷等任務,為工業生產全流程提供智能化解決方案。
研發團隊由清華大學計算機系崔鵬教授領銜,成員包括國家杰出青年科學基金獲得者、國家自然科學二等獎得主及國際計算機協會(ACM)杰出科學家。團隊在學術研究與產業落地方面兼具深厚積累,為模型性能突破提供保障。評測階段,“極數”選取Talent等權威開源數據集作為基準,覆蓋上百個真實工業場景。在分類任務中,該模型AUC、ACC、F1Score及ECE指標均達最優,顯著超越24個領域內最優模型;在回歸任務中,R2與RMSE指標平均表現最優,尤其在數據存在干擾特征時優勢更為突出。
目前,“極數”大模型已在多個關鍵工業場景中實現規模化應用。在工業運維領域,模型為鋼鐵、能源電力等行業提供設備運行監測、故障預警及健康度評估服務;在工藝優化領域,模型成為化工、制造、生物等行業的“生產智囊”,助力工藝參數動態調整;在市場預測領域,模型為能源、零售、農業及消費品等行業提供風險規避、成本控制與盈利提升的決策支持,成為應對市場波動的“交易智囊”。其通用建模能力有效突破傳統專用模型在數據稀缺、質量參差及環境異質場景下的局限,形成面向泛工業垂直行業的智能核心。
“極數”大模型現已開源,用戶可通過Github、Huggingface及Modelscope等平臺搜索LimiX獲取代碼與文檔。該模型的發布不僅推動了結構化數據智能技術的普及,更為我國產業技術變革與優化升級提供了可復制、可擴展的解決方案。











