全球首個(gè)基于Model Context Protocol(MCP)架構(gòu)的開源檢索增強(qiáng)生成(RAG)框架UltraRAG2.1正式發(fā)布。這款由清華大學(xué)THUNLP實(shí)驗(yàn)室、東北大學(xué)NEUIR實(shí)驗(yàn)室、OpenBMB與AI9Stars聯(lián)合研發(fā)的框架,通過YAML配置文件即可完成多階段推理與生成任務(wù),徹底擺脫傳統(tǒng)代碼編寫的技術(shù)壁壘,為多模態(tài)智能檢索系統(tǒng)開發(fā)開辟新路徑。
在核心功能層面,UltraRAG2.1實(shí)現(xiàn)了原生多模態(tài)支持與跨模態(tài)檢索閉環(huán)。其內(nèi)置的VisRAG Pipeline可自動解析PDF文檔中的文字與圖表,構(gòu)建跨模態(tài)索引系統(tǒng)。科研人員通過"問圖答文"或"以文搜圖"功能,能快速從技術(shù)手冊、學(xué)術(shù)論文中提取關(guān)鍵信息。這種混合檢索模式突破了傳統(tǒng)文本檢索的局限,為復(fù)雜知識場景提供高效解決方案。
知識庫構(gòu)建方面,框架深度集成開源文檔處理工具M(jìn)inerU,支持Word、PDF、Markdown等格式的智能解析。系統(tǒng)自動完成語義分塊與結(jié)構(gòu)化處理,用戶無需手動清洗數(shù)據(jù)即可構(gòu)建企業(yè)級私有知識庫。該功能使知識管理效率提升數(shù)倍,特別適用于需要處理海量文檔的企業(yè)場景。
工作流標(biāo)準(zhǔn)化是UltraRAG2.1的另一大突破。框架提供全鏈路可視化操作界面,兼容Elasticsearch、FAISS等檢索引擎,以及Llama、Qwen、Kimi等主流生成模型。通過引入量化評估體系,開發(fā)者可從相關(guān)性、忠實(shí)度、流暢性等維度評估結(jié)果質(zhì)量,精準(zhǔn)定位系統(tǒng)瓶頸。這種標(biāo)準(zhǔn)化流程使RAG系統(tǒng)優(yōu)化周期大幅縮短。
MCP架構(gòu)的引入徹底改變了RAG系統(tǒng)的開發(fā)模式。傳統(tǒng)硬編碼方式被解耦為標(biāo)準(zhǔn)化"智能體"模塊,檢索、推理、生成等環(huán)節(jié)可通過YAML配置靈活組合。例如,用戶可通過幾行配置實(shí)現(xiàn)"技術(shù)文檔檢索→代碼生成→結(jié)果校驗(yàn)"的三階段工作流,這種可組合性為復(fù)雜任務(wù)處理提供了工程化范式。
該框架的開源特性正在重塑全球RAG技術(shù)生態(tài)。中文科研團(tuán)隊(duì)主導(dǎo)的技術(shù)創(chuàng)新,為多模態(tài)理解、知識構(gòu)建與效果評估提供了輕量化解決方案。企業(yè)與研究機(jī)構(gòu)可基于該框架快速落地大模型應(yīng)用,推動AI技術(shù)從實(shí)驗(yàn)室走向真實(shí)業(yè)務(wù)場景。項(xiàng)目代碼已通過GitHub平臺開放,開發(fā)者可訪問https://github.com/OpenBMB/UltraRAG獲取完整資源。





