百川智能近日推出新一代循證增強醫療大模型Baichuan-M2 Plus,同步升級旗下應用百小應并開放API接口。這款基于循證醫學框架構建的模型,在醫療可信度、知識溯源能力等方面實現突破性進展,成為全球首個通過多國醫師資格考試認證的醫療專用大模型。

與傳統大模型"博學但不可靠"的特性不同,Baichuan-M2 Plus構建了六層證據金字塔體系。該系統從4000萬篇醫學期刊論文起步,整合系統評價、臨床指南、專家經驗、科普知識及真實世界數據,形成覆蓋原始研究到實踐反饋的完整證據鏈。這種分層架構使模型回答從"可能正確"升級為"有據可循",在核心醫療場景中達到資深臨床專家的可信水平。
技術層面,模型采用PICO醫學問題框架(人群、干預、對照、結局),將自然語言查詢轉化為結構化醫學問題。當處理"老年OSA患者使用CPAP能否改善高血壓"這類復雜問題時,系統會自動在高等級證據庫中檢索,優先匹配隨機對照試驗(RCT)和系統評價,同時評估研究質量、樣本量等關鍵指標。這種檢索方式較傳統RAG技術精度提升3倍,有效解決醫學語義理解不足和文獻可靠性辨識困難兩大難題。
多維度評測顯示,該模型醫療幻覺率較通用大模型降低75%,在病史分析、診斷思路等核心場景中達到臨床專家水準。在國際權威認證方面,M2 Plus以97分通過美國執業醫師資格考試(USMLE),與GPT-5并列全球榜首;中國執業醫師資格考試取得568分,超越所有公開測試的主流大模型;在日本、英國等國高級醫師職稱考試中準確率超85%,展現跨文化醫療場景的適應性。

目前,接入新模型的百小應應用已在各大應用商店完成更新,網頁版(ying.ai)同步上線。通過標準化API接口,醫院信息化部門、互聯網醫療平臺及醫療AI開發者可將循證推理能力嵌入服務場景,顯著提升AI醫療解決方案的專業性。百川智能表示,此次升級標志著醫療大模型從"可用"向"敢用"的關鍵跨越,為嚴肅醫療場景的AI應用樹立新標桿。







