在世界互聯網大會烏鎮峰會期間,360數字安全集團正式推出《大模型安全白皮書》,為人工智能行業安全發展提供系統性指導。該白皮書深入分析了當前大模型面臨的五大核心安全風險,并提出"外筑動態屏障、內固安全底座"的治理框架,旨在推動AI技術向"安全、可信、可控"方向演進。
白皮書以2025年全球范圍內發生的典型安全事件為研究樣本,系統梳理出基礎設施、內容生成、數據知識庫、智能體交互、用戶終端等五大風險領域。這些風險呈現高度關聯性,形成傳統安全手段難以破解的復合型威脅網絡,對個人隱私保護、企業數字資產乃至國家關鍵信息基礎設施構成嚴峻挑戰。研究顯示,某金融大模型曾因數據污染導致決策偏差,造成直接經濟損失超億元,凸顯風險治理的緊迫性。
針對復雜安全態勢,360創新提出"雙軌治理"策略:外掛式安全通過部署專用監測模型,構建覆蓋算力層、生態層、內容層、認知層的四維防御體系,實現對異常輸入、模型幻覺等風險的實時攔截;平臺原生安全則將安全基因植入大模型核心架構,在數據采集、知識融合、智能體開發等關鍵環節嵌入安全控制模塊,確保全流程合規可控。這種"外防內固"的立體化防護模式,使安全檢測能力具備動態演進特征,可自適應新型攻擊手段。
基于上述理論框架,360研發出包含七大核心產品的安全解決方案。該體系通過模型安全評估、內容過濾引擎、數據加密防護等模塊的有機協同,形成覆蓋大模型全生命周期的防護網絡。在政務領域應用中,該方案成功攔截98.7%的惡意輸入樣本,將模型誤判率降低至0.3%以下;制造業場景下,有效防護工業大模型免受數據投毒攻擊,保障生產線穩定運行。
目前,360的安全解決方案已在政務、金融、智能制造等重點行業實現規模化部署,累計保護超過200個大型AI系統。通過與高校、科研機構共建聯合實驗室,該企業正推動制定大模型安全國家標準,并開源部分安全檢測工具,促進技術成果共享。這種產學研協同創新模式,為構建安全可信的AI生態提供了可復制的實踐路徑。











