在人工智能技術快速發展的背景下,AI瀏覽器代理的廣泛應用引發了新的安全挑戰。這類代理能夠模擬人類用戶操作,完成電子郵件收發、在線銀行交易等敏感任務,其高權限訪問特性為網絡攻擊者提供了可乘之機。近期,科技公司Perplexity針對這一隱患推出新型安全系統BrowseSafe,通過技術創新構建起多層次防護體系。
傳統安全評估工具在應對復雜網絡攻擊時暴露出明顯短板。以AgentDojo為代表的現有基準測試主要依賴簡單提示場景,難以模擬真實環境中的多樣化攻擊手法。攻擊者常將惡意指令嵌入網頁隱藏區域,誘導AI代理執行未經授權的操作,例如將用戶數據傳輸至第三方服務器。這種隱蔽性攻擊方式對現有檢測系統構成嚴峻考驗。
BrowseSafe系統采用混合專家架構設計,在保持用戶體驗流暢性的同時實現實時安全掃描。該系統通過三個核心維度構建攻擊檢測模型:攻擊類型分類、注入策略識別和語言風格分析,特別針對"看似無害實則危險"的偽裝內容進行重點篩查。測試數據顯示,系統對Prompt注入攻擊的識別準確率達到91%,較GPT-5等前沿模型提升6個百分點,較同類產品PromptGuard-2高出56個百分點。
在防御策略構建方面,Perplexity創新性地采用三層防護機制。首層通過快速分類器實現初步過濾,第二層運用基于推理的大語言模型進行深度分析,最終形成完整的安全防護閉環。這種架構設計既保證了檢測效率,又提升了復雜攻擊的識別能力。不過測試也發現系統存在改進空間,例如對多語言攻擊的檢測率降至76%,HTML注釋區域的惡意代碼比頁面顯性區域的更難被發現。
為推動行業安全標準升級,Perplexity決定開源BrowseSafe相關技術資源,包括評估基準、模型架構和研究論文。此舉旨在通過開放協作提升整體防護水平,應對不斷演變的網絡攻擊形態。公司安全團隊負責人表示,盡管當前系統已能攔截絕大多數攻擊,但仍有約9%的復雜攻擊手法可能突破防線,這凸顯出持續技術迭代的重要性。
劃重點:











