自谷歌推出“AI概覽”功能以來,公眾逐漸發現,人工智能驅動的搜索結果與傳統搜索引擎提供的鏈接列表存在顯著差異。近期一項新研究通過量化分析,揭示了這種差異的具體表現:AI搜索引擎更傾向于引用訪問量較低、甚至在傳統搜索前100名結果中未出現的網站。
德國波鴻魯爾大學與馬克斯·普朗克軟件系統研究所的研究人員在預印本論文《生成式人工智能時代的網絡搜索特征分析》中,對比了谷歌傳統搜索結果與其AI概覽、Gemini 2.5-Flash的功能表現,同時納入了GPT-4o的網頁搜索模式及“GPT-4o搭配搜索工具”的表現。后者僅在大語言模型判斷需要外部信息時調用網絡搜索。
不過,這種差異并不直接等同于AI生成結果的“質量更低”。研究發現,基于GPT的搜索更傾向于引用企業官網和百科類網站,幾乎不引用社交媒體內容。通過大語言模型分析工具顯示,AI搜索結果涵蓋的可識別“概念”數量與傳統搜索前十條結果相當,說明兩者在信息細節、多樣性與新穎性方面水平接近。但研究人員也指出,生成式引擎會對信息進行壓縮,可能省略傳統搜索結果中保留的次要或模糊內容。這種情況在處理含義模糊的搜索詞(如多名公眾人物共用的名字)時尤為明顯,此時傳統搜索結果的信息覆蓋更全面。
AI搜索引擎的優勢在于能將預訓練的“內部知識”與引用網頁信息結合。例如,“GPT-4o搭配搜索工具”模式常不提供外部引用鏈接,而是直接基于訓練數據給出答案。這種特性在處理知識類問題時表現突出。
然而,對預訓練數據的依賴也使其在查詢時效性強的信息時存在短板。當研究人員使用谷歌9月15日“實時熱搜榜”中的關鍵詞測試時,“GPT-4o搭配搜索工具”常返回“您能否提供更多詳細信息?”的提示,而非主動搜索最新網絡資訊。








