近日,斯坦福大學研究團隊在《Patterns》期刊發表了一項關于AI在書面文本中應用情況的研究報告。該研究對多個主流平臺的英語文稿進行了系統性分析,發現大量文本存在AI生成的痕跡,表明大型語言模型已深度融入各類正式書面交流場景。
研究團隊開發了一套名為“分布式LLM量化框架”的統計模型,通過分析語料庫的語言特征分布,估算特定時間段內文本中AI生成內容的比例。不過,該模型目前僅適用于英語文本,因此研究結果僅反映英文材料中的AI特征占比,并不等同于整篇文章完全由AI創作。
在具體分析中,研究團隊對去年68.7萬條消費者投訴、53.7萬篇企業新聞稿、3.04億份招聘信息以及1.6萬篇聯合國新聞稿進行了詳細考察。結果顯示,約24%的企業新聞稿、18%的消費者投訴、14%的聯合國新聞稿,以及近10%的招聘信息存在明顯的AI生成或大幅改寫痕跡。
進一步分析發現,AI在書面文本中的應用存在顯著的地域和行業差異。在教育水平較低的地區,19.9%的投訴文本由AI撰寫,高于教育水平較高地區的17.4%。在招聘信息方面,中小企業和初創公司更傾向于使用AI生成內容,約10%至15%的招聘公告包含明顯的AI特征。
研究人員指出,隨著生成式AI技術的持續發展,其文本風格與人類寫作的差異越來越小,未來準確識別文本中AI的參與程度將面臨更大挑戰。這一趨勢可能對文本創作的真實性和可信度產生深遠影響。











