紐約州立大學石溪分校與哥倫比亞大學法學院聯合開展的一項研究引發廣泛關注。該研究表明,借助少量數據進行針對性訓練的人工智能模型,不僅能模仿知名作家的文風進行創作,其生成的作品在讀者中的受歡迎程度甚至超越了人類專業模仿者。這一發現不僅凸顯了生成式人工智能在文學模仿領域的強大能力,更可能對美國正在進行的版權訴訟及“合理使用”原則的討論產生重大影響。
研究過程中,科研團隊選用了GPT-4o、Claude3.5Sonnet和Gemini1.5Pro三大主流AI系統,同時邀請專業作家參與,以諾貝爾文學獎得主韓江、布克獎得主薩爾曼·拉什迪等50位知名作家的文風為模板進行創作。實驗采用兩種AI生成方式:情境提示法通過向三大AI系統提供相同的指令和示例文本生成內容;針對性微調法則僅使用支持API功能的GPT-4o,通過購買30位作者的電子書對模型進行專項訓練。實驗結果顯示,即使是僅出版過兩部作品的托尼·圖拉西穆特,其作品風格的模仿效果也與村上春樹等多產作家不相上下。
在評估環節,159名參與者(含28名寫作專家和131名非專家)在不知曉作者身份的情況下,對作品進行風格和質量對比。結果顯示,基礎AI輸出在專家群體中認可度較低,而經過針對性微調的AI作品則實現了顛覆性突破。專家選擇AI生成文本的概率在風格維度提升了八倍,在質量維度提升了一倍,非專家群體也表現出對AI作品的明顯偏好。現代AI檢測工具對標準AI輸出的識別率高達97%,但對微調后的作品僅能識別出3%,凸顯其“以假亂真”的技術水平。
成本對比數據進一步凸顯AI模仿的經濟優勢。研究顯示,訓練AI模型適應單一作家風格的平均成本約為81美元,而人類專業人士完成相同量級模仿文本的創作費用高達2.5萬美元,AI方案的成本降幅達99.7%。這種懸殊的差距不僅體現在經濟層面,更可能重構文學模仿市場的競爭格局。
該研究對美國司法實踐具有直接參考價值。當前美國法院正在審理多起涉及AI公司使用版權材料的訴訟,讀者對AI模仿作品的偏好可能構成對原創作品市場的實質性損害,這對“合理使用”原則的核心構成挑戰。美國版權局此前已明確警告,即便AI未進行逐字抄襲,其大規模模仿行為仍可能擠壓原創作品的生存空間。
針對這一現狀,研究人員提出法律應對建議:需區分通用AI模型與專門模仿特定作者的專項模型,強調針對性模仿行為缺乏法律依據,建議立法禁止AI對個別作者作品的系統性抄襲,或要求對AI生成文本進行明確標注。這些建議旨在平衡技術創新與版權保護,為司法實踐提供新的理論框架。

















