12 月 22 日消息,科學(xué)領(lǐng)域正迎來一場大規(guī)模的論文發(fā)表熱潮,這在很大程度上要歸功于人工智能技術(shù)。發(fā)表于《科學(xué)》期刊的一項新研究顯示,在諸多學(xué)科領(lǐng)域中,使用 ChatGPT 等大語言模型(LLMs)的科研人員,產(chǎn)出的論文數(shù)量顯著增多。該技術(shù)也正助力母語非英語的科研人員,讓科研競爭的賽場變得更加公平。
人工智能分析方法
為量化人工智能對科學(xué)論文發(fā)表的影響,康奈爾大學(xué)與加州大學(xué)伯克利分校的研究人員,分析了 2018 年 1 月至 2024 年 6 月期間,三大主要預(yù)印本論文平臺上發(fā)布的近 210 萬篇研究摘要。這些論文均未經(jīng)同行評審便已對外公開。
據(jù)了解,在開展分析時,研究團(tuán)隊借助聊天機(jī)器人模型 GPT-3.5 Turbo-0125,生成了 2023 年之前發(fā)表的論文摘要的人工智能改寫版本。隨后,他們從中提煉出人工智能文本區(qū)別于人類文本的特征模式。基于這些發(fā)現(xiàn),團(tuán)隊開發(fā)出一套算法,用以掃描近年發(fā)表的論文,通過識別相似特征標(biāo)記出人工智能輔助撰寫的成果。研究人員還對論文作者進(jìn)行了長期追蹤,以此衡量他們的論文發(fā)表量變化情況。
科研產(chǎn)出大幅增長
研究發(fā)現(xiàn),科研人員使用人工智能工具后,工作效率出現(xiàn)激增。其中,社會科學(xué)與人文科學(xué)領(lǐng)域的論文產(chǎn)出增幅最大,達(dá)到 59.8%;生物與生命科學(xué)領(lǐng)域的增幅為 52.9%;而物理學(xué)與數(shù)學(xué)領(lǐng)域的增幅則為 36.2%。研究團(tuán)隊在報告中指出:“大語言模型的應(yīng)用,與科研人員的學(xué)術(shù)產(chǎn)出大幅增長密切相關(guān)。”
這項研究中最引人關(guān)注的發(fā)現(xiàn)之一,是母語非英語國家科研人員的產(chǎn)出量出現(xiàn)了大幅提升。大多數(shù)頂級期刊都要求稿件使用高水平英文撰寫,這一要求長期以來讓這類科研人員處于不利地位。但在人工智能分擔(dān)部分工作后,亞洲地區(qū)的科研人員在部分學(xué)科領(lǐng)域的論文產(chǎn)出增幅最高達(dá)到 89%。
不過,該研究的作者也針對人工智能與論文質(zhì)量的關(guān)聯(lián)發(fā)出了警告。盡管人工智能能讓論文的表述顯得更為專業(yè),但這也可能成為一種陷阱。在過去,精湛的寫作水平往往是高質(zhì)量研究的標(biāo)志,但如今情況有時會截然相反。研究發(fā)現(xiàn),人工智能生成的文本語言越復(fù)雜,論文的質(zhì)量反而越有可能偏低。換句話說,華麗的文筆可能會掩蓋薄弱的學(xué)術(shù)觀點。
研究作者傳遞出的核心觀點是:我們不能再僅憑論文的語言文采來評判其質(zhì)量。“隨著傳統(tǒng)評判標(biāo)準(zhǔn)逐漸失效,期刊編輯與審稿人可能會愈發(fā)依賴作者學(xué)術(shù)背景、所屬機(jī)構(gòu)等身份標(biāo)識,將其作為衡量論文質(zhì)量的信號。頗具諷刺意味的是,這會抵消大語言模型在推動科研成果民主化方面發(fā)揮的作用。”
為維護(hù)科研誠信,研究人員提出了多項舉措建議,其中包括:各科研機(jī)構(gòu)需實施更深入的審核機(jī)制,甚至可引入專門的“人工智能審稿智能體”,助力區(qū)分文本是由人類撰寫還是由機(jī)器生成。










