數(shù)學(xué)界與人工智能的協(xié)同創(chuàng)新再次引發(fā)關(guān)注——著名數(shù)學(xué)家陶哲軒近期借助GPT-5完成了一項(xiàng)數(shù)學(xué)難題的否定性證明,這一進(jìn)展在學(xué)術(shù)圈引發(fā)連鎖反應(yīng)。據(jù)陶哲軒本人在社交平臺(tái)披露,若采用傳統(tǒng)人工方式完成參數(shù)搜索與代碼驗(yàn)證,這項(xiàng)工作將耗費(fèi)數(shù)小時(shí),而AI的介入不僅大幅縮短了研究周期,更促使其采用此前未曾考慮的關(guān)鍵研究策略。
此次研究的核心是MathOverflow社區(qū)提出的數(shù)學(xué)猜想:序列l(wèi)cm(1,2,…,n)是否完全包含于高度豐數(shù)集合。該問(wèn)題涉及兩個(gè)特殊數(shù)列的交叉驗(yàn)證——前者是由連續(xù)自然數(shù)最小公倍數(shù)構(gòu)成的數(shù)列(如lcm(1,2)=2,lcm(1,2,3)=6),后者則是約數(shù)和超過(guò)所有更小正整數(shù)的數(shù)列(如12的約數(shù)和為1+2+3+4+6+12=28,超過(guò)任何小于12的正整數(shù))。盡管陶哲軒通過(guò)理論分析已判定該猜想不成立,但構(gòu)建具體反例仍需完成復(fù)雜的數(shù)值搜索工作。
研究過(guò)程中,GPT-5展現(xiàn)了獨(dú)特的協(xié)作價(jià)值。初始階段,陶哲軒嘗試讓AI直接生成完整搜索程序,雖然GPT-5在1分19秒內(nèi)輸出了長(zhǎng)段代碼,但實(shí)際運(yùn)行發(fā)現(xiàn)存在計(jì)算效率低下與初始參數(shù)偏差問(wèn)題。隨后研究者調(diào)整策略,通過(guò)多輪對(duì)話將復(fù)雜問(wèn)題拆解為多個(gè)子任務(wù),引導(dǎo)AI采用啟發(fā)式方法逐步優(yōu)化參數(shù)。最終生成的解決方案不僅成功定位反例參數(shù),更輸出僅29行的Python驗(yàn)證腳本,其簡(jiǎn)潔性與可靠性得到陶哲軒高度評(píng)價(jià)。
值得注意的是,本次研究未出現(xiàn)AI常見的"幻覺"問(wèn)題。陶哲軒特別指出,在整個(gè)協(xié)作過(guò)程中,GPT-5始終保持?jǐn)?shù)學(xué)嚴(yán)謹(jǐn)性,未產(chǎn)生任何違背邏輯的錯(cuò)誤輸出。這種表現(xiàn)顛覆了部分學(xué)者對(duì)AI工具可靠性的質(zhì)疑,為其在理論數(shù)學(xué)領(lǐng)域的應(yīng)用樹立了新標(biāo)桿。
事實(shí)上,這并非陶哲軒首次探索AI與數(shù)學(xué)的融合路徑。今年以來(lái),他已多次公開演示AI工具在數(shù)學(xué)研究中的創(chuàng)新應(yīng)用:5月通過(guò)GitHub Copilot完成函數(shù)極限證明;同月利用AI工具在33分鐘內(nèi)完成Magma方程盲證;3月o3-mini模型更是直接糾正其推導(dǎo)錯(cuò)誤并協(xié)助完成解題。這些實(shí)踐印證了他此前的判斷——AI雖難獲菲爾茲獎(jiǎng),但可成為數(shù)學(xué)家的重要研究媒介。
該成果的傳播效應(yīng)遠(yuǎn)超數(shù)學(xué)領(lǐng)域。OpenAI首席科學(xué)家Sebastien Bubeck的轉(zhuǎn)發(fā)引發(fā)科技界熱議,學(xué)者們普遍認(rèn)為這標(biāo)志著人機(jī)協(xié)同研究進(jìn)入新階段。網(wǎng)友討論中,多數(shù)人強(qiáng)調(diào)AI工具正在重塑科研范式,但也有聲音提醒需警惕過(guò)度依賴技術(shù)帶來(lái)的認(rèn)知退化風(fēng)險(xiǎn)。
在AI發(fā)展路徑的討論中,OpenAI CEO山姆·奧特曼近期關(guān)于GPT-5的表態(tài)頗具啟示。他明確指出該模型代表迭代改進(jìn)而非技術(shù)革命,此番言論被解讀為對(duì)市場(chǎng)過(guò)高預(yù)期的回應(yīng)。針對(duì)通用人工智能(AGI)的實(shí)現(xiàn)時(shí)間,奧特曼一改此前"2030年前達(dá)成"的預(yù)測(cè),轉(zhuǎn)而強(qiáng)調(diào)安全優(yōu)先的漸進(jìn)式發(fā)展策略,這種態(tài)度轉(zhuǎn)變引發(fā)業(yè)界對(duì)AI倫理與可控性的新一輪思考。











