在人工智能領域,大模型處理復雜任務時面臨的“健忘癥”問題,一直是制約其性能提升的關鍵瓶頸。當用戶要求大模型規劃一次為期七天的全家云南旅行時,模型在前幾輪對話中往往能精準捕捉需求,如避開網紅店、規劃合理路線,甚至考慮到80歲老人的身體狀況。但隨著對話深入,頻繁修改方案后,模型可能突然“失智”,忘記關鍵限制條件,例如建議全家徒步攀登玉龍雪山——這一場景生動展現了“狀態漂移”現象對AI可靠性的影響。
針對這一難題,國內外頂尖團隊不約而同地將目光投向一項創新機制:通過顯式思維記錄與工具調用交替進行,實現推理狀態的持續累積。MiniMax M2模型率先提出的“交錯思維鏈”(Interleaved Thinking)技術,通過“思考-行動-觀察”的閉環設計,讓模型在每一步操作前輸出自然語言推理過程,形成可追溯的思維軌跡。這種設計類似于為AI裝上“海馬體”,使其在復雜環境中保持邏輯連貫性。實驗數據顯示,在網頁瀏覽任務中,該技術使模型性能提升40%,在復雜推理任務中提升36%,遠超代碼環境等低擾動場景的溫和增長。
傳統ReAct范式采用的線性邏輯“觀察-思考-行動”,在工程實現中常簡化為直接輸出工具調用指令。這種模式在面對工具返回的龐雜信息時,模型極易被干擾而偏離原始目標。例如程序員在編寫代碼時,若每次中斷后僅接收運行日志而丟失上下文,必然導致邏輯斷裂。交錯思維鏈通過強制記錄每一步推理細節,將長鏈路任務拆解為多個穩固的“原子化”閉環,使模型具備自我修正能力。MiniMax團隊在技術復盤中指出,這種機制本質上構建了一個動態濾波器,幫助模型在噪聲環境中篩選關鍵信息,維持推理軌跡的穩定性。
技術落地的挑戰遠超理論創新。由于主流開發工具基于OpenAI API構建,缺乏存儲思維過程的字段設計,用戶習慣性丟棄M2返回的推理記錄,導致性能驟降。為此,MiniMax工程師化身開源社區“基建者”,向LangChain、LlamaIndex等平臺發起密集協作,推動API協議升級。在VS Code插件Cline中,修改后的消息處理邏輯可完整保留代碼與思考過程;云端IDE Kilo Code通過優化環境合并邏輯,解決了多輪對話狀態丟失問題。這些努力使M2在異構環境中實現全面突破,相繼登頂xBench、GAIA等權威榜單。
行業共識正在加速形成。DeepSeek V3.2的“Thinking in Tool-Use”與Kimi K2 Thinking均采用類似設計,通過持久化思維記錄提升Agent能力。盡管各團隊在API字段命名上存在差異,但系統設計哲學高度統一:顯式、交錯、持久的思考機制已成為智能體進化的必經之路。OpenAI研究證實,AI性能不僅遵循參數量擴展法則,更受測試時計算方式影響。從機械執行命令的“復讀機”到具備自我修正能力的“思想者”,這場變革正在重塑人工智能的技術邊界。










