近日,谷歌研究院、谷歌 DeepMind 與麻省理工學院聯合發布了一項研究,挑戰了 “更多智能體意味著更好結果” 的傳統觀點。研究團隊通過180項控制實驗,探討了多智能體系統在不同任務中的表現,結果顯示性能波動極大,有的任務提升達到81%,而有的任務則下降了70%。
研究表明,任務的類型對多智能體系統的效果有顯著影響。在一些并行任務中,例如金融分析,采用集中式的多智能體協調能夠顯著提升性能。不同的智能體能夠獨立分析銷售趨勢、成本結構和市場數據,然后將結果匯總,最終實現了近81% 的性能提升。
然而,在一些需要順序進行的任務中,如 Minecraft 的規劃任務,多智能體的設置反而會使性能下降39% 到70%。這是因為每個制作動作都會影響到后續動作所依賴的庫存狀態,任務之間的順序依賴性使得信息在智能體之間傳遞時可能會丟失或被分割。
研究發現,影響多智能體系統性能的主要因素有三個:首先,任務涉及的工具越多,像網絡搜索或編碼等任務就越容易受到多智能體系統的負面影響。其次,當單個智能體的成功率超過45% 時,添加更多智能體通常會導致收益遞減或負收益,協調成本會抵消增益。最后,錯誤的累積在多智能體環境中會加速,缺乏信息共享的情況下,錯誤會比單個智能體環境中快17倍。
劃重點:











