深夜時分,OpenAI首席執行官又一次在社交平臺為新產品造勢。與以往強調技術參數不同,這次宣傳重點轉向用戶反饋,直言正在針對產品短板進行優化。這種轉變背后,是GPT-5系列推出后遭遇的尷尬處境——本應被替代的前代產品4o,因用戶粘性過高被迫延長服務周期。
當測試者將官方展示的指令遵循案例投入實測時,新版本立即暴露出問題。要求輸出六個漢字的測試中,系統連續給出五個字符的答案,即便切換英文提示詞仍出現同樣偏差。更令人困惑的是,在限制使用特定漢字的文本生成測試里,系統持續輸出繁體字內容,直到取消限制才恢復正常。作為對比,競品模型在相同測試中表現穩定。
情感交互能力的升級承諾同樣遭遇質疑。官方宣稱新版本"更具溫度與對話感",但實際測試顯示,當用戶詢問情感問題時,新舊版本的回應存在明顯代差。前代產品會通過共情表達和鼓勵性語言建立情感連接,而新版本更傾向于給出分析性解答,被測試者形容為"像在查閱心理學教材"。這種差異在二次測試中進一步放大,新版本甚至省略了基礎的情感回應。
自適應計算優化成為為數不多的亮點。傳統AI模型在處理不同難度問題時,消耗的計算資源缺乏彈性,新引入的動態調整機制使簡單問題的響應速度提升40%。在編程類復雜問題測試中,雖然舊版本更快給出答案,但經核查發現其結果存在錯誤,而新版本通過延長思考時間給出了正確解法。這項改進對API調用用戶具有實際價值,可在保證質量的前提下降低計算成本。
個性化功能更新帶來意外收獲。系統新增的七種角色設定中,"吐槽達人"模式引發關注。該模式下AI會主動質疑不合理的指令,對PUA式提問表現出明顯抵觸。測試顯示,當要求AI無償完成復雜任務時,該模式會直接指出指令的不合理性,這種反套路表現顛覆了傳統AI的順從形象。不過角色切換時的語境銜接仍顯生硬,需要用戶適應其獨特的表達方式。
市場數據印證著產品面臨的挑戰。第三方機構統計顯示,該系列市場占有率持續下滑,用戶使用時長被多個新興模型分流。曾經依賴的技術先發優勢正在減弱,部分用戶開始將日常查詢轉向其他平臺。這種轉變在開發者社區尤為明顯,代碼生成等核心場景的遷移速度超出預期。











