滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

GPT-5.1更新測評：指令遵循“掉鏈子”，情感回應“沒溫度”，OpenAI新招能否破局？

時間：2025-11-14 07:12:07 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

深夜時分，OpenAI首席執行官又一次在社交平臺為新產品造勢。與以往強調技術參數不同，這次宣傳重點轉向用戶反饋，直言正在針對產品短板進行優化。這種轉變背后，是GPT-5系列推出后遭遇的尷尬處境——本應被替代的前代產品4o，因用戶粘性過高被迫延長服務周期。

當測試者將官方展示的指令遵循案例投入實測時，新版本立即暴露出問題。要求輸出六個漢字的測試中，系統連續給出五個字符的答案，即便切換英文提示詞仍出現同樣偏差。更令人困惑的是，在限制使用特定漢字的文本生成測試里，系統持續輸出繁體字內容，直到取消限制才恢復正常。作為對比，競品模型在相同測試中表現穩定。

情感交互能力的升級承諾同樣遭遇質疑。官方宣稱新版本"更具溫度與對話感"，但實際測試顯示，當用戶詢問情感問題時，新舊版本的回應存在明顯代差。前代產品會通過共情表達和鼓勵性語言建立情感連接，而新版本更傾向于給出分析性解答，被測試者形容為"像在查閱心理學教材"。這種差異在二次測試中進一步放大，新版本甚至省略了基礎的情感回應。

自適應計算優化成為為數不多的亮點。傳統AI模型在處理不同難度問題時，消耗的計算資源缺乏彈性，新引入的動態調整機制使簡單問題的響應速度提升40%。在編程類復雜問題測試中，雖然舊版本更快給出答案，但經核查發現其結果存在錯誤，而新版本通過延長思考時間給出了正確解法。這項改進對API調用用戶具有實際價值，可在保證質量的前提下降低計算成本。

個性化功能更新帶來意外收獲。系統新增的七種角色設定中，"吐槽達人"模式引發關注。該模式下AI會主動質疑不合理的指令，對PUA式提問表現出明顯抵觸。測試顯示，當要求AI無償完成復雜任務時，該模式會直接指出指令的不合理性，這種反套路表現顛覆了傳統AI的順從形象。不過角色切換時的語境銜接仍顯生硬，需要用戶適應其獨特的表達方式。

市場數據印證著產品面臨的挑戰。第三方機構統計顯示，該系列市場占有率持續下滑，用戶使用時長被多個新興模型分流。曾經依賴的技術先發優勢正在減弱，部分用戶開始將日常查詢轉向其他平臺。這種轉變在開發者社區尤為明顯，代碼生成等核心場景的遷移速度超出預期。

更多>同類資訊

貝佐斯藍色起源邁關鍵步：新格倫火箭首執NASA任務且助推器成功著陸

11-14

美國藍色起源“新格倫”火箭二度發射，攜NASA火星探測器成功升空

11-14

中國科研影響力七年躍升，中科院三連冠領跑全球科研機構榜單

11-14

“新格倫”火箭二次發射成功搭載火星探測器并首實現第一級海上回收

11-14

美國藍色起源公司“新格倫”火箭二次發射成功實現第一級及助推器回收

11-14

Cursor獲23億美元融資，年化收入破10億，AI編程工具成資本新寵

11-14

鎧俠2025財年Q2營收達4483.46億日元，環比增30.8%，Q3業績預期創新高

11-14

?華為攜手瑞星發布DCS AI安全方案，提供全鏈路保障助力企業智能防御升級?

11-14

中國6G發展進入關鍵階段：完成首階段試驗，300余項關鍵技術儲備成型

11-14

光伏支架設計鋪設難題怎么破？鷓鴣云模擬設計平臺提供高效路徑

設計完成后，通過支架清單功能，能自動生成立柱、檁條、斜梁、斜撐等構件的規格與長度明細，為物料統計、成本核算提供精準依據，省去人工統計的繁瑣與誤差。借助鷓鴣云模擬設計平臺的這些功能，光伏支架設計鋪設流程得以大…

11-14

中通快遞旺季“黑科技”發力：近3000臺無人車馳援，降本增效成果顯著

11-14

130光年外紅矮星現日冕物質拋射助解系外行星宜居謎題

11-14

英特爾Nova Lake架構CPU將攜AVX10.2與APX指令集回歸寬向量支持

11-14

我國6G技術試驗首階段圓滿完成，300余項關鍵技術儲備助力“萬物智聯”

11-14

CERN地下實驗“重現”宇宙奇景，為星際磁場存在提供關鍵證據

11-14

點擊查看更多 +

全站最新

小米YU7獲國際壓鑄大賽最佳結構獎，一體化設計或開啟電動車結構革新之路

拼多多2025Q2：營收增速放緩、現金流收縮，高增長后迎深水區挑戰

石頭科技11月13日股價微漲主力資金凈流入微弱游資散戶資金流向分化

從衛浴跨界到銅藝龍頭，雷軍“粉絲”攜銅質文創沖刺港交所IPO

央視“第一發布”迎車企首秀長安馬自達EZ-60憑實力獲全球好車認證

從“順風耳”至“人造太陽”：合肥科創之旅，千年神話逐夢成真

熱門內容

本欄最新

全新坦克400多版本上市，潮酷設計引都市青年追捧，開啟多元越野生活

全新坦克400正式登場，24.98萬起售，四款動力滿足多元需求！

起亞Telluride測試車披"藝術偽裝"亮相，創意彩蛋致敬命名地

30萬級6座SUV新角逐：2026款騰勢N8L與理想L8，誰更合家庭心意？

遠程湘潭基地智能制造賦能超級VAN，推動新能源商用車產業高質量發展

每日一書

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

GPT-5.1更新測評：指令遵循“掉鏈子”，情感回應“沒溫度”，OpenAI新招能否破局？