滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

阿里千問APP公測“小插曲”：9.9與9.11之爭后展現自我糾錯力

時間：2025-11-21 02:18:43 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

一道看似簡單的數學題——比較9.9與9.11的大小，竟成為考驗人工智能模型能力的試金石。近日，阿里巴巴最新公測的千問APP在回答該問題時出現失誤，引發業界對AI模型基礎運算能力的關注。測試中，千問首次回答稱"9.11更大"，隨后在問題拆解階段又正確指出"9.9大于9.11"，最終通過自我糾錯機制修正了答案。

據技術團隊分析，此次錯誤源于雙重因素：一方面，模型在推理過程中雖正確拆解了小數比較規則（9.9的十分位為9，9.11的十分位為1），但最終結論出現筆誤；另一方面，"9.11"的三位數形式引發了數字長度錯覺，導致潛意識干擾。這種認知偏差在語言模型處理數值問題時尤為常見，因其本質是通過統計相關性而非嚴格邏輯推理進行判斷。

該問題最早由艾倫研究機構成員林禹臣發現。他曾在社交平臺曝光ChatGPT-4o將13.11誤判為大于13.8的案例。隨后，Scale AI工程師萊利·古德賽德設計變體問題"9.9與9.11誰更大"，導致包括ChatGPT-4o、谷歌Gemini Advanced在內的多個主流模型集體"翻車"。這一測試迅速成為衡量AI基礎能力的標志性案例。

盡管在常識性運算上存在短板，中國AI模型在全球化競爭中已展現強勁實力。以阿里巴巴Qwen系列為例，其全球下載量突破6億次，在技術積累與生態布局方面形成獨特優勢。愛彼迎CEO布萊恩·切斯基公開表示，公司已大規模采用Qwen模型替代部分OpenAI服務，因其"速度更快、成本更低"。這種選擇折射出商業場景對模型實用性的考量正在超越單純的技術參數競爭。

阿里巴巴日前正式宣布全面進軍AI消費級市場，將地圖導航、外賣訂餐、票務預訂等20余個生活服務場景接入千問APP。該平臺基于開源模型Qwen3構建，被管理層視為"AI時代的關鍵戰役"。此舉不僅意味著中國科技企業正借助開源生態擴大國際影響力，更標志著AI競爭從技術層面向應用層面全面升級。值得關注的是，千問項目在修正基礎運算錯誤的同時，正通過多模態交互與場景化訓練持續提升模型泛化能力。

更多>同類資訊

谷歌重磅發布Gemini 3：推理能力躍升，多領域應用開啟智能新體驗

您現在可以通過 Google AI Studio、Vertex AI、Gemini CLI 以及我們全新的智能體開發平臺 GoogleAntigravity 中使用 Gemini 3 進行開發和構建。自…

11-21

成都人工智能數字貿易中心啟航打造“技術+貿易”融合新標桿

11月18日，成都人工智能數字貿易中心在成都國際商貿城正式啟動運營。項目建設運營方、成都成商未來人工智能公司董事長孫正川介紹，中心將為企業提供技術支撐、資源對接、人才培養等全鏈條服務，預計可降低企業數字轉型成…

11-21

Google重磅發布Gemini 3：多項基準測試登頂，AI能力全面躍升

到了 11 月中旬，又有敏銳的開發者在移動端 Canvas 功能中發現了端倪：盡管界面顯示仍是 Gemini 2.5Pro，但輸出質量已經發生了質的飛躍，特別是在 SVG（Scalable Vector …

11-21

馬斯克xAI再發力：Grok 4.1發布，情商智商雙提升，團隊或成“全華班”

馬斯克在近日最新訪談中回應，“作為邁向通用人工智能（AGI）的關鍵一步，Grok5預計擁有約6萬億參數，其訓練和優化需要巨大的計算能力，并將成為世界上最智能的人工智能。整體來看，本次Grok 4.1的發…

11-21

鄭緯民院士盛贊阿里千問APP：中國AI大模型實力彰顯，未來可期走向世界

“中國超算之父”、中國工程院院士鄭緯民接受媒體采訪表示，全球人工智能競爭已進入關鍵階段，大模型不僅是技術制高點，更是國家科技實力的重要體現。展望未來，鄭緯民院士寄語道：“期待有更多的中國AI團隊能沉下心來，…

11-21

FPGA與AI擦出火花安路科技技術沙龍展現FPGA在AI領域新前景

安路科技的專家還講了安路的型號器件在人體識別AI算法中的應用，這塊我曾經在一些人工智能公司聽到過，確實FPGA在人體識別和動態捕捉上起到了很大作用，這一次是從聚焦FPGA的角度重新認識到了重要性。在AEC沙龍…

11-21

數字技術賦能用電安全：智慧空開引領傳統電閘革新，覆蓋多領域

曾經默默守護電路數十年的傳統電閘，正在被新一代智能網絡空氣開關（智慧空開）所替代，這場換代浪潮正從家庭延伸到工業、商業等各個領域。千行百業：數字化重塑用電安全生態工業制造：在智能制造車間，智能電閘通過集成…

11-21

從SRE到架構師：2024年Linux運維與云計算進階成長全攻略

隨著人工智能、大數據、區塊鏈等技術的興起，架構師需要了解這些技術在系統架構中的應用場景和實現方式，為企業的數字化轉型提供技術支持。可以從技術深度和廣度兩個維度進行規劃，一方面不斷深入鉆研某一技術領域，成為該領…

11-21

Procyon基準測試：數智化浪潮下企業PC性能與成本優化新利器

具體來看，在硬件層面，企業需結合自身AI應用場景，選擇適配的硬件配置；在推理精度選擇上，這是AI應用中的重要權衡點，企業需依據業務需求與設備資源，確定合適的推理精度；此外，軟件優化對AI性能的影響同樣顯著，…

11-21

谷歌地圖引入Gemini模型：AI助力行前規劃、地標指引與充電樁智能預測

11-21

航天電器“離岸孵化”破局貴陽經開區產業集群共譜高質量發展新篇

11-20

AI與超算強強聯合：日本團隊成功構建千億恒星級銀河系模擬模型

11-20

嵐圖泰山登場，以東方美學與尖端科技重塑豪華SUV新標桿

11-20

英偉達Q3財報亮眼：黃仁勛駁AI泡沫論稱GPU售罄AI賦能客戶增效

11-20

英偉達第三財季業績創新高盤后股價應聲大漲市值逼近新高

11-20

點擊查看更多 +

全站最新

第50萬輛小米汽車下線！雷軍：體系能力獲驗證，2025年交付將超40萬

小米汽車50萬臺整車下線創紀錄！雷軍豪氣贈6萬車模慶里程碑

小米汽車50萬輛整車下線雷軍：2025年交付將超40萬持續發力安全與科創

雷軍：小米汽車50萬輛下線抓安全促交付 2025年預計交付超40萬輛

小米汽車50萬輛整車下線：以AI與制造硬實力，開啟新能源產業新篇章

小米汽車迎里程碑：第50萬輛整車下線，交付量攀升且三季度盈利7億

熱門內容

本欄最新

不足7萬續航超400km，駕乘舒適智能化強，繽果S憑啥成純電小車優選？

程一笑詳解快手AI布局：從技術到應用構建生態，驅動業務與效率雙提升

金山云2025年Q3財報：營收24.78億同比增31%，經調整運營利潤扭虧為盈

英特爾酷睿Ultra 200H處理器升級AI能力：120GB顯存暢跑120B大參數MoE模型

康奈爾大學研究：馬斯克Grokipedia引仇恨陰謀論網站，來源可信度存疑

一汽豐田技術品牌煥新來襲！新榮放、全新卡羅拉、bZ3智享家12月將登場

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

阿里千問APP公測“小插曲”：9.9與9.11之爭后展現自我糾錯力