近日,大模型競(jìng)技場(chǎng)LMArena公布了最新一輪的模型排名,引發(fā)行業(yè)廣泛關(guān)注。在綜合性能榜單中,智譜科技發(fā)布的GLM-4.6與阿里旗下Qwen3-Max-Preview并列第四,雙雙占據(jù)國(guó)內(nèi)模型榜首位置,同時(shí)GLM-4.6更以開(kāi)源模型身份登頂全球榜首。
作為智譜科技9月30日推出的旗艦產(chǎn)品,GLM-4.6在編程能力、長(zhǎng)文本處理、邏輯推理、信息檢索、內(nèi)容創(chuàng)作及智能體應(yīng)用等六大核心領(lǐng)域?qū)崿F(xiàn)突破性提升。測(cè)試數(shù)據(jù)顯示,該模型在公開(kāi)編程基準(zhǔn)任務(wù)中的表現(xiàn)已與Claude Sonnet 4持平,成為國(guó)內(nèi)首個(gè)達(dá)到國(guó)際頂尖水平的代碼生成模型。
在LMArena的專項(xiàng)評(píng)測(cè)中,GLM-4.6的創(chuàng)意寫(xiě)作能力表現(xiàn)尤為突出,以顯著優(yōu)勢(shì)領(lǐng)跑全球同類模型。這一成績(jī)直接推動(dòng)其同時(shí)登頂Hugging Face趨勢(shì)榜單和OpenRouter API市場(chǎng)熱度榜,形成"雙榜第一"的領(lǐng)先態(tài)勢(shì)。
值得關(guān)注的是,阿里通義千問(wèn)Qwen3-Max系列出現(xiàn)特殊現(xiàn)象:其正式版本0923在競(jìng)技場(chǎng)測(cè)試中僅位列第九,落后于預(yù)覽版Qwen3-Max-Preview。不過(guò)該模型在數(shù)學(xué)專項(xiàng)評(píng)測(cè)中展現(xiàn)出絕對(duì)優(yōu)勢(shì),以滿分表現(xiàn)占據(jù)全球數(shù)學(xué)能力榜首。
行業(yè)觀察顯示,自9月以來(lái)國(guó)產(chǎn)大模型進(jìn)入密集迭代期。除GLM-4.6和Qwen3-Max系列外,月之暗面Kimi K2等新銳模型也在多維度評(píng)測(cè)中取得亮眼成績(jī),形成技術(shù)突破與市場(chǎng)應(yīng)用的雙重競(jìng)爭(zhēng)格局。











