谷歌在大模型領(lǐng)域再掀波瀾,正式推出Gemini 3系列中速度最快、性價(jià)比最優(yōu)的Gemini 3 Flash。這款新模型不僅在性能上超越了上一代旗艦產(chǎn)品2.5 Pro,更在速度上實(shí)現(xiàn)了三倍提升,同時(shí)價(jià)格大幅降低,打破了輕量化模型“快則性能打折”的傳統(tǒng)認(rèn)知。
根據(jù)谷歌CEO桑達(dá)爾·皮查伊的介紹,Gemini 3 Flash在性能和效率上均突破了帕累托極限。在編程能力評(píng)估基準(zhǔn)SWE-bench Verified中,該模型以78%的得分超越了自家旗艦Gemini 3 Pro和Anthropic的Claude Sonnet 4.5;在多模態(tài)理解基準(zhǔn)MMMU-Pro上,其81.2%的得分不僅超過(guò)GPT-5.2的79.5%,更將Claude Sonnet 4.5甩開(kāi)十幾個(gè)百分點(diǎn)。這些數(shù)據(jù)表明,Gemini 3 Flash在保持輕量化優(yōu)勢(shì)的同時(shí),性能已接近旗艦水平。
從成本角度看,Gemini 3 Flash展現(xiàn)出顯著優(yōu)勢(shì)。其輸入價(jià)格僅為0.5美元/百萬(wàn)Tokens,輸出價(jià)格為3美元/百萬(wàn)Tokens,遠(yuǎn)低于Claude Sonnet 4.5的15美元和GPT-5.2的14美元。這種高性價(jià)比使其成為開(kāi)發(fā)者和小團(tuán)隊(duì)的首選。一位獨(dú)立開(kāi)發(fā)者在對(duì)比測(cè)試中發(fā)現(xiàn),使用Gemini 3 Flash運(yùn)行Python程序僅需9秒,而OpenAI的GPT-5 Mini和國(guó)產(chǎn)模型DeepSeek-V3.2分別需要35秒和41秒,且效果不及Gemini 3 Flash。該開(kāi)發(fā)者表示,若將原有應(yīng)用從GPT-4o或Gemini 3 Pro遷移至Gemini 3 Flash,成本可降低50%-70%。
谷歌強(qiáng)調(diào),Gemini 3 Flash在復(fù)雜推理、多模態(tài)處理、智能體任務(wù)和編程等核心領(lǐng)域保留了Gemini 3的突破性能力,同時(shí)結(jié)合了Flash級(jí)別的低延遲、高效率和低成本。在處理復(fù)雜任務(wù)時(shí),該模型可靈活調(diào)整思考時(shí)間,平均令牌使用量比上一代2.5 Pro減少30%,從而以更高性能完成日常任務(wù)。谷歌稱其為“智能體工作流程領(lǐng)域最出色的模型”。
自發(fā)布之日起,Gemini 3 Flash將向所有用戶開(kāi)放,免費(fèi)用戶也可通過(guò)Gemini App使用。該模型將替代2.5 Flash成為默認(rèn)選項(xiàng),而Gemini 3 Pro則繼續(xù)作為處理高難度數(shù)學(xué)和代碼問(wèn)題的專業(yè)選擇。此前,谷歌已推出Gemini 3 Pro和Gemini 3 Deep Think,并憑借每日處理超1萬(wàn)億Tokens的API流量反超OpenAI,成為大模型領(lǐng)域的領(lǐng)先者。用戶常利用這些模型進(jìn)行代碼模擬、復(fù)雜主題學(xué)習(xí)、交互式游戲構(gòu)建和多模態(tài)內(nèi)容理解。
谷歌透露,F(xiàn)lash系列一直是內(nèi)部最受歡迎的版本,此前的Flash 2和2.5已支撐起數(shù)百萬(wàn)開(kāi)發(fā)者構(gòu)建的數(shù)十萬(wàn)個(gè)應(yīng)用,處理了數(shù)萬(wàn)億Tokens。此次推出的Gemini 3 Flash預(yù)計(jì)將進(jìn)一步擴(kuò)大這一優(yōu)勢(shì),為開(kāi)發(fā)者提供無(wú)需在速度和智能間妥協(xié)的解決方案。隨著這款新模型的落地,谷歌在大模型領(lǐng)域的競(jìng)爭(zhēng)力再度提升,留給競(jìng)爭(zhēng)對(duì)手的應(yīng)對(duì)時(shí)間愈發(fā)緊迫。











