在AI領域競爭愈發激烈的當下,DeepSeek與豆包這兩大C端AI應用的市場角力備受關注。近期,DeepSeek在工具模型領域有了新動作,其團隊在Hugging Face與GitHub平臺上線并開源了DeepSeek-OCR模型,參數規模約3B,采用“視覺-文字壓縮”方案,掃描效率較傳統OCR模型顯著提升,這為DeepSeek在工具模型領域的布局補上了重要一環。
DeepSeek-OCR模型的創新之處在于其“視覺-文字壓縮”方案。通常情況下,大語言模型執行OCR任務時計算成本高昂,處理的文字單元越多,計算量呈二次方增長,傳統OCR系統識別一頁文檔往往需處理上千個文字標記。而DeepSeek-OCR的模型工程人員另辟蹊徑,利用視覺語言模型(VLM),在語義層面對圖像中的文字信息進行壓縮,將原本需大量文字標記表達的內容,映射為更少量、更具語義密度的視覺標記,大幅降低了整體計算成本。在OmniDocBench測試中,僅使用100個視覺標記的DeepSeek-OCR就勝過了使用256個視覺標記的GOT-OCR 2.0;在標記數量少于800個的情況下,也擊敗了每頁需要超過6000個標記的MinerU 2.0。
該模型還具備“深度解析模式”,能將財務類圖表直接轉化為結構化數據,自動生成Markdown表格與圖像。這意味著包含數字、曲線、圖注的財報截圖,無需人工復制粘貼或二次整理,系統就能還原出可編輯的分析稿格式。其核心由負責圖像理解的DeepEncoder和基于DeepSeek-3B-MoE架構的文字生成模塊組成。DeepEncoder約有3.8億參數,專門分析圖像并生成壓縮后的視覺特征;文字生成部分啟用5.7億個活躍參數,用于根據這些視覺特征生成高精度的文字描述。據了解,Deepseek-OCR在10倍壓縮下解碼精度可達97%,即使在20倍壓縮下也能保持60%的準確率,一張圖像僅需LLM所需token的一小部分,即可表示整篇文檔。
然而,在C端用戶規模方面,DeepSeek近期遭遇了豆包的反超。根據QuestMobile披露的數據,2025年8月,豆包月活用戶數約為1.57億,環比增長約6.6%;同期DeepSeek月活約為1.43億,豆包時隔兩個季度,在國內C端AI應用市場中重新奪回頭部地位。
豆包的成功離不開其生態優勢與用戶觸點積累。與Deepseek不同,豆包定位為面向所有“大眾用戶”、強調場景化體驗,在語音、圖像、社交分享等領域均延展了模型能力,降低了用戶使用門檻。一方面,豆包借助抖音等字節系社交平臺的分發能力,在視頻網站上投放大量廣告,許多新用戶在這一過程中被動接觸并轉化。另一方面,豆包在立項之初就瞄準最廣泛的受眾,產品體驗面更寬。“豆包”這個名字相對朗朗上口,APP的logo設計也更加擬人化,人格化交互能力是其能力建設的重要板塊,隨豆包一同公測的聊天Agent“小寧”,體現了陪伴/擬人的屬性。憑借字節在語音/視頻生成等多領域建立的模型矩陣,豆包支持多種多模態(文本、語音、圖像、視頻生成)功能,功能繁雜且有清晰的用戶引導邏輯,小白用戶上手快。
從產品更新節奏來看,DeepSeek在2024年底發布V3模型,今年5月發布R1-0528,優化了R1模型的幻覺問題。但此后,盡管大版本更新傳言不斷,傳說中的R2卻遲遲未現真身。在本次OCR模型發布之前,Deepseek在下半年的主要動作是更新了V3.1模型,支持混合推理模式以及128K tokens的長上下文輸入。而在月活榜單被豆包擠到第二名后,Deepseek也并未在App端交互/生態上做出大幅優化動作,一直沿用類似“ChatGPT”風格的交互邏輯,堅定走在“模型即產品”的道路上。
在戰略路徑上,Deepseek始終堅持“技術深耕”的路線。此次更新的Deepseek-OCR模型體現了其在LLM領域的領先技術探索能力。不過,面對競爭對手龐大的生態優勢,Deepseek眼下的產品理念和風格,對于用戶規模的轉化效率仍有待觀察。即使被豆包反超,Deepseek仍然坐擁1.5億月活,在C端領域已經打響了口碑。在技術指標上,Deepseek也一直延續超大參數模型策略,V3系列總參數量高達671B,同期AI“六小龍”其他的開源模型,如智譜GLM-4.5只有355B。
DeepSeek-OCR的發布不僅在C端工具類場景有著不錯的應用前景,還可能成為模型訓練的“催化劑”。據了解,Deepseek-OCR每天可以在單個Nvidia A100 GPU上處理超過20萬頁數據。如果使用20臺服務器,每臺服務器運行8塊A100處理器,吞吐量將躍升至每天3300萬頁。這樣的吞吐效率,可以有效幫助構建其他大模型的訓練數據集,為走超大參數路線的AI企業提供更高效的解決鏈路。
未來,DeepSeek若想在后續競爭中與豆包抗衡,生態因素是需要考慮的重要因素。強如OpenAI,進入2025年后也在積極拓展模型能力在各領域生態的構建,如參與AI玩具等硬件方案的研究,Sora2以短視頻平臺的方式與用戶見面,為Deepseek提供了參考模板。對于Deepseek而言,除了加速下一代模型的迭代外,利用好龐大的C端用戶規模同樣至關重要。由于模型產品線不同,短期內Deepseek顯然無法復刻字節/OpenAI的生態策略,但在C端生態上能否走出差異化路線,將是其能否再度向豆包發起沖擊的關鍵。











