在當下AI技術狂飆突進的時代,大語言模型的智能程度備受矚目,然而一個關鍵問題卻常被忽視:若AI輸入的數據質量低劣,其輸出結果必然也難如人意。在B端企業里,超過80%的數據被困在PDF、掃描件、表格和演示文稿等非結構化文檔中,傳統OCR工具處理這些文件時,常出現布局混亂、表格破壞等問題,導致下游大語言模型產生“幻覺”,這在金融、醫療、法律等嚴肅場景中是無法接受的。
在硅谷,一家名為Reducto AI的初創企業有望解決這一難題。該公司成立僅18個月,在未進行任何營銷的情況下,就成功融資1.08億美元,約合人民幣7.6億元,如此快速的融資速度在火爆的AI熱潮中也十分罕見。
嘉和資本CEO袁子恒指出,文檔解析類產品,能做和做好的差別很大,B端客戶對高精度要求極高,尤其是文檔布局中的表格、復雜公式識別。Reducto AI能迅速脫穎而出,正是憑借這一優勢。從產業鏈定位看,非結構化數據解析平臺屬于基礎設施層,類似“賣鏟人”。無論AI營銷、客服、財務、研發、HR還是供應鏈等領域,都離不開底層結構化數據。全球市場規模超千億美金,且以超過40%的速度高速增長,因為企業80%以上的數據是非結構化的,且還在持續增加,這些數據都需處理成高質量、結構化且可供AI使用的數據。同時,數據未達到AI可用狀態,是目前國內外企業落地AI和構建自有知識庫的最大阻礙,痛點十分迫切。
Reducto AI于2023年1月創立,起初只是兩人團隊。2024年起,其憑借API優先的文檔AI平臺吸引全球頂級投資機構目光。頂級風投機構在極短時間內接力領投,反映出他們對這家“品類定義者”公司的極度擔憂錯過(FOMO)。其A輪(2025年4月)和B輪(2025年10月)融資間隔僅5 - 6個月,還觸發了B輪領投方a16z的“搶先下注”。First Round、Benchmark和a16z這三家風格頂尖的機構先后成為Reducto的“第一大外部股東”,到2025年10月,累計融資額達1.08億美元。Reducto CEO Adit Abraham曾在播客采訪中透露,公司僅兩人團隊時,Benchmark的Chetan Puttagunta就主動聯系,建議進行A輪融資,這一“反向推銷”現象充分體現了Reducto在硅谷的影響力。
Reducto的產品形態是一個API優先的文檔AI平臺,搭配名為“Reducto Studio”的交互式工作區,供團隊構建、評估和部署數據管道。它并非單一工具,而是面向開發者的“工具箱”,核心API矩陣構成完整工作流,大致由四種API組成。Parse API作為基礎,將復雜文檔轉換為包含文本、表格、圖形及布局信息的結構化輸出;Extract API基于Parse API,允許用戶通過提供JSON Schema或自然語言提示,精確提取結構化字段;Split API將長文檔智能拆分為語義上有意義的“塊”,優化下游RAG應用上下文;Edit API是行業首個AI文檔編輯API,允許AI“回寫”或填寫文檔中的空白、復選框和表格。
Reducto憑借核心產品技術實現“閃電戰”式增長。參加2024年初的YC W24批次期間,完成從“LLM記憶”到“文檔AI”的關鍵轉型。核心產品(Parse API)發布后6個月內,ARR從0增長到超100萬美元。2025年10月播客采訪中,CEO Adit Abraham分享了通過“創始人主導銷售”實現ARR突破500萬美元的經驗。除ARR外,其他增長指標也十分亮眼。到2025年4月A輪融資時,已處理“數億頁”文檔;2025年10月B輪融資時,累計處理量超“10億頁”,A輪到B輪短短5 - 6個月內,月處理量增長6倍。Reducto資本效率極高,CEO Adit Abraham多次強調,籌集1.08億美元后,到2025年10月僅“燒掉”100萬美元,表明產品市場契合度極強,團隊精干。這筆資金將用于在AI人才戰中招募頂尖博士,并應對與AWS、Google等云巨頭的長期消耗戰。
Reducto AI的兩位創始人經驗豐富、性格互補,順利走過硅谷經典創業歷程。公司由兩位MIT畢業生Adit Abraham(CEO)和Raunak Chowdhuri(CTO)共同創建。Adit畢業于麻省理工學院,獲計算機科學與工程學士學位,曾在Google擔任產品經理,負責YouTube搜索,領導過收入頗高的項目發布,還在MIT Media Lab和BlinkAI從事機器學習研究,是具備深厚技術背景的“產品型CEO”,深諳技術商業化和規模化關鍵。Raunak同樣畢業于MIT,獲計算機科學學士學位,主攻AI與機器人方向,高中畢業前就在計算機視覺領域發表學術論文,獲超100次引用,在MIT期間曾在MIT Driverless的感知團隊和MIT林肯實驗室擔任機器學習研究員,創辦Reducto前,還創辦過計算化學咨詢公司并實現20萬美元ARR,是Reducto的技術核心,在計算機視覺領域有近十年“科班”經驗。兩人最初在MIT一門研究生機器學習課程上結識。
Reducto的誕生并非一帆風順,經歷了產品轉型。最初,Adit和Raunak申請YC的項目名為“Remembrall”,是“LLM的長期記憶API”,在Twitter上引起關注并收到數百個試用注冊。但Adit與早期用戶交流后發現,用戶雖覺得想法有趣,卻無真正需求,客戶只愿每月支付10 - 20美元,該項目只是“弱信號”的“維生素”產品,而非解決“止痛藥”類問題。深入與客戶對話后,他們發現客戶反復抱怨的“若能管理聊天記錄,能否管理用戶上傳的PDF文件”才是“強信號”,幾乎所有AI團隊都面臨“處理PDF的準確性”問題。于是,他們用一個周末用Streamlit構建簡單PDF解析工具原型并在YC論壇發布,得到截然不同反饋,用戶紛紛表示比從AWS得到的結果還好并詢問是否有API。這一反饋讓他們意識到找到真正痛點,立即放棄原有項目,專注于文檔智能,Reducto AI由此誕生。在YC期間,他們憑借新方向和出色產品原型,在仍是兩人創業公司時就簽下一家《財富》10強企業客戶,驗證了產品市場契合度。
Adit在業內形象鮮明,極端專注、反直覺、客戶至上,重視“拒絕”的藝術。Reducto早期,他果斷“解雇”一個價值5000美元的合同,因客戶需求會分散團隊精力,還拒絕了價值“數百萬美元”的建筑文件合同,因其不符合對核心產品精度的專注。他推崇“工程師每周只有一個優先事項”的工作模式,確保團隊在一個方向上做到極致。作為技術背景的創始人,他親自負責銷售,直到ARR突破500萬美元,其銷售理念是“關懷勝于銷售技巧”,強調與早期客戶建立深度關系。
Reducto所處的“智能文檔處理”(IDP)市場,正以20% - 30%的高復合年增長率高速擴張。該賽道看似是充斥三類玩家的“紅海”,云巨頭如Amazon Textract、Google document AI是云平臺“捆綁”服務,價格低廉且與云生態深度集成;老牌企業軟件如ABBYY是為“業務人員”設計的“低代碼”RPA工具,品牌歷史悠久;還有一堆開源工具如Unstructured.io,免費且可自托管。然而,Reducto正在其中開辟新“藍海”。它是在正確時間(VLM與RAG爆發的技術周期)、由正確的人(“產品CEO” Adit與“技術天才CTO” Raunak)、執行正確戰略(從YC的“市場拉力”轉型和“極端專注”)的“三重奏”公司。它未投身“淘金熱”制造LLM,而是選擇成為關鍵“賣鏟人”。云巨頭工具“大而全”,但在需要極致準確性的“長尾”復雜文檔上表現不佳,Reducto在基準測試中“最高領先AWS、Google和Azure 20%”,在金融或醫療領域,這20%的準確性至關重要。例如,AI原生TPA(第三方管理人)Elysian使用Reducto處理保險索賠文件,審查速度提高16倍;醫療公司Anterior使用Reducto處理醫療記錄,實現99%以上準確率,將決策時間從幾天縮短到幾秒。
不過,Reducto也面臨諸多競爭和挑戰。袁子恒正在陪跑一家中國出海的文檔解析創業企業,該企業精度超過Reducto,成本更低、速度更快,開發了自有多模態數據解析引擎和多個自研模型,主要面向海外市場,已獲取美國知名大學、金融機構和歐洲企業等海外客戶,在解析精度、千頁價格、支持格式種類上超過歐洲大力扶持的大模型廠商Mistral的OCR。同時,大廠也帶來挑戰,AWS和Google正將文檔處理能力與VLM(如Gemini)和AI平臺(如Bedrock)深度“捆綁”銷售,可能以“更低”甚至“免費”價格提供“足夠好”的解析能力。行業還面臨“GPT - 5是否會免費解決這一切”的長期威脅,隨著基礎模型視覺理解能力飛躍,Reducto的“準確性”優勢可能被削弱。不過,袁子恒表示,巨頭切入的市場可能與Reducto不同,DeepSeek今年10月發布的Deepseek - OCR,雖看起來和Reducto相似,但從目標、要解決的問題和面向的市場來看,完全不同。另外,CEO Adit Abraham的“極端專注”哲學雖助力公司實現從0到500萬ARR的奇跡,但被認為難以將公司從500萬ARR帶到1億美元ARR。










