在當下人工智能技術飛速發展的浪潮中,大語言模型備受矚目,人們都在追逐更智能、更強大的模型。然而,一個關鍵問題卻被多數人忽視:輸入數據的質量直接影響輸出結果。若AI“吃”的是低質量數據,那它“吐”出的也必然是低質量成果。在B端企業里,超過80%的數據被困在PDF、掃描件、表格和演示文稿等非結構化文檔中,傳統OCR工具處理這些文件時,常出現布局混亂、表格破壞等問題,導致下游大語言模型產生“幻覺”,這在金融、醫療、法律等嚴肅場景中是無法被接受的。
在硅谷,一家名為Reducto AI的初創企業或許能解決“垃圾進,垃圾出”的難題。這家公司成立僅18個月,在沒有大規模營銷的情況下,就成功融資1.08億美元,約合人民幣7.6億元。在AI熱潮中,這樣的融資速度十分罕見。
嘉和資本CEO袁子恒指出,文檔解析類產品,能做和做好的差別巨大,B端客戶對高精度要求極高,尤其是文檔布局的表格、復雜公式識別。Reducto AI能迅速脫穎而出,正是憑借這一優勢。從產業鏈定位看,非結構化數據解析平臺屬于基礎設施層,類似“賣鏟人”。無論AI營銷、客服、財務、研發、HR還是供應鏈等領域,都離不開底層結構化數據。全球市場規模超千億美金,且以超40%的速度高速增長,因為企業80%以上的數據是非結構化的,且還在持續增長,這些數據都需要處理成高質量、結構化、可供AI使用的數據。數據未達到AI可用狀態,是目前國內外企業落地AI和構建自有知識庫的最大障礙,痛點十分迫切。
Reducto AI成立于2023年1月,起初是兩人團隊。從2024年起,其憑借API優先的文檔AI平臺吸引全球頂級投資機構目光。頂級VC在短時間內接力領投,反映出他們對這家“品類定義者”公司的極度擔憂錯過(FOMO)。其A輪(2025年4月)和B輪(2025年10月)融資間隔僅5 - 6個月,還觸發了B輪領投方a16z的“搶先下注”。First Round、Benchmark和a16z這三家頂尖機構相繼成為Reducto的第一大外部股東。到2025年10月,Reducto累計融資額達1.08億美元。有一個小故事能證明其融資速度,公司CEO Adit Abraham在播客采訪中透露,兩人團隊時,Benchmark的Chetan Puttagunta就主動溝通,建議進行A輪融資,這種“反向推銷”現象充分體現了Reducto在硅谷的影響力。
Reducto的產品形態是API優先的文檔AI平臺,搭配名為“Reducto Studio”的交互式工作區,供團隊構建、評估和部署數據管道。它不是單一工具,而是面向開發者的“工具箱”,核心API矩陣構成完整工作流,大致由4種API組成。Parse API是基礎,能將復雜文檔轉換為包含文本、表格、圖形及布局信息的結構化輸出;Extract API基于Parse API,允許用戶通過提供JSON Schema或自然語言提示,從文檔中精確提取結構化字段;Split API可將長文檔智能拆分為語義上有意義的“塊”,為下游RAG應用優化上下文;Edit API是核心,是行業首個AI文檔編輯API,允許AI“回寫”或填寫文檔中的空白、復選框和表格。
Reducto憑借核心產品技術實現“閃電戰”式增長。參加2024年初的YC W24批次期間,完成從“LLM記憶”到“文檔AI”的關鍵轉型。核心產品(Parse API)發布后6個月內,ARR從0增長到超100萬美元。2025年10月播客采訪中,CEO Adit Abraham分享了通過“創始人主導銷售”實現ARR突破500萬美元的經驗。其他增長指標也十分亮眼,到2025年4月A輪融資時,已處理“數億頁”文檔;2025年10月B輪融資時,累計處理量超“10億頁”,A輪到B輪短短5 - 6個月內,月處理量增長6倍。Reducto資本效率極高,CEO Adit Abraham多次強調,籌集1.08億美元后,到2025年10月僅“燒掉”100萬美元,表明產品市場契合度極強,團隊精干。這筆錢將用于招募頂尖博士,應對與AWS、Google等云巨頭的長期競爭。
Reducto AI的兩位創始人經驗豐富、性格互補,順利走過從“維生素”到“止痛藥”的硅谷經典創業歷程。公司由兩位MIT畢業的聯合創始人Adit Abraham(CEO)和Raunak Chowdhuri(CTO)共同創建。Adit畢業于麻省理工學院,獲計算機科學與工程學士學位,曾在Google擔任產品經理,負責YouTube搜索,領導過收入頗高的項目發布,還在MIT Media Lab和BlinkAI從事機器學習研究,是具備深厚技術背景的“產品型CEO”,深刻理解技術商業化和規模化的關鍵。Raunak同樣畢業于MIT,獲計算機科學學士學位,主攻AI與機器人方向,高中畢業前就在計算機視覺領域發表學術論文,獲超100次引用,在MIT期間,曾在MIT Driverless的感知團隊和MIT林肯實驗室擔任機器學習研究員,創辦Reducto前,還創辦過計算化學咨詢公司,實現20萬美元的ARR,是Reducto的技術核心,在計算機視覺領域有近十年“科班”經驗。兩人最初在MIT一門研究生機器學習課程上結識。
Reducto的誕生并非一帆風順,經歷了產品轉型。最初,Adit和Raunak申請YC的項目是“Remembrall”,一個“LLM的長期記憶API”,在Twitter上引起關注,收到數百個試用注冊。但Adit與早期用戶交流后發現,用戶雖覺得想法有趣,卻無真正需求,客戶只愿每月支付10 - 20美元,這只是一個“弱信號”的“Vitamin”產品,而非解決“Painkiller”類問題的產品。深入與客戶對話后,他們發現客戶反復抱怨的“若能管理聊天記錄,能否管理用戶上傳的PDF文件”才是“強信號”,幾乎所有AI團隊都面臨“處理PDF的準確性”問題。于是,他們花一個周末用Streamlit構建簡單PDF解析工具原型,在YC論壇發布后,得到截然不同反饋,用戶紛紛詢問是否有API,這讓他們意識到找到真正痛點,立即放棄原有項目,專注文檔智能,Reducto AI由此誕生。在YC期間,兩人創業公司就簽下一家《財富》10強企業客戶,驗證了產品市場契合度。
Adit在業內形象清晰,極端專注、反直覺、客戶至上,重視“拒絕”的藝術。Reducto早期,他果斷“解雇”價值5000美元的合同,因客戶需求會分散團隊精力,還拒絕價值“數百萬美元”的建筑文件合同,因不符合對核心產品精度的專注。他推崇“工程師每周只有一個優先事項”的工作模式,確保團隊在一個方向做到極致。作為技術背景的創始人,他親自負責銷售,直到ARR突破500萬美元,銷售理念是“關懷勝于銷售技巧”,強調與早期客戶建立深度關系。
Reducto所處的“智能文檔處理”(IDP)市場,正以20% - 30%的高復合年增長率擴張。這個賽道看似是充斥三類玩家的“紅海”,云巨頭(如Amazon Textract、Google document AI)是云平臺“捆綁”服務,價格低廉,與云生態深度集成;老牌企業軟件(如ABBYY)是為“業務人員”設計的“低代碼”RPA工具,品牌歷史悠久;還有一堆開源工具(如Unstructured.io),免費、可自托管。然而,Reducto正在其中開辟新“藍海”。云巨頭工具“大而全”,但在需要極致準確性的“長尾”復雜文檔上表現不佳,Reducto在基準測試中“最高領先AWS、Google和Azure 20%”,在金融或醫療領域,這20%的準確性至關重要。例如,AI原生TPA(第三方管理人)Elysian使用Reducto處理保險索賠文件,審查速度提高16倍;醫療公司Anterior使用Reducto處理醫療記錄,實現99%以上準確率,決策時間從幾天縮短到幾秒。
不過,Reducto也面臨競爭和挑戰。袁子恒正在陪跑一家中國出海的文檔解析創業企業,該企業精度超過Reducto,成本更低、速度更快,開發了自有多模態數據解析引擎和多個自研模型,主要面向海外市場,已獲取美國知名大學、金融機構和歐洲企業等客戶,在解析精度、千頁價格、支持格式種類上超過歐洲大力扶持的大模型廠商Mistral的OCR。同時,大廠也帶來挑戰,AWS和Google將文檔處理能力與VLM和AI平臺深度“捆綁”銷售,可能以“更低”甚至“免費”價格提供“足夠好”的解析能力;行業還面臨“GPT - 5是否會免費解決這一切”的長期威脅,隨著基礎模型視覺理解能力飛躍,Reducto的“準確性”優勢可能被削弱。CEO Adit Abraham的“極端專注”哲學雖助力公司實現從0到500萬ARR的奇跡,但被認為難以將公司從500萬ARR帶到1億美元ARR。










