歐洲“DeepSeek”發布了全世界最好的 OCR,網友:蹲蹲中國的免費開源版
就在剛剛,那個曾經開源了首個 MoE 模型的歐洲初創公司 Mistral AI 在沉寂一段時間之后又出新活。
Mistral 團隊發布了一個號稱“全世界最好的 OCR”的產品 —— Mistral OCR,旨在將一些 AI 難以直接識別的粗糙且復雜的文件進行整理,便于 AI 操作識別。
帖子一經發出,評論區瞬間充滿了各種夸夸言論,但在一眾贊美聲中,也不乏一些真正用過產品的網友的理智發言。
就比如有網友對 Mistral OCR 的產品能力表示認同,但卻有點接受不了它的產品定價,覺得有點太貴,并且期待中國 AI 公司早點發布一個類似的開源版本,把價格打下來。
同時也有網友親自上手,上傳掃描了手寫板的內容,但最后識別出的文字結果正確率并不是很高。
除此之外,還有被 Mistral 所宣傳的“可以識別超多種語言”噱頭吸引過來的網友,但使用后卻失望的發現它無法識別自己所用語言。
盡管 Mistral OCR 目前還存在著一定的局限性,但它的出現確實是一次從字符識別到場景智能的跨越。
從圖文到結構化數據的一大步
與傳統的 OCR API 不同,Mistral OCR 是一款多模態 API,它不僅可以識別文本中是否嵌入了插圖或照片,還會為這些圖形元素創建邊界框,并將它們包含在輸出中。
從 Mistral AI 團隊放出的 Demo 視頻可以看出,Mistral OCR 能夠將圖文混排的 PDF 文件轉換成結構清晰的 Markdown 格式文件。
例如表格+數字的 PDF 組合。
PDF 圖片中數學公式的轉換。
PDF 宣傳圖片中的印地語。
拍得并不方正的論文照片。
甚至帶有水印的文字也可以輕松識別。
從字符識別到場景智能的一大步
除了直觀的 Demo 外,Mistral AI 團隊還列舉了 6 點 Mistral OCR 的絕對優勢:
卓越的復雜文檔解析能力:Mistral OCR 在理解復雜文檔結構方面表現出色,能夠精準解析交錯的圖像、數學公式、表格以及 LaTeX 等高級排版格式。這使其在處理包含圖表、圖形、公式和插圖的科學論文等富文本文檔時更具優勢。
原生支持多語言與多模態:Mistral OCR 自帶多語言和多模態處理能力,能夠靈活應對不同語言以及多種類型的內容,無需額外適配。
行業領先的基準測試表現:在多項行業基準測試中,Mistral OCR 均取得優異成績,充分展示了其強勁的性能和高準確度。
同類產品中處理速度最快:Mistral OCR 采用輕量化架構,處理速度遠超同類產品,單節點每分鐘可解析高達 2000 頁文檔。無論在高負載環境還是大規模數據處理中,它都能保持高效運行,確保穩定性能。
創新性的“文檔即提示”結構化輸出:Mistral OCR 率先引入“文檔即提示”概念,使用戶能夠直接使用文檔作為指令,以獲取更加精準和定制化的結果。它還能輸出 JSON 等結構化格式,便于與后續任務或自動化流程銜接,實現更智能的內容提取。
可選的自托管部署方案:針對數據隱私要求嚴格的企業或機構,Mistral OCR 提供自托管部署選項,確保敏感信息始終存儲在本地基礎設施內,滿足合規性與安全性需求。
團隊還將 Mistral OCR 將 Google Document AI、Azure OCR、Gemini 系列模型以及 GPT-4o 的產品性能進行對比。
最終的結果表明,Mistral OCR 在總體準確率、數學公式識別等方面表現優異,特別是在 2503 版本中,各項指標均大幅提升,達到了新的高度。
在多語言處理方面,得出的數據更是遠遠優于 Google Document AI 和 Azure OCR。
歐洲也有自己的“DeepSeek”
Mistral AI 是一家位于法國的初創公司,憑借其 AI 助手 Le Chat 和多個基礎模型,已被官方視為法國最具前途的科技公司之一,并被認為是唯一有潛力與 OpenAI 競爭的歐洲企業。
Mistral AI 的三位創始人都擁有在全球頂級科技公司中積累的豐富 AI 研究經驗。首席執行官 Arthur Mensch 曾在谷歌 DeepMind 部門工作,首席技術官 Timothée Lacroix 和首席科學家 Guillaume Lample 則曾是 Meta 的核心成員。憑借著強大的技術背景,Mistral AI 的創始團隊帶領公司迅速發展。
值得一提的是,雷峰網 (公眾號:雷峰網) 得知自 2023 年成立以來,Mistral AI 在籌集資金方面取得了顯著成績,目標是將前沿 AI 技術普及給每個人,雖然這一目標并未直接挑戰 OpenAI,但它強調了公司對于 AI 開放性的堅定支持。
作為 ChatGPT 的替代品,Mistral AI 推出了聊天助手 Le Chat,并在 iOS 和 Android 上成功上線。在發布后僅兩周,Le Chat 的下載量便突破了 100 萬次,并一度在 iOS App Store 中登頂法國免費下載榜單。
除此之外,截至 2025 年 2 月,Mistral AI 已籌集了約 10 億歐元(約 10.4 億美元)的資金,其中包括幾輪股權融資和部分債務融資。尤其值得注意的是,在 2023 年 6 月公司發布首批模型之前,Mistral AI 就成功完成了創紀錄的 1.12 億美元種子輪融資,成為歐洲歷史上最大的一輪種子融資,當時公司估值達 2.6 億美元。
參考鏈接:
https://mistral.ai/fr/news/mistral-ocr
https://x.com/MistralAI/status/1897694143180112096
雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知 。