Mistral OCR 4をリリース、文書知能の新基準
原題: Mistral OCR 4
なぜ重要か
企業向けドキュメント処理において、テキスト抽出精度とメタデータ抽出の統合は、RAGシステムや検索エンジンの精度向上を直結させる。OCR 4は自己ホスト型オプションでプライバシーを確保しながら高精度を実現し、金融・製造業などの高度な文書処理需要への対応を強化する。
Mistral AIは2026年6月23日、光学文字認識モデル「Mistral OCR 4」をリリースした。170言語対応で、テキスト抽出に加えてバウンディングボックス、ブロック分類、信頼度スコアを提供。独立した評価者による比較で平均72%の勝率を記録し、OlmOCRBenchで85.20点のトップスコアを獲得した。
Mistral AIが発表した「Mistral OCR 4」は、ドキュメント知能向けの光学文字認識モデルである。従来のOCRシステムとは異なり、単なるテキスト抽出にとどまらず、複数の高度な機能を統合している。
主な特徴として、バウンディングボックスはテキストの位置情報を提供し、コンテキスト内でのハイライト表示や信頼性の高いデータパイプラインの構築に対応する。ブロック分類機能では、抽出したテキストをタイトル、表、式、署名など複数のタイプに自動分類する。また、インライン信頼度スコアにより、引用の根拠提示や自動マスキング、人間による検証ループの実装が可能になる。
性能面では、独立した評価者による複数のOCRおよび文書AI システムとの比較において、OCR 4が全てのシステムに対して平均72%の勝率を達成している。公開ベンチマークのOlmOCRBenchでは、85.20点で最高スコアを記録した。
言語対応は170言語をカバーしており、10の言語グループに分類される。特に稀少言語や低リソース言語での性能向上が実現されている。
技術的には、Mistral AIの「Search Toolkit」(公開プレビュー版)の一部として統合される。同ツールキットはRAGおよびエンタープライズサーチ用の構成可能なオープンソースフレームワークであり、OCR 4の構造化出力は取り込み、検索評価ワークフローへの引用対応入力として機能する。
展開方式として、単一のコンテナで完全自己ホスト型での運用が可能であり、エンタープライズサーチ、RAG、ドメイン特化型検索パイプラインの取り込みコンポーネントとして設計されている。