Mistral lance OCR 4, son modèle de reconnaissance optique ultime

Original : Mistral OCR 4

Pourquoi c'est important

OCR 4 améliore significativement l'extraction et la structuration documentaire pour les entreprises utilisant RAG et recherche d'entreprise.

Mistral AI a présenté OCR 4 le 23 juin 2026, un modèle de reconnaissance optique de caractères supportant 170 langues avec boîtes englobantes, classification de blocs et scores de confiance intégrés pour l'extraction documentaire.

Mistral AI a annoncé le lancement de Mistral OCR 4, un modèle de reconnaissance optique de caractères (OCR) spécialisé pour l'intelligence documentaire. Le modèle offre des performances supérieures avec un taux de préférence de 72% par rapport aux systèmes OCR et document-AI concurrents testés, et atteint le meilleur score sur le benchmark OlmOCRBench avec 85,20%. OCR 4 fournit non seulement du texte extrait, mais aussi des boîtes englobantes pour localiser précisément le texte, une classification typée des blocs (titres, tableaux, équations, signatures, etc.) et des scores de confiance en ligne. Le modèle supporte 170 langues réparties sur 10 groupes linguistiques. OCR 4 s'intègre à Mistral Search Toolkit, un framework de recherche open-source annoncé au AI Now Summit, servant de composant d'ingestion pour les pipelines RAG et de recherche d'entreprise. Le modèle peut être déployé en auto-hébergé dans un seul conteneur.

Source

mistral.ai — Lire l'original →