Mistral Luncurkan OCR 4 untuk Dokumen Cerdas

Judul asli: Mistral OCR 4

Mengapa Ini Penting

OCR 4 memperkuat posisi Mistral dalam pemrosesan dokumen AI dengan performa terdepan dan integrasi pencarian enterprise yang komprehensif.

Mistral AI merilis OCR 4 pada 23 Juni 2026, model pengenalan optik karakter yang mendukung 170 bahasa, memberikan kotak pembatas, klasifikasi blok, dan skor kepercayaan inline untuk ekstraksi teks dokumen yang lebih akurat.

Mistral AI mengumumkan peluncuran Mistral OCR 4, model OCR generasi terbaru yang dirancang untuk kebutuhan kecerdasan dokumen perusahaan. Model ini menampilkan kemampuan baru termasuk kotak pembatas (bounding boxes), klasifikasi blok yang diketik (judul, tabel, persamaan, tanda tangan, dan lainnya), serta skor kepercayaan inline di samping teks yang diekstraksi.

OCR 4 mencapai kinerja terobosan dengan tingkat kemenangan rata-rata 72% dibandingkan sistem OCR dan document-AI terkemuka lainnya menurut penilai independen, dan meraih skor teratas pada benchmark OlmOCRBench dengan 85,20. Model ini mendukung 170 bahasa di 10 kelompok bahasa dengan peningkatan terukur pada bahasa langka dan rendah.

Model ini berjalan dalam satu kontainer untuk penyebaran yang sepenuhnya di-host sendiri dan terintegrasi dengan Mistral Search Toolkit (pratinjau publik) yang diumumkan di AI Now Summit. Output terstruktur OCR 4 menyediakan masukan siap kutipan untuk alur kerja penerimaan, pengambilan, dan evaluasi toolkit untuk RAG (Retrieval-Augmented Generation) dan pencarian perusahaan. Kotak pembatas, kemampuan yang paling diminta, melokalisir teks untuk penyorotan dalam konteks dan pipeline data yang andal, sementara jenis blok dan skor kepercayaan mendorong kutipan berbasis sumber, redaksi, dan verifikasi dalam loop manusia.

Sumber

mistral.ai — Baca artikel asli →