Mistral, OCR 4 공개…170개 언어 지원

원제: Mistral OCR 4

왜 중요한가

OCR 기술의 업그레이드로 문서 자동화, RAG 기반 엔터프라이즈 검색 시장 경쟁력 강화

미스트랄 AI는 6월 23일 문서 인식 기술 'Mistral OCR 4'를 출시했다. 바운딩박스·블록 분류·신뢰도 스코어를 제공하며, 170개 언어를 지원한다. 벤치마크에서 경쟁 OCR 대비 72% 승률을 기록했다.

미스트랄 AI는 새로운 광학 문자 인식(OCR) 모델 'Mistral OCR 4'를 발표했다. 이 모델은 텍스트 추출뿐 아니라 바운딩박스, 블록 분류(제목, 표, 수식, 서명 등), 인라인 신뢰도 스코어를 함께 반환한다.

OCR 4는 170개 언어를 10개 언어 그룹으로 나누어 지원하며, 단일 컨테이너에서 자체 호스팅 배포가 가능하다. 엔터프라이즈 검색, RAG(검색 증강 생성), 도메인 특화 검색 파이프라인을 위한 입수 구성 요소로 설계됐다.

독립 주석자들의 평가에 따르면 OCR 4는 테스트 대상인 모든 주요 OCR 및 문서 AI 시스템을 능가했으며, 평균 승률이 72%에 달했다. OlmOCRBench에서는 85.20의 최고 점수를 기록했다.

OCR 4는 미스트랄의 오픈소스 검색 프레임워크인 'Mistral Search Toolkit'(공개 프리뷰)과 통합된다. 이 구조화된 출력은 RAG 및 엔터프라이즈 검색을 위한 도구의 입수, 검색, 평가 워크플로우에 인용 가능한 입력을 제공한다. 소형 경량 모델이면서도 고성능을 제공하는 것이 특징이다.

출처

mistral.ai — 원문 읽기 →