Werkzeug · Dokument-KI & OCR
Mistral OCR 4
von Mistral AI
Dokument-Verstehen statt bloßer Texterkennung: liest PDFs, Office-Dateien und Scans in 170 Sprachen und gibt strukturierte Daten mit Bounding-Boxes, Block-Typen und Konfidenzwerten zurück – als API oder selbst gehostet im eigenen Container.
Einschätzung
Strukturbewusste Dokument-Extraktion, auch on-prem
Wofür es gut ist
- PDFs und Scans für RAG-/Such-Pipelines maschinenlesbar und zitierfähig machen
- Tabellen, Formeln und Layout strukturiert extrahieren – statt bloßem Fließtext
- Vertrauliche Dokumente on-prem verarbeiten, ohne sie an eine Cloud-API zu geben
Stärken
- Strukturierte Ausgabe mit Bounding-Boxes, Block-Typen und Konfidenzwerten – nicht nur Rohtext
- Selbst hostbar als einzelner Container: sensible Dokumente bleiben im eigenen Netz
- 170 Sprachen; Spitzenwert auf dem unabhängigen OlmOCRBench (85,20)
Schwächen
- Spezialwerkzeug für Dokument-Extraktion – kein allgemeiner Assistent/Chat
- Die 72‑%-„Win-Rate“ gegen andere OCR-Systeme stammt aus Mistrals eigener Annotator-Studie (Anbieterangabe)
- Nutzungspreis pro Seite skaliert bei großen Dokumentmengen spürbar
Im Vergleich
Wofür dieses Werkzeug die bessere Wahl ist – und wann ein direkter Konkurrent.
Gegenüber klassischem OCR (reine Text-/Tabellen-Konvertierung, wie noch OCR 3) ist der Sprung die strukturierte, lokalisierte Ausgabe samt Konfidenz – der Output ist direkt für Retrieval und Agenten gedacht, nicht erst aufwendig nachzubereiten.
Direkt ausprobieren
mistral.ai/news/ocr-4
ℹ️