Werkzeug · Dokument-KI & OCR

Mistral OCR 4

von Mistral AI

Dokument-Verstehen statt bloßer Texterkennung: liest PDFs, Office-Dateien und Scans in 170 Sprachen und gibt strukturierte Daten mit Bounding-Boxes, Block-Typen und Konfidenzwerten zurück – als API oder selbst gehostet im eigenen Container.

KostenpflichtigAPISageMakerAzure FoundrySelf-Hosted

Einschätzung

Strukturbewusste Dokument-Extraktion, auch on-prem

Die naheliegende Wahl, wenn Dokumente nicht nur in Text, sondern in saubere, zitierfähige Struktur (Boxen, Block-Typen, Konfidenz) für eine RAG- oder Such-Pipeline überführt werden sollen – und besonders dann, wenn die Daten aus Compliance-Gründen im eigenen Container bleiben müssen. Die Bestwerte stammen teils aus Mistrals eigener Annotator-Studie; der Spitzenplatz auf dem unabhängigen OlmOCRBench stützt die Richtung.

Mistral OCR 4 (Release 23. Juni 2026) ist ein spezialisiertes Dokument-KI-Modell: Es wandelt PDFs, Word-, PowerPoint- und OpenDocument-Dateien sowie Scans nicht nur in Text um, sondern liefert eine strukturierte Repräsentation – mit Bounding-Boxes (wo steht was), einer Block-Klassifikation (Titel, Tabelle, Formel, Signatur …) und Konfidenzwerten pro Seite und Wort. Unterstützt werden 170 Sprachen über 10 Sprachgruppen.

Gedacht ist es als Ingest-Baustein für -, Such- und Agenten-Pipelines: Die zitierfähige, lässt sich direkt weiterverarbeiten, statt rohen Fließtext nachzubereiten. Verfügbar über Mistrals API, Amazon SageMaker und Microsoft Foundry – und, für regulierte Branchen entscheidend, als einzelner Container, sodass sensible Dokumente das eigene Netz nicht verlassen. Preis: 4 $ pro 1 000 Seiten (2 $ über die Batch-API).

Wofür es gut ist

PDFs und Scans für RAG-/Such-Pipelines maschinenlesbar und zitierfähig machen
Tabellen, Formeln und Layout strukturiert extrahieren – statt bloßem Fließtext
Vertrauliche Dokumente on-prem verarbeiten, ohne sie an eine Cloud-API zu geben

Stärken

Strukturierte Ausgabe mit Bounding-Boxes, Block-Typen und Konfidenzwerten – nicht nur Rohtext
Selbst hostbar als einzelner Container: sensible Dokumente bleiben im eigenen Netz
170 Sprachen; Spitzenwert auf dem unabhängigen OlmOCRBench (85,20)

Schwächen

Spezialwerkzeug für Dokument-Extraktion – kein allgemeiner Assistent/Chat
Die 72‑%-„Win-Rate“ gegen andere OCR-Systeme stammt aus Mistrals eigener Annotator-Studie (Anbieterangabe)
Nutzungspreis pro Seite skaliert bei großen Dokumentmengen spürbar

Im Vergleich

Wofür dieses Werkzeug die bessere Wahl ist – und wann ein direkter Konkurrent.

Gegenüber klassischem OCR (reine Text-/Tabellen-Konvertierung, wie noch OCR 3) ist der Sprung die strukturierte, lokalisierte Ausgabe samt Konfidenz – der Output ist direkt für Retrieval und Agenten gedacht, nicht erst aufwendig nachzubereiten.

Direkt ausprobieren

mistral.ai/news/ocr-4

Zur offiziellen Seite ↗

ℹ️ Über den DE-Kanal Everlast AI (C12, Tier C) aufgekommen, Fakten aber an Mistrals Release-Seite (Tier A) + unabhängiger Berichterstattung (MarkTechPost/VentureBeat, Tier B) geprüft – nicht am Video. OlmOCRBench 85,20 / OmniDocBench 93,07 (Anbieterangabe; OlmOCRBench selbst ist ein unabhängiger Benchmark); die „72 % Win-Rate“ kommt aus Mistrals eigener Annotator-Präferenzstudie. Preise/Zahlen im schnelllebigen Feld vor Zitat erneut prüfen.

Wofür es gut ist

Stärken

Schwächen

Im Vergleich

Verwandte Werkzeuge