← Alle Werkzeuge

Werkzeug · Dokument-KI & OCR

Mistral OCR 4

von Mistral AI

Dokument-Verstehen statt bloßer Texterkennung: liest PDFs, Office-Dateien und Scans in 170 Sprachen und gibt strukturierte Daten mit Bounding-Boxes, Block-Typen und Konfidenzwerten zurück – als API oder selbst gehostet im eigenen Container.

KostenpflichtigAPISageMakerAzure FoundrySelf-Hosted

Einschätzung

Strukturbewusste Dokument-Extraktion, auch on-prem

Die naheliegende Wahl, wenn Dokumente nicht nur in Text, sondern in saubere, zitierfähige Struktur (Boxen, Block-Typen, Konfidenz) für eine RAG- oder Such-Pipeline überführt werden sollen – und besonders dann, wenn die Daten aus Compliance-Gründen im eigenen Container bleiben müssen. Die Bestwerte stammen teils aus Mistrals eigener Annotator-Studie; der Spitzenplatz auf dem unabhängigen OlmOCRBench stützt die Richtung.

Mistral OCR 4 (Release 23. Juni 2026) ist ein spezialisiertes Dokument-KI-Modell: Es wandelt PDFs, Word-, PowerPoint- und OpenDocument-Dateien sowie Scans nicht nur in Text um, sondern liefert eine strukturierte Repräsentation – mit Bounding-Boxes (wo steht was), einer Block-Klassifikation (Titel, Tabelle, Formel, Signatur …) und Konfidenzwerten pro Seite und Wort. Unterstützt werden 170 Sprachen über 10 Sprachgruppen.

Gedacht ist es als Ingest-Baustein für RAGRetrieval-Augmented Generation: dem Modell werden zur Anfrage passende Textstellen aus einer eigenen Wissensquelle beigelegt, damit es daraus antwortet statt nur aus dem Training. Reduziert Halluzinationen und hält Wissen aktuell.Mehr im Wissen →-, Such- und Agenten-Pipelines: Die zitierfähige, Structured OutputFähigkeit eines Modells, die Antwort in einem festen, maschinenlesbaren Format (z. B. JSON nach Schema) zu liefern – wichtig, wenn Programme die Ausgabe weiterverarbeiten.Mehr im Wissen → lässt sich direkt weiterverarbeiten, statt rohen Fließtext nachzubereiten. Verfügbar über Mistrals API, Amazon SageMaker und Microsoft Foundry – und, für regulierte Branchen entscheidend, als einzelner Self-HostingEin (meist open-weight) Modell auf eigener Hardware oder in der eigenen Cloud betreiben, statt die API eines Anbieters zu nutzen. Bringt Datenhoheit und Kostenkontrolle, erfordert aber eigene Infrastruktur.Mehr im Wissen → Container, sodass sensible Dokumente das eigene Netz nicht verlassen. Preis: 4 $ pro 1 000 Seiten (2 $ über die Batch-API).

Wofür es gut ist

  • PDFs und Scans für RAG-/Such-Pipelines maschinenlesbar und zitierfähig machen
  • Tabellen, Formeln und Layout strukturiert extrahieren – statt bloßem Fließtext
  • Vertrauliche Dokumente on-prem verarbeiten, ohne sie an eine Cloud-API zu geben

Stärken

  • Strukturierte Ausgabe mit Bounding-Boxes, Block-Typen und Konfidenzwerten – nicht nur Rohtext
  • Selbst hostbar als einzelner Container: sensible Dokumente bleiben im eigenen Netz
  • 170 Sprachen; Spitzenwert auf dem unabhängigen OlmOCRBench (85,20)

Schwächen

  • Spezialwerkzeug für Dokument-Extraktion – kein allgemeiner Assistent/Chat
  • Die 72‑%-„Win-Rate“ gegen andere OCR-Systeme stammt aus Mistrals eigener Annotator-Studie (Anbieterangabe)
  • Nutzungspreis pro Seite skaliert bei großen Dokumentmengen spürbar

Im Vergleich

Wofür dieses Werkzeug die bessere Wahl ist – und wann ein direkter Konkurrent.

  • Gegenüber klassischem OCR (reine Text-/Tabellen-Konvertierung, wie noch OCR 3) ist der Sprung die strukturierte, lokalisierte Ausgabe samt Konfidenz – der Output ist direkt für Retrieval und Agenten gedacht, nicht erst aufwendig nachzubereiten.

Direkt ausprobieren

mistral.ai/news/ocr-4

Zur offiziellen Seite ↗

ℹ️ Über den DE-Kanal Everlast AI (C12, Tier C) aufgekommen, Fakten aber an Mistrals Release-Seite (Tier A) + unabhängiger Berichterstattung (MarkTechPost/VentureBeat, Tier B) geprüft – nicht am Video. OlmOCRBench 85,20 / OmniDocBench 93,07 (Anbieterangabe; OlmOCRBench selbst ist ein unabhängiger Benchmark); die „72 % Win-Rate“ kommt aus Mistrals eigener Annotator-Präferenzstudie. Preise/Zahlen im schnelllebigen Feld vor Zitat erneut prüfen.

Verwandte Werkzeuge