← Alle Depeschen

Modelleneu

Mistral OCR 4: Dokumenten-OCR für 170 Sprachen mit Layout-Strukturierung

Mistral hat am 23. Juni 2026 OCR 4 veröffentlicht, sein neues Modell zur Dokumentenanalyse. Es liest Text aus PDF-, DOC-, PPT- und OpenDocument-Dateien nicht nur aus, sondern strukturiert ihn: Bounding-Boxes zur Textlokalisierung, Klassifizierung typisierter Blöcke (Überschriften, Tabellen, Gleichungen, Signaturen) und Confidence-Werte je Seite und Wort. Unterstützt werden 170 Sprachen in 10 Sprachgruppen. Über die API kostet OCR 4 4 $ je 1.000 Seiten (Batch: 2 $), die erweiterte „Document AI“ 5 $ je 1.000 Seiten.