Wofür · Entscheidungshilfe
Verfassen, überarbeiten und zusammenfassen. Hier die kuratierten Empfehlungen – Modelle, Werkzeuge und Tipps.
Anthropic · proprietär
Tempo-Preis-Arbeitspferd
Die ausgewogene Standard-Wahl: rund 40 % günstiger als Opus 4.8 bei nur mäßig geringeren Werten. Kein Spitzenreiter bei den härtesten Aufgaben, aber kein gemessenes Modell übertrifft es bei gleichem oder geringerem Preis – damit weiterhin klar empfehlenswert für den Alltag.
OpenAI · proprietär
Günstige GPT-Allzweck
Das kostensensitive GPT: halber Input-/Output-Preis von GPT-5.5 bei gleichem 1-Mio.-Kontext. Unabhängige Capability-Indizes fehlen noch (bislang nur LMArena-Elo 1468), daher als solide Allzweck-Wahl statt Spitzenreiter eingestuft.
Mistral AI · open-weight
Open-Weight für EU/Souverän
Günstigstes Flaggschiff ($0,50 / $1,50) und Apache-2.0-offen – damit self-hosted und für souveräne EU-Deployments geeignet. Unabhängige Capability-Indizes stehen noch aus (bislang nur LMArena-Elo 1416), daher solide statt Spitze.
Anthropic · proprietär
Benchmark-Spitze, aktuell gesperrt
Auf dem Papier das stärkste Modell des Katalogs – Spitzenwerte in allen vier unabhängigen Messungen. Aber seit dem 12.06.2026 ist der Zugang weltweit ausgesetzt, das Modell also praktisch nicht nutzbar. Bis zur Wiederherstellung keine Empfehlung für den produktiven Einsatz.
Zugang ausgesetzt
xAI · proprietär
Von DeepSeek-V4 überholt
DeepSeek-V4-Pro erreicht alle drei AA-Indizes höher und kostet weniger pro Token – nach der Preis-Leistungs-Logik damit die bessere Wahl. Grok 4.3 bleibt situativ interessant für ein gemanagtes Produkt mit X-Anbindung und großem 1-Mio.-Kontext.
Cohere · proprietär
Enterprise & Souveränität
Auf souveräne/Enterprise-Deployments zugeschnitten (läuft effizient auf 1× B200 oder 2× H100), mit Vision und mehrsprachiger Stärke. Kein öffentlicher Token-Preis und keine unabhängigen Benchmarks – Einordnung nur über die Anbieter-Spezifikation möglich.