Wofür · Entscheidungshilfe
Multimodale Ein- und Ausgabe jenseits von Text. Hier die kuratierten Empfehlungen – Modelle, Werkzeuge und Tipps.
Google · proprietär
Preis-Leistungs-Tipp
Der Preis-Leistungs-Ausreißer: Intelligence-Index 50 (über Sonnet 4.6 und dem teureren Gemini 3.1 Pro) und Agentic 70 – zum Bruchteil des Flaggschiff-Preises. Beim Coding nur 45, ansonsten die empfehlenswerte Default-Wahl für Tempo und Volumen.
Google · proprietär
Multimodal-Spezialist
Erste Wahl für breit multimodale Arbeit – Bild, Video, Audio und PDF, was sonst kein Flaggschiff im Katalog leistet. Beim Coding (55) stärker, als der Allzweck-Wert (46) vermuten lässt, und günstiger als die Index-Spitze. Höchster Human-Präferenz-Elo nach dem gesperrten Fable 5.
Anthropic · proprietär
Schnell & günstig, aber überholt
Beim reinen Preis-Leistungs-Verhältnis von DeepSeek-V4-Pro überholt – das erreicht alle drei AA-Indizes höher und kostet weniger pro Token. Haiku bleibt sinnvoll, wo niedrige Latenz, ein gemanagter Anbieter oder Bild-Eingabe zählen (die DeepSeek nicht bietet).
Meta · open-weight
Kontext-Spezialist
Mit bis zu 10 Mio. Token das größte Kontextfenster im Katalog – aber der niedrigste Human-Präferenz-Elo (1327). Lohnt vor allem für extrem lange Kontexte und Self-Hosting, weniger für Spitzen-Antwortqualität.
Google · open-weight
Lokal & On-Device
Nicht für Spitzenleistung gebaut, sondern für lokalen/Edge-Betrieb: läuft auf Consumer-Laptops, multimodal und Apache-2.0-offen. Empfehlung dort, wo Offline-Betrieb, Datenschutz oder Hardware-Limits wichtiger sind als Benchmark-Spitzen.