Anthropic · Claude
Claude Opus 4.8
claude-opus-4-8
proprietärTextBild (Eingabe)
- Kontextfenster
- 1 Mio. Token
- Max. Ausgabe
- 128 K Token
- Preis (Input / Output)
- $5 / $25 je 1 Mio. Token
- Preis-Stand
- 2026-06-15
- Wissensstichtag
- nicht ausgewiesen
- Sicherheitsstufe
- ≥ ASL-3
Stärken
- Sehr leistungsfähig bei langen, autonomen Agenten-Aufgaben
- 1-Mio.-Token-Kontext ohne Long-Context-Aufpreis
- Stark in Wissensarbeit und Code-Review
Schwächen
- Höherer Preis als Sonnet/Haiku
- Neigt ohne Steuerung zu mehr Narration/Rückfragen
Typische Einsatzfälle
- Komplexe Coding-Agenten
- Tiefenrecherche
- lange autonome Läufe
Benchmarks
Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.
Artificial Analysis Intelligence Index
56
unabhängigArtificial Analysis, abgerufen 2026-06-16
Artificial Analysis Coding Index
57
(max effort)
unabhängigArtificial Analysis Coding Index, abgerufen 2026-06-16
Artificial Analysis Agentic Index
78
(max effort)
unabhängigArtificial Analysis Agentic Index, abgerufen 2026-06-16
SWE-bench Verified (Coding)
88,6 %
Anbieterangabellm-stats.com, 2026-06-16
LMArena Text Arena (Elo)
1477
unabhängigLMArena (arena.ai), Stand 2026-06-10
Einordnung
- Stärkster Allrounder der verfügbaren Modelle: führt sowohl den unabhängigen AA-Intelligence-Index (56) als auch den AA Agentic Index (78) an – nur beim Coding liegt GPT-5.5 knapp vorn (s. u.). Beleg · Sekundärquelle
- Coding ist benchmark-abhängig: höchster SWE-bench-Verified-Wert der Flaggschiffe (88,6 %, Anbieterangabe), aber auf dem unabhängigen AA Coding Index liegt GPT-5.5 (59) knapp vorn – Opus 4.8 = 57, Gemini 3.1 Pro = 55, Sonnet 4.6 = 51. Beleg · Sekundärquelle
- 1-Mio.-Token-Kontext – fünffach größer als das schnelle Schwestermodell Haiku 4.5 (200 K).
ℹ️ Bild-Eingabe (Vision) laut Models-API-Capabilities bestätigt.