Anthropic · Claude
Claude Sonnet 5
claude-sonnet-5
Solide WahlTempo-Preis-Arbeitspferd
- Allzweck-Anwendungen
- mehrstufige Softwareentwicklung
- tool-lastige Agenten-Workflows
KontextfensterDie maximale Textmenge (in Tokens), die ein Modell pro Anfrage gleichzeitig „im Blick“ hat – Eingabe plus bisheriger Verlauf. Ist es voll, fällt Älteres aus dem Kontext.Mehr im Wissen → - 1 Mio.
TokenDie kleinste Verarbeitungseinheit eines Sprachmodells – ein Wortstück, kein ganzes Wort. Faustregel: rund 1.000 Tokens entsprechen grob 750 deutschen Wörtern. Preise und Kontextlängen werden in Tokens gerechnet.Mehr im Wissen → - Max. Ausgabe
- 128 K Token
- Preis (Input / Output)
- $2 / $10 je 1 Mio. Token
WissensstichtagDer Zeitpunkt, bis zu dem die Trainingsdaten eines Modells reichen („knowledge cutoff“). Über spätere Ereignisse weiß das Modell von sich aus nichts – es sei denn, sie werden ihm in der Anfrage mitgegeben.Mehr im Wissen → - nicht ausgewiesen
- Release
- 30. Juni 2026
SicherheitsstufeAnbieter-Einstufung des Risikoniveaus eines Modells (z. B. Anthropics ASL-Stufen oder „Cyber: High“). Höhere Stufen lösen strengere Schutzmaßnahmen aus. Stammt aus der System-Card – Eigenangabe des Anbieters.Mehr im Wissen → - nicht ausgewiesen (Cyber-Schutzmaßnahmen standardmäßig aktiv laut Anbieter)
Stärken
- Laut Anbieter deutlich verbesserte Agentic-Coding- und Tool-Use-Leistung gegenüber Sonnet 4.6
- 1-Mio.-Token-Kontext, 128-K-Output (kein 64-K-Limit mehr wie Sonnet 4.6)
- Spürbar günstiger als Opus 4.8 bei laut Anbieter naher Leistung in der Wissensarbeit
- Einführungspreis bis 2026-08-31 nochmals günstiger als Standardpreis
Schwächen
Erreicht nicht die Spitzenwerte von Opus 4.8/Mythos 5 bei den härtesten Coding-/Agentic-Aufgaben Laut System Card spürbar schwächer bei Cybersicherheits-Aufgaben als die Opus-Modelle Bislang kaum unabhängige Benchmark- oder Praxis-Auswertungen (Release erst 2026-06-30)
Typische Einsatzfälle
Mehrstufige Softwareentwicklung & Debugging agentische Automatisierungs-Workflows Recherche & Wissensarbeit
Benchmarks im Detail
Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar. Wie man Benchmark-Zahlen liest →
Agentic Coding (Anbieter-Benchmark)
63,2 %
– gegenüber Opus 4.8 (69,2 %) und Sonnet 4.6 (58,1 %)
AnbieterangabeAnthropic-Launchmaterial, zitiert nach TechCrunch, 2026-06-30
Einordnung
Direkter Nachfolger von Sonnet 4.6: gleiche Preisklasse-Logik (deutlich unter Opus 4.8: $2/$10 Einführungspreis bzw. $3/$15 Standard vs. $5/$25), laut Anbieter aber spürbar nähere Leistung an Opus 4.8 als die Vorgängergeneration – speziell bei Agentic Coding und Wissensarbeit. Beleg · PrimärquelleUnabhängige Indizes (Artificial Analysis, LMArena) lagen zum Stichtag noch nicht vor – Launch war erst am 2026-06-30; `kennzahlen` daher bewusst noch leer, bis eine unabhängige Quelle vorliegt.
Aus der System-Card
Verdichtete Befunde aus der offiziellen
Fähigkeiten
- Agentic Coding –
Laut Anbieter deutlich verbesserte mehrstufige Software-Engineering- und Debugging-Fähigkeit gegenüber Sonnet 4.6; schließt End-to-End mehrteilige Aufgaben ab, die zuvor häufig auf halber Strecke stockten. - Tool-Use & Autonomie –
Laut Anbieter selbstständigeres Planen und Nutzen von Werkzeugen (Browser, Terminal) sowie eigenständiges Überprüfen der eigenen Arbeit ohne explizite Aufforderung. - Wissensarbeit –
Laut Anbieter in Teilen der Wissensarbeit auf Augenhöhe mit oder leicht vor Opus 4.8 – bei insgesamt geringerer Kapazitätsfrontier als Opus-/Mythos-Modelle.
Verhalten & Sicherheit
- Alignment –
Laut Anbieter insgesamt niedrigere Rate an unerwünschtem Verhalten als Sonnet 4.6 und generell sicherer im agentischen Einsatz; sehr geringes Alignment-Risiko, aber höher als bei den vorherigen Sonnet-Generationen. - Refusal & Prompt-Injection –
Laut Anbieter verbesserte Ablehnung böswilliger Anfragen und bessere Widerstandsfähigkeit gegen Prompt-Injection-Angriffe im Vergleich zu Sonnet 4.6. - Cyber –
Laut Anbieter spürbar schwächer bei Cybersicherheits-Aufgaben als die Opus-Modelle; Cyber-Schutzmaßnahmen sind standardmäßig aktiv. - Halluzination & Sycophancy –
Laut Anbieter geringere Halluzinations- und Schmeichel-Raten (Sycophancy) als Sonnet 4.6.
Anthropic – System Card: Claude Sonnet 5 (PDF)· Primärquelle, abgerufen 2026-06-30