Anthropic · Claude

Claude Sonnet 5

claude-sonnet-5

TextBild (Eingabe)

Solide WahlTempo-Preis-Arbeitspferd

Nachfolger von Sonnet 4.6 mit deutlichem Sprung bei Agentic-Coding und Tool-Use, weiterhin klar günstiger als Opus 4.8/Mythos 5 und laut Anbieter nah an deren Niveau – aber kein Frontier-Modell: in der eigenen System Card sowohl bei den härtesten Coding-/Agentic-Werten als auch bei Cybersicherheits-Fähigkeiten hinter Opus 4.8.

Allzweck-Anwendungen
mehrstufige Softwareentwicklung
tool-lastige Agenten-Workflows

: 1 Mio.
Max. Ausgabe: 128 K Token
Preis (Input / Output): $2 / $10 je 1 Mio. Token
: nicht ausgewiesen
Release: 30. Juni 2026
: nicht ausgewiesen (Cyber-Schutzmaßnahmen standardmäßig aktiv laut Anbieter)

Stärken

Laut Anbieter deutlich verbesserte Agentic-Coding- und Tool-Use-Leistung gegenüber Sonnet 4.6
1-Mio.-Token-Kontext, 128-K-Output (kein 64-K-Limit mehr wie Sonnet 4.6)
Spürbar günstiger als Opus 4.8 bei laut Anbieter naher Leistung in der Wissensarbeit
Einführungspreis bis 2026-08-31 nochmals günstiger als Standardpreis

Schwächen

Erreicht nicht die Spitzenwerte von Opus 4.8/Mythos 5 bei den härtesten Coding-/Agentic-Aufgaben
Laut System Card spürbar schwächer bei Cybersicherheits-Aufgaben als die Opus-Modelle
Bislang kaum unabhängige Benchmark- oder Praxis-Auswertungen (Release erst 2026-06-30)

Typische Einsatzfälle

Mehrstufige Softwareentwicklung & Debugging
agentische Automatisierungs-Workflows
Recherche & Wissensarbeit

Benchmarks im Detail

Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar. Wie man Benchmark-Zahlen liest →

Agentic Coding (Anbieter-Benchmark)
63,2 %
– gegenüber Opus 4.8 (69,2 %) und Sonnet 4.6 (58,1 %)
AnbieterangabeAnthropic-Launchmaterial, zitiert nach TechCrunch, 2026-06-30

Einordnung

Direkter Nachfolger von Sonnet 4.6: gleiche Preisklasse-Logik (deutlich unter Opus 4.8: $2/$10 Einführungspreis bzw. $3/$15 Standard vs. $5/$25), laut Anbieter aber spürbar nähere Leistung an Opus 4.8 als die Vorgängergeneration – speziell bei Agentic Coding und Wissensarbeit.Beleg · Primärquelle
Unabhängige Indizes (Artificial Analysis, LMArena) lagen zum Stichtag noch nicht vor – Launch war erst am 2026-06-30; `kennzahlen` daher bewusst noch leer, bis eine unabhängige Quelle vorliegt.

Aus der System-Card

Verdichtete Befunde aus der offiziellen des Anbieters (Primärquelle, ). Fähigkeitswerte sind Anbieterangaben – nicht unabhängig nachgemessen.

Fähigkeiten

Agentic Coding – Laut Anbieter deutlich verbesserte mehrstufige Software-Engineering- und Debugging-Fähigkeit gegenüber Sonnet 4.6; schließt End-to-End mehrteilige Aufgaben ab, die zuvor häufig auf halber Strecke stockten.
Tool-Use & Autonomie – Laut Anbieter selbstständigeres Planen und Nutzen von Werkzeugen (Browser, Terminal) sowie eigenständiges Überprüfen der eigenen Arbeit ohne explizite Aufforderung.
Wissensarbeit – Laut Anbieter in Teilen der Wissensarbeit auf Augenhöhe mit oder leicht vor Opus 4.8 – bei insgesamt geringerer Kapazitätsfrontier als Opus-/Mythos-Modelle.

Verhalten & Sicherheit

Alignment – Laut Anbieter insgesamt niedrigere Rate an unerwünschtem Verhalten als Sonnet 4.6 und generell sicherer im agentischen Einsatz; sehr geringes Alignment-Risiko, aber höher als bei den vorherigen Sonnet-Generationen.
Refusal & Prompt-Injection – Laut Anbieter verbesserte Ablehnung böswilliger Anfragen und bessere Widerstandsfähigkeit gegen Prompt-Injection-Angriffe im Vergleich zu Sonnet 4.6.
Cyber – Laut Anbieter spürbar schwächer bei Cybersicherheits-Aufgaben als die Opus-Modelle; Cyber-Schutzmaßnahmen sind standardmäßig aktiv.
Halluzination & Sycophancy – Laut Anbieter geringere Halluzinations- und Schmeichel-Raten (Sycophancy) als Sonnet 4.6.

Anthropic – System Card: Claude Sonnet 5 (PDF)· Primärquelle, abgerufen 2026-06-30