← Alle Modelle

Anthropic · Claude

Claude Sonnet 5

claude-sonnet-5

proprietärModell, das nur über die API oder das Produkt des Anbieters nutzbar ist; die Gewichte werden nicht veröffentlicht. Gegenstück zu open-weight.Mehr im Wissen →TextBild (Eingabe)

Solide WahlTempo-Preis-Arbeitspferd

Nachfolger von Sonnet 4.6 mit deutlichem Sprung bei Agentic-Coding und Tool-Use, weiterhin klar günstiger als Opus 4.8/Mythos 5 und laut Anbieter nah an deren Niveau – aber kein Frontier-Modell: in der eigenen System Card sowohl bei den härtesten Coding-/Agentic-Werten als auch bei Cybersicherheits-Fähigkeiten hinter Opus 4.8.

  • Allzweck-Anwendungen
  • mehrstufige Softwareentwicklung
  • tool-lastige Agenten-Workflows
KontextfensterDie maximale Textmenge (in Tokens), die ein Modell pro Anfrage gleichzeitig „im Blick“ hat – Eingabe plus bisheriger Verlauf. Ist es voll, fällt Älteres aus dem Kontext.Mehr im Wissen →
1 Mio.TokenDie kleinste Verarbeitungseinheit eines Sprachmodells – ein Wortstück, kein ganzes Wort. Faustregel: rund 1.000 Tokens entsprechen grob 750 deutschen Wörtern. Preise und Kontextlängen werden in Tokens gerechnet.Mehr im Wissen →
Max. Ausgabe
128 K Token
Preis (Input / Output)
$2 / $10 je 1 Mio. Token
WissensstichtagDer Zeitpunkt, bis zu dem die Trainingsdaten eines Modells reichen („knowledge cutoff“). Über spätere Ereignisse weiß das Modell von sich aus nichts – es sei denn, sie werden ihm in der Anfrage mitgegeben.Mehr im Wissen →
nicht ausgewiesen
Release
30. Juni 2026
SicherheitsstufeAnbieter-Einstufung des Risikoniveaus eines Modells (z. B. Anthropics ASL-Stufen oder „Cyber: High“). Höhere Stufen lösen strengere Schutzmaßnahmen aus. Stammt aus der System-Card – Eigenangabe des Anbieters.Mehr im Wissen →
nicht ausgewiesen (Cyber-Schutzmaßnahmen standardmäßig aktiv laut Anbieter)

Stärken

  • Laut Anbieter deutlich verbesserte Agentic-Coding- und Tool-Use-Leistung gegenüber Sonnet 4.6
  • 1-Mio.-Token-Kontext, 128-K-Output (kein 64-K-Limit mehr wie Sonnet 4.6)
  • Spürbar günstiger als Opus 4.8 bei laut Anbieter naher Leistung in der Wissensarbeit
  • Einführungspreis bis 2026-08-31 nochmals günstiger als Standardpreis

Schwächen

  • Erreicht nicht die Spitzenwerte von Opus 4.8/Mythos 5 bei den härtesten Coding-/Agentic-Aufgaben
  • Laut System Card spürbar schwächer bei Cybersicherheits-Aufgaben als die Opus-Modelle
  • Bislang kaum unabhängige Benchmark- oder Praxis-Auswertungen (Release erst 2026-06-30)

Typische Einsatzfälle

  • Mehrstufige Softwareentwicklung & Debugging
  • agentische Automatisierungs-Workflows
  • Recherche & Wissensarbeit

Benchmarks im Detail

Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar. Wie man Benchmark-Zahlen liest →

  • Agentic Coding (Anbieter-Benchmark)

    63,2 %

    – gegenüber Opus 4.8 (69,2 %) und Sonnet 4.6 (58,1 %)

    AnbieterangabeAnthropic-Launchmaterial, zitiert nach TechCrunch, 2026-06-30

Einordnung

  • Direkter Nachfolger von Sonnet 4.6: gleiche Preisklasse-Logik (deutlich unter Opus 4.8: $2/$10 Einführungspreis bzw. $3/$15 Standard vs. $5/$25), laut Anbieter aber spürbar nähere Leistung an Opus 4.8 als die Vorgängergeneration – speziell bei Agentic Coding und Wissensarbeit.Beleg · Primärquelle
  • Unabhängige Indizes (Artificial Analysis, LMArena) lagen zum Stichtag noch nicht vor – Launch war erst am 2026-06-30; `kennzahlen` daher bewusst noch leer, bis eine unabhängige Quelle vorliegt.

Aus der System-Card

Verdichtete Befunde aus der offiziellen System-CardDas offizielle Begleitdokument eines Anbieters zu einem Modell (auch „Model Card“): Fähigkeiten, Grenzen, Sicherheitsbewertung. Primärquelle – die Fähigkeitsangaben darin sind aber Eigenangaben, nicht unabhängig gemessen.Mehr im Wissen → des Anbieters (Primärquelle, Tier (A/B/C)Verlässlichkeits-Stufe einer Quelle in der KI-Depesche: A = Primärquelle (z. B. offizielle Doku), B = solide Sekundärquelle, C = subjektiv/Einzelstimme. Steuert, wie stark eine Aussage gewichtet wird.Mehr im Wissen →). Fähigkeitswerte sind Anbieterangaben – nicht unabhängig nachgemessen.

Fähigkeiten

  • Agentic CodingLaut Anbieter deutlich verbesserte mehrstufige Software-Engineering- und Debugging-Fähigkeit gegenüber Sonnet 4.6; schließt End-to-End mehrteilige Aufgaben ab, die zuvor häufig auf halber Strecke stockten.
  • Tool-Use & AutonomieLaut Anbieter selbstständigeres Planen und Nutzen von Werkzeugen (Browser, Terminal) sowie eigenständiges Überprüfen der eigenen Arbeit ohne explizite Aufforderung.
  • WissensarbeitLaut Anbieter in Teilen der Wissensarbeit auf Augenhöhe mit oder leicht vor Opus 4.8 – bei insgesamt geringerer Kapazitätsfrontier als Opus-/Mythos-Modelle.

Verhalten & Sicherheit

  • AlignmentLaut Anbieter insgesamt niedrigere Rate an unerwünschtem Verhalten als Sonnet 4.6 und generell sicherer im agentischen Einsatz; sehr geringes Alignment-Risiko, aber höher als bei den vorherigen Sonnet-Generationen.
  • Refusal & Prompt-InjectionLaut Anbieter verbesserte Ablehnung böswilliger Anfragen und bessere Widerstandsfähigkeit gegen Prompt-Injection-Angriffe im Vergleich zu Sonnet 4.6.
  • CyberLaut Anbieter spürbar schwächer bei Cybersicherheits-Aufgaben als die Opus-Modelle; Cyber-Schutzmaßnahmen sind standardmäßig aktiv.
  • Halluzination & SycophancyLaut Anbieter geringere Halluzinations- und Schmeichel-Raten (Sycophancy) als Sonnet 4.6.

Anthropic – System Card: Claude Sonnet 5 (PDF)· Primärquelle, abgerufen 2026-06-30