← Alle Modelle

OpenAI · GPT

GPT-5.5

gpt-5.5

proprietärTextBild (Eingabe)

Erste WahlCoding-Spitze

Führt den unabhängigen AA Coding Index (59) vor Opus 4.8 (57) – das beste gemessene Modell fürs Programmieren. Bei Allzweck-Intelligenz minimal hinter Opus und mit höherem Output-Preis ($30), daher vor allem dann erste Wahl, wenn Code-Qualität im Vordergrund steht.

  • anspruchsvolles Coding
  • agentische Workflows
  • Reasoning
Kontextfenster
1 Mio. Token
Max. Ausgabe
128 K Token
Preis (Input / Output)
$5 / $30 je 1 Mio. Token
Preis-Stand
2026-06-15
Wissensstichtag
nicht ausgewiesen
Sicherheitsstufe
Bio/Chem & Cyber: High

Stärken

  • Aktuelles Flaggschiff der GPT-Reihe (Anbieter-Positionierung)
  • 1-Mio.-Token-Kontextfenster
  • Multimodal: Text- und Bildeingabe

Schwächen

  • Proprietär, nur über Cloud-API/Produkte nutzbar
  • Hoher Output-Preis ($30 / 1 Mio. Token)

Typische Einsatzfälle

  • Anspruchsvolle Allzweck- und Reasoning-Aufgaben
  • agentische Workflows
  • Coding

Leistung im Vergleich

Unabhängige Indizes (Artificial Analysis, 0–100) und Human-Präferenz-Elo (LMArena). Die dunkle Marke zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar.

  • Intelligenz55
  • Coding59
  • Agentic74
  • Human-Präferenz1474

Benchmarks im Detail

Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.

  • Artificial Analysis Intelligence Index

    55

    (xhigh, #3/152)

    unabhängigArtificial Analysis, abgerufen 2026-06-16

  • Artificial Analysis Coding Index

    59

    (xhigh)

    unabhängigArtificial Analysis Coding Index, abgerufen 2026-06-16

  • Artificial Analysis Agentic Index

    74

    (xhigh)

    unabhängigArtificial Analysis Agentic Index, abgerufen 2026-06-16

  • LMArena Text Arena (Elo)

    1474

    unabhängigLMArena (arena.ai), Stand 2026-06-10

  • DeepSWE (Long-Horizon Coding)

    70 %

    (xhigh, #1)

    unabhängigdeepswe.lol (kontaminationsfrei, mini-swe-agent), 2026-06-16

Einordnung

  • Führt den unabhängigen AA Coding Index an (59) – vor Opus 4.8 (57) und Gemini 3.1 Pro (55); im allgemeinen Intelligence-Index liegt dagegen Opus knapp vorn. „Stärker beim Coding, minimal hinten bei Allzweck-Intelligenz." Beleg · Sekundärquelle
  • Im unabhängigen AA-Intelligence-Index praktisch gleichauf mit Opus 4.8 (55 zu 56) und vor Gemini 3.1 Pro (46). Beleg · Sekundärquelle
  • Stark, aber nicht führend bei Agenten: AA Agentic Index 74 – hinter Opus 4.8 (78), vor Gemini 3.5 Flash (70). (Eine frühere AA-Auswertung sah GPT-5.5 noch vorn – damals gegen Opus 4.7.) Beleg · Sekundärquelle
  • Beim Coding berichtet OpenAI GPT-5.5 auf dem härteren SWE-bench Pro (≈ 58,6 %, Anbieterangabe), nicht auf dem älteren SWE-bench Verified – ein direkter Verified-Vergleich mit Opus 4.8 (88,6 %) / Gemini 3.1 Pro (80,6 %) ist daher nicht 1:1 möglich. Beleg · Primärquelle

ℹ️ Daneben GPT-5.5 Pro ($30 / $180) sowie günstigere GPT-5.4 / -mini / -nano.