OpenAI · GPT
GPT-5.5
gpt-5.5
Erste WahlCoding-Spitze
Führt den unabhängigen AA Coding Index (59) vor Opus 4.8 (57) – das beste gemessene Modell fürs Programmieren. Bei Allzweck-Intelligenz minimal hinter Opus und mit höherem Output-Preis ($30), daher vor allem dann erste Wahl, wenn Code-Qualität im Vordergrund steht.
- anspruchsvolles Coding
- agentische Workflows
- Reasoning
- Kontextfenster
- 1 Mio. Token
- Max. Ausgabe
- 128 K Token
- Preis (Input / Output)
- $5 / $30 je 1 Mio. Token
- Preis-Stand
- 2026-06-15
- Wissensstichtag
- nicht ausgewiesen
- Sicherheitsstufe
- Bio/Chem & Cyber: High
Stärken
- Aktuelles Flaggschiff der GPT-Reihe (Anbieter-Positionierung)
- 1-Mio.-Token-Kontextfenster
- Multimodal: Text- und Bildeingabe
Schwächen
- Proprietär, nur über Cloud-API/Produkte nutzbar
- Hoher Output-Preis ($30 / 1 Mio. Token)
Typische Einsatzfälle
- Anspruchsvolle Allzweck- und Reasoning-Aufgaben
- agentische Workflows
- Coding
Leistung im Vergleich
Unabhängige Indizes (Artificial Analysis, 0–100) und Human-Präferenz-Elo (LMArena). Die dunkle Marke zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar.
- Intelligenz55
- Coding59
- Agentic74
- Human-Präferenz1474
Benchmarks im Detail
Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.
Artificial Analysis Intelligence Index
55
(xhigh, #3/152)
unabhängigArtificial Analysis, abgerufen 2026-06-16
Artificial Analysis Coding Index
59
(xhigh)
unabhängigArtificial Analysis Coding Index, abgerufen 2026-06-16
Artificial Analysis Agentic Index
74
(xhigh)
unabhängigArtificial Analysis Agentic Index, abgerufen 2026-06-16
LMArena Text Arena (Elo)
1474
unabhängigLMArena (arena.ai), Stand 2026-06-10
DeepSWE (Long-Horizon Coding)
70 %
(xhigh, #1)
unabhängigdeepswe.lol (kontaminationsfrei, mini-swe-agent), 2026-06-16
Einordnung
- Führt den unabhängigen AA Coding Index an (59) – vor Opus 4.8 (57) und Gemini 3.1 Pro (55); im allgemeinen Intelligence-Index liegt dagegen Opus knapp vorn. „Stärker beim Coding, minimal hinten bei Allzweck-Intelligenz." Beleg · Sekundärquelle
- Im unabhängigen AA-Intelligence-Index praktisch gleichauf mit Opus 4.8 (55 zu 56) und vor Gemini 3.1 Pro (46). Beleg · Sekundärquelle
- Stark, aber nicht führend bei Agenten: AA Agentic Index 74 – hinter Opus 4.8 (78), vor Gemini 3.5 Flash (70). (Eine frühere AA-Auswertung sah GPT-5.5 noch vorn – damals gegen Opus 4.7.) Beleg · Sekundärquelle
- Beim Coding berichtet OpenAI GPT-5.5 auf dem härteren SWE-bench Pro (≈ 58,6 %, Anbieterangabe), nicht auf dem älteren SWE-bench Verified – ein direkter Verified-Vergleich mit Opus 4.8 (88,6 %) / Gemini 3.1 Pro (80,6 %) ist daher nicht 1:1 möglich. Beleg · Primärquelle
ℹ️ Daneben GPT-5.5 Pro ($30 / $180) sowie günstigere GPT-5.4 / -mini / -nano.