Google · Gemini
Gemini 3.1 Pro
gemini-3.1-pro-preview
Erste WahlMultimodal-Spezialist
Erste Wahl für breit multimodale Arbeit – Bild, Video, Audio und PDF, was sonst kein Flaggschiff im Katalog leistet. Beim Coding (55) stärker, als der Allzweck-Wert (46) vermuten lässt, und günstiger als die Index-Spitze. Höchster Human-Präferenz-Elo nach dem gesperrten Fable 5.
- Video-/Audio-/PDF-Analyse
- lange Dokumente
- multimodale agentische Workflows
- Kontextfenster
- 1 Mio. Token
- Max. Ausgabe
- 65.536 K Token
- Preis (Input / Output)
- $2 / $12 je 1 Mio. Token
- Preis-Stand
- 2026-06-15
- Wissensstichtag
- Jan 2025
- Sicherheitsstufe
- FSF: Cyber-Alert
Stärken
- Breit multimodal: Text, Bild, Video, Audio und PDF
- 1-Mio.-Token-Kontextfenster
- Auf agentische und Coding-Aufgaben ausgelegt (Anbieterangabe)
Schwächen
- Noch im Preview-Status
- Gestaffelter Preis: über 200 K Token teurer ($4 / $18)
- Proprietär, nur über die Cloud-API nutzbar
Typische Einsatzfälle
- Multimodale Analyse
- lange Dokumente und Video
- agentische Workflows
Leistung im Vergleich
Unabhängige Indizes (Artificial Analysis, 0–100) und Human-Präferenz-Elo (LMArena). Die dunkle Marke zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar.
- Intelligenz46
- Coding55
- Agentic59
- Human-Präferenz1487
Benchmarks im Detail
Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.
Artificial Analysis Intelligence Index
46
(Preview, #10/152)
unabhängigArtificial Analysis, abgerufen 2026-06-16
Artificial Analysis Coding Index
55
(Preview)
unabhängigArtificial Analysis Coding Index, abgerufen 2026-06-16
Artificial Analysis Agentic Index
59
(Preview)
unabhängigArtificial Analysis Agentic Index, abgerufen 2026-06-16
SWE-bench Verified (Coding)
80,6 %
Anbieterangabellm-stats.com, 2026-06-16
LMArena Text Arena (Elo)
1487
unabhängigLMArena (arena.ai), Stand 2026-06-10
DeepSWE (Long-Horizon Coding)
10 %
unabhängigdeepswe.lol (kontaminationsfrei, mini-swe-agent), 2026-06-16
Einordnung
- Beim Coding stärker, als der Allzweck-Wert vermuten lässt: AA Coding Index 55 (nahe Opus 4.8/GPT-5.5) – während es im allgemeinen Intelligence-Index mit 46 hinter beiden liegt. Beleg · Sekundärquelle
- Im unabhängigen AA-Intelligence-Index hinter Opus 4.8 (56) und GPT-5.5 (55) – Rang 46 (#10/152). Beleg · Sekundärquelle
- Gegenüber den Index-Spitzenreitern günstiger ($2 / $12 vs. $5 / $25 bei Opus 4.8) und breiter multimodal (Bild, Video, Audio, PDF).
ℹ️ Preis gilt für Prompts bis 200 K Token; darüber $4 / $18 je 1 Mio. Token. Modell-ID gemini-3.1-pro-preview (Preview).