DeepSeek · DeepSeek
DeepSeek-V4-Pro
deepseek-v4-pro
Erste WahlOpen-Weight-Preis-Leistung
Der Preis-Leistungs-Sieger unter den offenen Gewichten: stärkstes Coding (47) und Agentic (67) seiner Preisklasse, dabei mit Abstand am günstigsten und selbst hostbar. Erste Wahl, wo Kosten, Datenhoheit oder lange Generierungen zählen – allerdings reine Text-Modalität.
- Self-Hosting
- kostensensitives Reasoning
- lange Generierungen
- Kontextfenster
- 1 Mio. Token
- Max. Ausgabe
- 384 K Token
- Preis (Input / Output)
- $0.435 / $0.87 je 1 Mio. Token
- Preis-Stand
- 2026-06-15
Stärken
- Offene Gewichte (auf HuggingFace publiziert, lokal/self-hosted möglich)
- 1-Mio.-Token-Kontext und sehr großer max. Output (384 K)
- Thinking-Mode, Tool-Calls und JSON-Output
Schwächen
- Hoher Output-Preis relativ zum Input (API)
- Laut Doku reine Text-Modalität
Typische Einsatzfälle
- lange Generierungen
- Reasoning
- Self-Hosted-Einsatz
Leistung im Vergleich
Unabhängige Indizes (Artificial Analysis, 0–100) und Human-Präferenz-Elo (LMArena). Die dunkle Marke zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar.
- Intelligenz44
- Coding47
- Agentic67
- Human-Präferenz1457
Benchmarks im Detail
Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.
Artificial Analysis Intelligence Index
44
(Max)
unabhängigArtificial Analysis, abgerufen 2026-06-16
Artificial Analysis Coding Index
47
(Max)
unabhängigArtificial Analysis Coding Index, abgerufen 2026-06-16
Artificial Analysis Agentic Index
67
(Max)
unabhängigArtificial Analysis Agentic Index, abgerufen 2026-06-16
LMArena Text Arena (Elo)
1457
unabhängigLMArena (arena.ai), Stand 2026-06-10
DeepSWE (Long-Horizon Coding)
8 %
unabhängigdeepswe.lol (kontaminationsfrei, mini-swe-agent), 2026-06-16
Einordnung
- Im AA Coding Index 47 – vor Gemini 3.5 Flash (45) und Grok 4.3 (41), bei offenen Gewichten (lokal/self-hosted betreibbar) und sehr günstigem API-Preis ($0,44 / $0,87). Stärkstes Coding-Ergebnis unter den Open-Weight-Modellen mit unabhängigem Wert. Beleg · Sekundärquelle
Stimmen aus der Öffentlichkeit
Subjektive Einschätzungen Dritter – keine belegten Fakten, jeweils verlinkt.
- positivBewundert DeepSeeks Infrastruktur-/Architekturdesign als an den Tech Report anschlussfähig – hybride Attention, Hash-Routing, FP4-Quantization-Aware-Training und Muon-Optimizer.bycloud (YouTube) – „The Insane Infrastructure Design of DeepSeek V4" · Community
ℹ️ 1,6 Bio. Parameter total, 49 Mrd. aktiv je Token (MoE, 61 Layer); trainiert auf 33 Bio. Tokens. Architektur laut Tech Report: hybride Attention (CSA+HCA), Hash-Routing in den ersten 3 MoE-Layern, FP4-Quantization-Aware-Training, Muon-Optimizer. API-Input $0,435 (Cache-Miss), $0,003625 (Cache-Hit). Offene Gewichte auf HuggingFace; Schwestermodell V4-Flash (284B/13B, $0,14 / $0,28).