← Alle Modelle

DeepSeek · DeepSeek

DeepSeek-V4-Pro

deepseek-v4-pro

open-weightText

Erste WahlOpen-Weight-Preis-Leistung

Der Preis-Leistungs-Sieger unter den offenen Gewichten: stärkstes Coding (47) und Agentic (67) seiner Preisklasse, dabei mit Abstand am günstigsten und selbst hostbar. Erste Wahl, wo Kosten, Datenhoheit oder lange Generierungen zählen – allerdings reine Text-Modalität.

  • Self-Hosting
  • kostensensitives Reasoning
  • lange Generierungen
Kontextfenster
1 Mio. Token
Max. Ausgabe
384 K Token
Preis (Input / Output)
$0.435 / $0.87 je 1 Mio. Token
Preis-Stand
2026-06-15

Stärken

  • Offene Gewichte (auf HuggingFace publiziert, lokal/self-hosted möglich)
  • 1-Mio.-Token-Kontext und sehr großer max. Output (384 K)
  • Thinking-Mode, Tool-Calls und JSON-Output

Schwächen

  • Hoher Output-Preis relativ zum Input (API)
  • Laut Doku reine Text-Modalität

Typische Einsatzfälle

  • lange Generierungen
  • Reasoning
  • Self-Hosted-Einsatz

Leistung im Vergleich

Unabhängige Indizes (Artificial Analysis, 0–100) und Human-Präferenz-Elo (LMArena). Die dunkle Marke zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar.

  • Intelligenz44
  • Coding47
  • Agentic67
  • Human-Präferenz1457

Benchmarks im Detail

Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.

  • Artificial Analysis Intelligence Index

    44

    (Max)

    unabhängigArtificial Analysis, abgerufen 2026-06-16

  • Artificial Analysis Coding Index

    47

    (Max)

    unabhängigArtificial Analysis Coding Index, abgerufen 2026-06-16

  • Artificial Analysis Agentic Index

    67

    (Max)

    unabhängigArtificial Analysis Agentic Index, abgerufen 2026-06-16

  • LMArena Text Arena (Elo)

    1457

    unabhängigLMArena (arena.ai), Stand 2026-06-10

  • DeepSWE (Long-Horizon Coding)

    8 %

    unabhängigdeepswe.lol (kontaminationsfrei, mini-swe-agent), 2026-06-16

Einordnung

  • Im AA Coding Index 47 – vor Gemini 3.5 Flash (45) und Grok 4.3 (41), bei offenen Gewichten (lokal/self-hosted betreibbar) und sehr günstigem API-Preis ($0,44 / $0,87). Stärkstes Coding-Ergebnis unter den Open-Weight-Modellen mit unabhängigem Wert. Beleg · Sekundärquelle

Stimmen aus der Öffentlichkeit

Subjektive Einschätzungen Dritter – keine belegten Fakten, jeweils verlinkt.

ℹ️ 1,6 Bio. Parameter total, 49 Mrd. aktiv je Token (MoE, 61 Layer); trainiert auf 33 Bio. Tokens. Architektur laut Tech Report: hybride Attention (CSA+HCA), Hash-Routing in den ersten 3 MoE-Layern, FP4-Quantization-Aware-Training, Muon-Optimizer. API-Input $0,435 (Cache-Miss), $0,003625 (Cache-Hit). Offene Gewichte auf HuggingFace; Schwestermodell V4-Flash (284B/13B, $0,14 / $0,28).