← Alle Modelle

Alibaba · Qwen

Qwen3-Max

qwen3-max

proprietärText

Solide WahlAgentic-Allzweck (Alibaba Cloud)

Auf mehrstufige, tool-lastige Workflows ausgelegt, mit großem 256-K-Kontext und günstigem Kurz-Prompt-Preis. Nur über Alibaba Cloud nutzbar und bei langen Prompts gestaffelt teurer; unabhängig bislang nur per Elo (1435) belegt.

  • agentische, mehrstufige Workflows
  • Tool-Calling
  • lange Kontexte
Kontextfenster
262 K Token
Max. Ausgabe
65.536 K Token
Preis (Input / Output)
$1.2 / $6 je 1 Mio. Token
Preis-Stand
2026-06-16

Stärken

  • Leistungsstärkstes Modell der Qwen-Reihe (Anbieterangabe)
  • Großes 256-K-Token-Kontextfenster (262 144)
  • Natives Tool-Calling, auf komplexe mehrstufige Aufgaben ausgelegt

Schwächen

  • Proprietär, nur über Alibaba Cloud Model Studio / DashScope nutzbar
  • Reine Text-Modalität
  • Gestaffelter Preis – über 32 K bzw. 128 K Token deutlich teurer

Typische Einsatzfälle

  • Agentische, mehrstufige Workflows
  • Coding
  • lange Kontexte

Leistung im Vergleich

Unabhängige Indizes (Artificial Analysis, 0–100) und Human-Präferenz-Elo (LMArena). Die dunkle Marke zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar.

  • Human-Präferenz1435

Benchmarks im Detail

Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar.

  • LMArena Text Arena (Elo)

    1435

    (Preview)

    unabhängigLMArena (arena.ai), Stand 2026-06-10

Einordnung

  • Großes 256-K-Kontextfenster und natives Tool-Calling; günstig bei kurzen Prompts ($1,20 / $6), aber gestaffelt teurer bei langen und auf reine Text-Modalität beschränkt.
  • Proprietär (nur über Alibaba Cloud Model Studio). Das neuere agenten-fokussierte Qwen3.7-Max ist im Rollout, hier aber bewusst nicht aufgenommen (primär noch unbelegt).

ℹ️ Gestaffelter Preis (International Deployment): Input $1,20 (0–32 K) / $2,40 (32–128 K) / $3 (128–252 K); Output $6 / $12 / $15 je 1 Mio. Token. Max. Input 258 048, max. Output 65 536 (ohne Thinking) bzw. 32 768 (mit Thinking). Open-weight-Varianten der Qwen-Reihe (Qwen3.6, Apache 2.0) liegen auf Hugging Face; das neuere agenten-fokussierte Qwen3.7-Max ist noch im Rollout und hier bewusst nicht aufgenommen (im offiziellen Modell-/Pricing-Register noch nicht belegt).