Z.ai · GLM
GLM-5.1
glm-5.1
Solide WahlOpen-Weight Agentic-Coding (MIT)
Vollständig offenes Flaggschiff (MIT) für agentisches Coding: MoE mit 744 Mrd. Gesamt-/40 Mrd. aktiven Parametern, 200-K-Kontext. Im AA Intelligence Index 40 / Coding 43 – solide, frei self-hostbare Coding-/Agenten-Wahl; reines Text-Modell (Vision liegt im separaten GLM-5V).
- agentisches Coding
- Self-Hosting (MIT)
- lange Reasoning-Aufgaben
- Kontextfenster
- 203 K Token
- Max. Ausgabe
- 131.072 K Token
- Preis (Input / Output)
- $1.4 / $4.4 je 1 Mio. Token
- Preis-Leistung
- 18,6 Indexpkt. je $/Mio. Token
- Wissensstichtag
- nicht ausgewiesen
- Release
- 7. April 2026
Stärken
- Vollständig offene MIT-Lizenz – frei self-hostbar/lokal betreibbar
- Auf agentisches Coding ausgelegt (lange Tool-Call-Horizonte); MoE 744 Mrd. total / 40 Mrd. aktiv
- 200-K-Token-Kontext, 128-K-Output
Schwächen
- Reines Text-Modell – Multimodalität nur im separaten GLM-5V/-Turbo
- Sehr großes Gewichtspaket (744 Mrd. Parameter) fürs Self-Hosting
Typische Einsatzfälle
- agentisches Coding
- Self-Hosting (MIT)
- lange Reasoning-Aufgaben
Leistung im Vergleich
Unabhängige Indizes (Artificial Analysis, 0–100), zwei kontaminationsarme Einzel-Benchmarks (Terminal-Bench, agentische Shell-Aufgaben; τ²-bench, Tool-Use-Verlässlichkeit über viele Läufe) und Human-Präferenz-Elo (LMArena). Die dunkle Markierung zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar. Die Preis-Leistung oben ist daraus abgeleitet: AA-Intelligenz je AA-Blended-Preis (3:1) – entspricht der „Intelligence vs. Price“-Sicht von Artificial Analysis. AAs token-basiertes „Cost to Run Index“ ist nicht öffentlich abrufbar.
- Intelligenz40
- Coding43
- Terminal-Bench62
- Tool-Use98
Benchmarks im Detail
Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar. Wie man Benchmark-Zahlen liest →
Artificial Analysis Intelligence Index
40
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
Artificial Analysis Coding Index
43
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
Terminal-Bench (agentische Shell-Aufgaben)
62 %
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
τ²-bench (Tool-Use-Verlässlichkeit)
98 %
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
Einordnung
- Open-Weight-MoE (MIT) mit DeepSeek-Sparse-Attention: 744 Mrd. Gesamt- / 40 Mrd. aktive Parameter, 78 Layer; 200-K-Kontext, 128-K-Output. Reines Text-Modell (Vision im separaten GLM-5V). Beleg · Primärquelle
- Im AA Intelligence Index 40 / Coding 43; Preis $1,40 / $4,40 (Cache-Input $0,26). Z.ai positioniert GLM-5.1 als Flaggschiff für agentisches Coding (Anbieterangabe; Eigenbenchmarks unabhängig nicht verifiziert). Beleg · Primärquelle
ℹ️ MoE 744 Mrd. total / 40 Mrd. aktiv (DeepSeek Sparse Attention), 78 Layer; Post-Training-Verfeinerung von GLM-5. MIT-Lizenz, Gewichte auf Hugging Face (zai-org/GLM-5.1 + FP8). Cache-Input $0,26 / 1 Mio. Token. Vision-Fähigkeit nur im separaten GLM-5V/-Turbo. Technical Report (GLM-5/5.1 gemeinsam) auf GitHub zai-org/GLM-5 verlinkt.