Z.ai · GLM

GLM-5.1

glm-5.1

Text

Solide WahlOpen-Weight Agentic-Coding (MIT)

Vollständig offenes Flaggschiff (MIT) für agentisches Coding: mit 744 Mrd. Gesamt-/40 Mrd. aktiven , 200-K-Kontext. Im 40 / Coding 56 – solide, frei self-hostbare Coding-/Agenten-Wahl; reines Text-Modell (Vision liegt im separaten GLM-5V).

agentisches Coding
Self-Hosting (MIT)
lange Reasoning-Aufgaben

: 203 K
Max. Ausgabe: 131.072 K Token
Preis (Input / Output): $1.4 / $4.4 je 1 Mio. Token
: 18,6 Indexpkt. je $/Mio. Token
: nicht ausgewiesen
Release: 7. April 2026

Stärken

Vollständig offene MIT-Lizenz – frei self-hostbar/lokal betreibbar
Auf agentisches Coding ausgelegt (lange Tool-Call-Horizonte); MoE 744 Mrd. total / 40 Mrd. aktiv
200-K-Token-Kontext, 128-K-Output

Schwächen

Reines Text-Modell – nur im separaten GLM-5V/-Turbo
Sehr großes Gewichtspaket (744 Mrd. Parameter) fürs Self-Hosting

Typische Einsatzfälle

Leistung im Vergleich

Unabhängige Indizes (Artificial Analysis, 0–100), zwei kontaminationsarme Einzel-Benchmarks (Terminal-Bench, agentische Shell-Aufgaben; τ²-bench, Tool-Use-Verlässlichkeit über viele Läufe) und Human-Präferenz-Elo (LMArena). Die dunkle Markierung zeigt den Bestwert im Katalog – so wird der Abstand zur Spitze sichtbar. Die oben ist daraus abgeleitet: AA-Intelligenz je AA-Blended-Preis (3:1) – entspricht der „Intelligence vs. Price“-Sicht von Artificial Analysis. AAs token-basiertes „Cost to Run Index“ ist nicht öffentlich abrufbar.

Benchmarks im Detail

Kennzahlen aus zitierten Messungen – unabhängige Quellen sind ausgewiesen, Anbieterangaben entsprechend markiert. Werte sind nicht über Skalen hinweg vergleichbar. Wie man Benchmark-Zahlen liest →

Artificial Analysis Intelligence Index
40
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
Artificial Analysis Coding Index
56
unabhängigArtificial Analysis (API), abgerufen 2026-07-09
Terminal-Bench (agentische Shell-Aufgaben)
62 %
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
τ²-bench (Tool-Use-Verlässlichkeit)
98 %
unabhängigArtificial Analysis (API), abgerufen 2026-06-16
DeepSWE (Long-Horizon Coding)
18 %
(±4)
unabhängigdeepswe.lol (kontaminationsfrei, mini-swe-agent), 2026-07-10

Einordnung

-MoE (MIT) mit DeepSeek-Sparse-Attention: 744 Mrd. Gesamt- / 40 Mrd. aktive Parameter, 78 Layer; 200-K-Kontext, 128-K-Output. Reines Text-Modell (Vision im separaten GLM-5V).Beleg · Primärquelle
Im AA Intelligence Index 40 / Coding 56; Preis $1,40 / $4,40 (Cache-Input $0,26). Z.ai positioniert GLM-5.1 als Flaggschiff für agentisches Coding (Anbieterangabe; Eigenbenchmarks unabhängig nicht verifiziert).Beleg · Primärquelle

ℹ️ MoE 744 Mrd. total / 40 Mrd. aktiv (DeepSeek ), 78 Layer; Post-Training-Verfeinerung von GLM-5. MIT-Lizenz, Gewichte auf (zai-org/GLM-5.1 + FP8). Cache-Input $0,26 / 1 Mio. Token. Vision-Fähigkeit nur im separaten GLM-5V/-Turbo. Technical Report (GLM-5/5.1 gemeinsam) auf GitHub zai-org/GLM-5 verlinkt.