← Alle Depeschen

Modelleneu

GLM-5.2 verdrängt Claude Fable 5 an der Spitze der Design-Arena im Webdesign

In der Design Arena – einem crowdgestützten Human-Preference-Elo-Benchmark für KI-erzeugtes Design – führt seit Mitte Juni 2026 das offene chinesische Modell GLM-5.2 die Wertung für einstufiges Webdesign an und hat damit Anthropics Claude Fable 5 von Platz 1 verdrängt. GLM-5.2 erreicht laut ComputerBase eine Elo-Wertung von rund 1.360 und schlägt das proprietäre Spitzenmodell bei einem Bruchteil der API-Kosten ($1,40 / $4,40 gegenüber $10 / $50 je Mio. Tokens).

Die Design Arena (designarena.ai) stellt mehreren KI-Modellen denselben Gestaltungs-Prompt, zeigt die Ergebnisse anonym nebeneinander und lässt Nutzerinnen und Nutzer ihren Favoriten wählen; aus den Stimmen wird eine Elo-Rangliste je Kategorie (u. a. Webdesign, UI-Komponenten, Mobile) berechnet. Es ist damit ein crowdgestützter Geschmacks-/Präferenz-Benchmark – vergleichbar mit LMArena, aber auf visuelles Design ausgelegt.

Laut ComputerBase steht in der Webdesign-Wertung nun GLM-5.2 mit einer Elo-Wertung von etwa 1.360 an der Spitze und hat Claude Fable 5 vom ersten Platz verdrängt; dahinter folgen weitere Claude-Modelle. Pikant ist der Kostenkontrast: GLM-5.2 ist mit $1,40 / $4,40 je Mio. Input-/Output-Tokens rund ein Fünftel so teuer wie Fable 5 ($10 / $50) und obendrein als MIT-Open-Weight frei self-hostbar – bei nur ≈744 Mrd. Parametern gegenüber den weit größeren proprietären Modellen.

Einordnung: Der Befund stützt für die spezielle Disziplin Webdesign, was schon vor dem Release als Vermutung im Raum stand (ein YouTube-Kommentator hatte den Design-Arena-Vorsprung noch mit „I don’t know if I buy that“ angezweifelt). Crowdsourcing-Präferenz ist anfällig für Stilmoden und Prompt-Auswahl und sagt nichts über Code-Qualität oder langlebige Projektarbeit aus, wo Fable 5 und Opus 4.8 weiter führen. Für die Frage „welches Modell wofür“ heißt das konkret: Für schnelles, ästhetisch überzeugendes Webdesign-Prototyping ist GLM-5.2 inzwischen erste Wahl – nicht zwingend für die anschließende technische Umsetzung.