Die Design Arena (designarena.ai) stellt mehreren KI-Modellen denselben Gestaltungs-Prompt, zeigt die Ergebnisse anonym nebeneinander und lässt Nutzerinnen und Nutzer ihren Favoriten wählen; aus den Stimmen wird eine Elo-Rangliste je Kategorie (u. a. Webdesign, UI-Komponenten, Mobile) berechnet. Es ist damit ein crowdgestützter Geschmacks-/Präferenz-Benchmark – vergleichbar mit LMArena, aber auf visuelles Design ausgelegt.
Laut ComputerBase steht in der Webdesign-Wertung nun GLM-5.2 mit einer Elo-Wertung von etwa 1.360 an der Spitze und hat Claude Fable 5 vom ersten Platz verdrängt; dahinter folgen weitere Claude-Modelle. Pikant ist der Kostenkontrast: GLM-5.2 ist mit $1,40 / $4,40 je Mio. Input-/Output-Tokens rund ein Fünftel so teuer wie Fable 5 ($10 / $50) und obendrein als MIT-Open-Weight frei self-hostbar – bei nur ≈744 Mrd. Parametern gegenüber den weit größeren proprietären Modellen.
Einordnung: Der Befund stützt für die spezielle Disziplin Webdesign, was schon vor dem Release als Vermutung im Raum stand (ein YouTube-Kommentator hatte den Design-Arena-Vorsprung noch mit „I don’t know if I buy that“ angezweifelt). Crowdsourcing-Präferenz ist anfällig für Stilmoden und Prompt-Auswahl und sagt nichts über Code-Qualität oder langlebige Projektarbeit aus, wo Fable 5 und Opus 4.8 weiter führen. Für die Frage „welches Modell wofür“ heißt das konkret: Für schnelles, ästhetisch überzeugendes Webdesign-Prototyping ist GLM-5.2 inzwischen erste Wahl – nicht zwingend für die anschließende technische Umsetzung.