Coinbase macht chinesische Open-Weight-Modelle zum Default – und halbiert die KI-Rechnung
Coinbase-CEO Brian Armstrong hat am 27. Juni 2026 auf X dargelegt, dass sein Unternehmen GLM-5.2 (Zhipu AI) und Kimi 2.7 (Moonshot) über ein internes LLM-Gateway als Standardmodelle einsetzt. Über bessere Defaults, Routing und Caching habe Coinbase seine KI-Ausgaben um rund die Hälfte gesenkt – bei weiter exponentiell wachsendem Token-Verbrauch; die Cache-Trefferquote sei dabei von 5 auf 60 Prozent gestiegen. Berichtet von The Information und The Decoder am 28. Juni 2026.
Armstrong beschreibt das Vorgehen als „bessere Defaults statt Nutzungsobergrenzen“: 91 Prozent der Entwickler hätten ihr früheres Ausgabenlimit ohnehin nie erreicht, deshalb senke Coinbase nicht das Limit, sondern stelle die Standardmodelle um. Über ein internes LLM-Gateway laufen Routine-Anfragen nun per Default auf den open-weightModell, dessen trainierte Gewichte öffentlich herunterladbar sind, sodass man es selbst (lokal oder auf eigener Hardware) betreiben kann. Nicht zwingend vollständig quelloffen – die Lizenz bestimmt die erlaubte Nutzung.Mehr im Wissen →-Modellen GLM-5.2 (Zhipu AI) und Kimi 2.7 (Moonshot); für komplexe Planungsaufgaben dürfen Entwickler weiterhin jedes beliebige Modell wählen.
Den größten Hebel hätten Routing und Caching gebracht: Die Cache-Trefferquote sei von 5 auf 60 Prozent gestiegen, was die KI-Ausgaben trotz steigender Nutzung etwa halbiert habe. Statt Verbrauchswarnungen mache Coinbase die Nutzungsdaten sichtbar und koppele sie an den geschäftlichen Effekt – „wer mehr ausgibt, von dem erwarten wir mehr Wirkung“. Spitzenmodelle für Ausführungs-Aufgaben einzusetzen sei häufig „overkill“.
Die Zahlen sind Selbstauskunft des Unternehmens und nicht unabhängig geprüft. Einzuordnen ist der Schritt aber an unserer eigenen Messung: GLM-5.2 ist laut Artificial Analysis das stärkste offene Modell, nahe an – aber nicht auf – der proprietären Spitze, zu rund einem Sechstel der Kosten der Flaggschiffe. Genau diese Konstellation macht „gut genug für Routine, ein Bruchteil des Preises“ zu einem belastbaren Argument für die Default-Umstellung.