Branche24. Juni 2026neu

OpenAI und Broadcom stellen „Jalapeño“ vor – OpenAIs ersten eigenen Inferenz-Chip

OpenAI hat am 24. Juni 2026 zusammen mit Broadcom „Jalapeño“ vorgestellt, seinen ersten selbst entworfenen KI-Chip. Der ASIC ist ausschließlich für die Inferenz großer Sprachmodelle ausgelegt (nicht fürs Training) und soll laut OpenAI „substanziell bessere“ Performance pro Watt als der aktuelle Stand der Technik liefern. Broadcom liefert Fertigung und Netzwerk-Silizium (Tomahawk), Celestica die Systemintegration; Microsoft soll rund 40 % der ersten Charge abnehmen. Der breite Einsatz im Gigawatt-Maßstab ist für Ende 2026 geplant.

Jalapeño ist laut OpenAI von Grund auf für moderne LLM- entworfen: Der Chip reduziere Datenbewegungen und arbeite mit einer Auslastung nahe dem theoretischen Maximum. Er ist die erste Generation einer als mehrgenerationig angelegten Plattform; das Training großer Modelle bleibt vorerst auf Nvidia-Hardware. OpenAI hebt „low operating cost when running real-time coding models“ hervor – also günstigen Dauerbetrieb für interaktive Coding-Anwendungen.

Zur Performance nennt OpenAI „substantially better performance-per-watt than current state-of-the-art alternatives“. Diese Angabe ist eine Eigenaussage ohne abgeschlossene Messung; ein technischer Bericht soll folgen, und welche „Alternativen“ verglichen wurden, ist offen. Den Designzyklus beziffert OpenAI mit neun Monaten und bezeichnet ihn – nach eigener Einschätzung – als schnellsten ASIC-Entwicklungszyklus für Hochleistungs-Halbleiter.

Arbeitsteilung der Partner: Broadcom übernimmt Silizium-Fertigung und die Netzwerk-Chips (Tomahawk), Celestica baut Boards, Racks und Systeme. Microsoft soll laut Bericht rund 40 % der ersten Charge abnehmen. Die Partnerschaft zwischen OpenAI und Broadcom war bereits im Oktober 2025 angekündigt worden; der großflächige Einsatz im Gigawatt-Maßstab ist für Ende 2026 vorgesehen.

Einordnung: Mit eigenem Chip-Design reiht sich OpenAI in die Vertikalisierung der großen KI-Anbieter ein – Google (TPU) und Amazon (Trainium) verfolgen denselben Ansatz, eigene Beschleuniger auf die jeweils eigenen Modelle zuzuschneiden. OpenAI-Präsident Greg Brockman begründet den Schritt mit „specific workloads that are underserved“. Bis unabhängige Messungen vorliegen, bleibt der Effizienzvorsprung eine Anbieter-Behauptung.