← Alle Depeschen

Modelle

NVIDIA Nemotron 3 Ultra: offenes 550-Mrd.-MoE für lang laufende Agenten

NVIDIA hat Nemotron 3 Ultra veröffentlicht – ein vollständig offenes 550-Mrd.-MoE-Modell (55 Mrd. aktiv) für lang laufende Agenten, mit hybrider Mamba-Transformer-Architektur und 1-Mio.-Token-Kontext. Offengelegt sind nicht nur die Gewichte, sondern auch Trainingsdaten und -Rezepte.

Nemotron 3 Ultra erschien am 4. Juni 2026: ein Mixture-of-Experts mit 550 Mrd. Gesamt- und 55 Mrd. aktiven Parametern (rund 10 % je Token). Die Architektur ist ein hybrides Mamba-Transformer-Design, nativ in NVFP4 trainiert, mit eingebauter Multi-Token-Prediction und einem 1-Mio.-Token-Kontextfenster; trainiert wurde auf rund 20 Billionen Tokens.

Anders als die meisten „offenen“ Modelle veröffentlicht NVIDIA Gewichte, Trainingsdaten und Rezepte zusammen. Laut NVIDIA liefert das Modell den fünffachen Durchsatz vergleichbarer offener Modelle; binnen 48 Stunden integrierten es Dienste wie Perplexity, Nous Research und OpenCode.

Bei Benchmarks nennt NVIDIA u. a. PinchBench (rund 91 %, führend unter Open-Weight-Modellen); Anthropics Opus 4.8 bleibt insgesamt vorn – ein Over-Claim ist das also nicht. Da es sich um Anbieter-Eigenbenchmarks handelt, sind die Zahlen vor einer Übernahme in den Katalog gegen einen unabhängigen Index (Artificial Analysis) zu prüfen.