DepescheModelle4. Juni 2026

NVIDIA Nemotron 3 Ultra: offenes 550-Mrd.-MoE für lang laufende Agenten

NVIDIA hat Nemotron 3 Ultra veröffentlicht – ein vollständig offenes 550-Mrd.-MoE-Modell (55 Mrd. aktiv) für lang laufende Agenten, mit hybrider Mamba-Transformer-Architektur und 1-Mio.-Token-Kontext. Offengelegt sind nicht nur die Gewichte, sondern auch Trainingsdaten und -Rezepte.

Aussagen gegen die Quellen geprüft · 9. Juli 2026

Nemotron 3 Ultra erschien am 4. Juni 2026: ein mit 550 Mrd. Gesamt- und 55 Mrd. aktiven (rund 10 % je Token). Die Architektur ist ein hybrides Mamba-Transformer-Design mit eingebauter und einem 1-Mio.-Token-; die Basis ist ein Vortraining auf rund 10 Billionen Tokens, ergänzt um 212 Mrd. weitere.

Anders als die meisten „offenen“ Modelle veröffentlicht NVIDIA Gewichte, Trainingsdaten und Rezepte zusammen. Für die Bereitstellung setzt NVIDIA auf NVFP4-Quantisierung, die laut NVIDIA architekturübergreifend bis zum fünffachen Durchsatz liefert; verfügbar ist das Modell u. a. über Perplexity, OpenRouter und build.nvidia.com.

Bei Benchmarks nennt NVIDIA u. a. PinchBench (rund 91 %, führend unter ); Anthropics Opus 4.8 bleibt insgesamt vorn – ein Over-Claim ist das also nicht. Da es sich um Anbieter-Eigenbenchmarks handelt, sind die Zahlen vor einer Übernahme in den Katalog gegen einen unabhängigen Index (Artificial Analysis) zu prüfen.